Táto stránka popisuje štandardný príklad hľadania odchýlky, môžete sa pozrieť aj na iné problémy na jej nájdenie

Príklad 1. Určenie skupinového, skupinového priemeru, medziskupinového a celkového rozptylu

Príklad 2. Nájdenie rozptylu a variačného koeficientu v zoskupovacej tabuľke

Príklad 3. Hľadanie rozptylu v diskrétnom rade

Príklad 4. Nasledujúce údaje sú dostupné pre skupinu 20 korešpondenčných študentov. Je potrebné zostrojiť intervalový rad rozdelenia charakteristiky, vypočítať priemernú hodnotu charakteristiky a študovať jej rozptyl

Zostavme intervalové zoskupenie. Určme rozsah intervalu pomocou vzorca:

kde X max je maximálna hodnota charakteristiky zoskupenia;
X min – minimálna hodnota zoskupovacej charakteristiky;
n – počet intervalov:

Akceptujeme n=5. Krok je: h = (192 - 159)/5 = 6,6

Vytvorme intervalové zoskupenie

Pre ďalšie výpočty vytvoríme pomocnú tabuľku:

X"i – stred intervalu. (napríklad stred intervalu 159 – 165,6 = 162,3)

Priemernú výšku študentov určíme pomocou vzorca váženého aritmetického priemeru:

Stanovme rozptyl pomocou vzorca:

Vzorec je možné transformovať takto:

Z tohto vzorca to vyplýva rozptyl sa rovná rozdiel medzi priemerom druhých mocnín možností a druhou mocninou a priemerom.

Rozptyl vo variačných sériách s rovnakými intervalmi pomocou metódy momentov možno vypočítať nasledujúcim spôsobom pomocou druhej vlastnosti disperzie (vydelením všetkých možností hodnotou intervalu). Určenie rozptylu, vypočítané pomocou metódy momentov, pomocou nasledujúceho vzorca je menej prácne:

kde i je hodnota intervalu;
A je konvenčná nula, pre ktorú je vhodné použiť stred intervalu s najvyššou frekvenciou;
m1 je druhá mocnina momentu prvého rádu;
m2 - moment druhého rádu

Alternatívny rozptyl vlastností (ak sa v štatistickej populácii charakteristika zmení tak, že existujú iba dve vzájomne sa vylučujúce možnosti, potom sa takáto variabilita nazýva alternatívna) možno vypočítať pomocou vzorca:

Dosadením q = 1- p do tohto disperzného vzorca dostaneme:

Typy rozptylu

Celkový rozptyl meria variácie charakteristiky v celej populácii ako celku pod vplyvom všetkých faktorov, ktoré spôsobujú túto variáciu. Rovná sa strednej štvorci odchýlok jednotlivých hodnôt charakteristiky x od celkovej strednej hodnoty x a možno ju definovať ako jednoduchý rozptyl alebo vážený rozptyl.

Rozptyl v rámci skupiny charakterizuje náhodnú variáciu, t.j. časť variácie, ktorá je spôsobená vplyvom nezapočítaných faktorov a nezávisí od atribútu faktora, ktorý tvorí základ skupiny. Takáto disperzia sa rovná strednej štvorci odchýlok jednotlivých hodnôt atribútu v rámci skupiny X od aritmetického priemeru skupiny a možno ju vypočítať ako jednoduchú disperziu alebo ako váženú disperziu.



teda merania rozptylu v rámci skupiny variácia vlastnosti v rámci skupiny a je určená vzorcom:

kde xi je priemer skupiny;
ni je počet jednotiek v skupine.

Napríklad vnútroskupinové odchýlky, ktoré je potrebné určiť pri úlohe študovať vplyv kvalifikácie pracovníkov na úroveň produktivity práce v dielni, vykazujú odchýlky vo výstupe v každej skupine spôsobené všetkými možnými faktormi (technický stav zariadení, dostupnosť nástroje a materiály, vek pracovníkov, pracovná náročnosť atď.), okrem rozdielov v kvalifikačnej kategórii (v rámci skupiny majú všetci pracovníci rovnakú kvalifikáciu).

Teória pravdepodobnosti je špeciálny odbor matematiky, ktorý študujú iba študenti vysokých škôl. Máte radi výpočty a vzorce? Nedesia vás vyhliadky na zoznámenie sa s normálnym rozdelením, ansámblovou entropiou, matematickým očakávaním a disperziou diskrétnej náhodnej premennej? Potom bude táto téma pre vás veľmi zaujímavá. Zoznámime sa s niekoľkými najdôležitejšími základnými pojmami tohto vedného odboru.

Pripomeňme si základy

Aj keď si pamätáte najjednoduchšie pojmy teórie pravdepodobnosti, nezanedbávajte prvé odseky článku. Ide o to, že bez jasného pochopenia základov nebudete môcť pracovať s nižšie uvedenými vzorcami.

Takže nastane nejaká náhodná udalosť, nejaký experiment. V dôsledku akcií, ktoré robíme, môžeme získať niekoľko výsledkov – niektoré z nich sa vyskytujú častejšie, iné menej často. Pravdepodobnosť udalosti je pomer počtu skutočne získaných výsledkov jedného typu k celkovému počtu možných. Iba ak poznáte klasickú definíciu tohto pojmu, môžete začať študovať matematické očakávania a rozptyl spojitých náhodných premenných.

Aritmetický priemer

Ešte v škole, na hodinách matematiky, ste začali pracovať s aritmetickým priemerom. Tento koncept je široko používaný v teórii pravdepodobnosti, a preto ho nemožno ignorovať. Pre nás je momentálne hlavné, že sa s ňou stretneme vo vzorcoch pre matematické očakávanie a rozptyl náhodnej veličiny.

Máme postupnosť čísel a chceme nájsť aritmetický priemer. Všetko, čo sa od nás vyžaduje, je zhrnúť všetko, čo je k dispozícii, a rozdeliť ich počtom prvkov v sekvencii. Majme čísla od 1 do 9. Súčet prvkov sa bude rovnať 45 a túto hodnotu vydelíme 9. Odpoveď: - 5.

Disperzia

Z vedeckého hľadiska je disperzia priemerným štvorcom odchýlok získaných hodnôt charakteristiky od aritmetického priemeru. Označuje sa jedným veľkým latinským písmenom D. Čo je potrebné na jeho výpočet? Pre každý prvok postupnosti vypočítame rozdiel medzi existujúcim číslom a aritmetickým priemerom a umocníme ho. Pre udalosť, o ktorej uvažujeme, bude presne toľko hodnôt, koľko môže byť výsledkov. Ďalej zhrnieme všetko prijaté a vydelíme počtom prvkov v sekvencii. Ak máme päť možných výsledkov, vydeľte ich piatimi.

Disperzia má tiež vlastnosti, ktoré je potrebné mať na pamäti, aby sa dali použiť pri riešení problémov. Napríklad, keď sa náhodná premenná zvýši X-krát, rozptyl sa zvýši X-krát na druhú (t.j. X*X). Nikdy nie je menšia ako nula a nezávisí od posunu hodnôt nahor alebo nadol o rovnakú hodnotu. Navyše, pre nezávislé pokusy sa rozptyl súčtu rovná súčtu rozptylov.

Teraz určite musíme zvážiť príklady rozptylu diskrétnej náhodnej premennej a matematického očakávania.

Povedzme, že sme vykonali 21 experimentov a získali sme 7 rôznych výsledkov. Každý z nich sme pozorovali 1, 2, 2, 3, 4, 4 a 5 krát. Čomu sa bude rozptyl rovnať?

Najprv vypočítajme aritmetický priemer: súčet prvkov je, samozrejme, 21. Vydelíme ho číslom 7, dostaneme 3. Teraz odčítajme 3 od každého čísla v pôvodnom poradí, odmocnime každú hodnotu a výsledky sčítame. Výsledok je 12. Teraz všetko, čo musíme urobiť, je vydeliť číslo počtom prvkov a zdá sa, že je to všetko. Má to však háčik! Poďme o tom diskutovať.

Závislosť od počtu pokusov

Ukazuje sa, že pri výpočte rozptylu môže menovateľ obsahovať jedno z dvoch čísel: buď N alebo N-1. Tu N je počet vykonaných experimentov alebo počet prvkov v sekvencii (čo je v podstate to isté). Od čoho to závisí?

Ak sa počet testov meria v stovkách, potom musíme dať N do menovateľa Ak v jednotkách, potom N-1. Vedci sa rozhodli nakresliť hranicu celkom symbolicky: dnes prechádza číslom 30. Ak by sme uskutočnili menej ako 30 experimentov, tak množstvo vydelíme N-1, a ak viac, tak N.

Úloha

Vráťme sa k nášmu príkladu riešenia problému rozptylu a matematického očakávania. Dostali sme medzičíslo 12, ktoré bolo potrebné vydeliť N alebo N-1. Keďže sme uskutočnili 21 experimentov, čo je menej ako 30, zvolíme druhú možnosť. Takže odpoveď je: rozptyl je 12 / 2 = 2.

Očakávanie

Prejdime k druhému konceptu, ktorý musíme zvážiť v tomto článku. Matematické očakávanie je výsledkom sčítania všetkých možných výsledkov vynásobených zodpovedajúcimi pravdepodobnosťami. Je dôležité pochopiť, že získaná hodnota, ako aj výsledok výpočtu rozptylu, sa získa iba raz za celý problém, bez ohľadu na to, koľko výsledkov sa v ňom berie do úvahy.

Vzorec pre matematické očakávanie je pomerne jednoduchý: vezmeme výsledok, vynásobíme jeho pravdepodobnosťou, pridáme to isté pre druhý, tretí výsledok atď. Všetko, čo súvisí s týmto pojmom, nie je ťažké vypočítať. Napríklad súčet očakávaných hodnôt sa rovná očakávanej hodnote súčtu. To isté platí pre prácu. Nie každá veličina v teórii pravdepodobnosti vám umožňuje vykonávať takéto jednoduché operácie. Zoberme si problém a vypočítajme význam dvoch pojmov, ktoré sme študovali naraz. Okrem toho nás rozptyľovala teória – je čas na prax.

Ďalší príklad

Uskutočnili sme 50 pokusov a získali sme 10 typov výsledkov – čísla od 0 do 9 – ktoré sa objavili v rôznych percentách. Sú to v tomto poradí: 2 %, 10 %, 4 %, 14 %, 2 %, 18 %, 6 %, 16 %, 10 %, 18 %. Pripomeňme, že na získanie pravdepodobnosti je potrebné vydeliť percentuálne hodnoty 100. Dostaneme teda 0,02; 0,1 atď. Uveďme príklad riešenia úlohy pre rozptyl náhodnej premennej a matematického očakávania.

Aritmetický priemer vypočítame podľa vzorca, ktorý si pamätáme zo základnej školy: 50/10 = 5.

Teraz preveďme pravdepodobnosti na počet výsledkov „v kusoch“, aby bolo počítanie jednoduchšie. Dostaneme 1, 5, 2, 7, 1, 9, 3, 8, 5 a 9. Od každej získanej hodnoty odpočítame aritmetický priemer, potom odmocníme každý zo získaných výsledkov. Pozrite si, ako to urobiť pomocou prvého prvku ako príkladu: 1 - 5 = (-4). Ďalej: (-4) * (-4) = 16. Pre ostatné hodnoty vykonajte tieto operácie sami. Ak ste urobili všetko správne, po ich sčítaní dostanete 90.

Pokračujme vo výpočte rozptylu a očakávanej hodnoty vydelením 90 N. Prečo volíme N namiesto N-1? Správne, pretože počet vykonaných experimentov presahuje 30. Takže: 90/10 = 9. Dostali sme rozptyl. Ak vám vyjde iné číslo, nezúfajte. S najväčšou pravdepodobnosťou ste urobili jednoduchú chybu vo výpočtoch. Ešte raz skontrolujte, čo ste napísali, a všetko pravdepodobne zapadne na svoje miesto.

Nakoniec si zapamätajte vzorec pre matematické očakávanie. Nebudeme uvádzať všetky výpočty, napíšeme iba odpoveď, ktorú si môžete skontrolovať po vykonaní všetkých požadovaných postupov. Predpokladaná hodnota bude 5,48. Pripomeňme si len, ako vykonávať operácie, pričom ako príklad použijeme prvé prvky: 0*0,02 + 1*0,1... a tak ďalej. Ako vidíte, výslednú hodnotu jednoducho vynásobíme jej pravdepodobnosťou.

Odchýlka

Ďalším pojmom úzko súvisiacim s disperziou a matematickým očakávaním je štandardná odchýlka. Označuje sa buď latinskými písmenami sd, alebo gréckymi malými písmenami „sigma“. Tento koncept ukazuje, ako veľmi sa v priemere hodnoty odchyľujú od centrálnej funkcie. Ak chcete zistiť jeho hodnotu, musíte vypočítať druhú odmocninu rozptylu.

Ak nakreslíte graf normálneho rozdelenia a chcete priamo na ňom vidieť štvorcovú odchýlku, môžete to urobiť v niekoľkých fázach. Vezmite polovicu obrázka naľavo alebo napravo od režimu (stredná hodnota), nakreslite kolmicu na vodorovnú os tak, aby boli plochy výsledných obrázkov rovnaké. Veľkosť segmentu medzi stredom rozloženia a výslednou projekciou na vodorovnú os bude predstavovať štandardnú odchýlku.

softvér

Ako je zrejmé z opisov vzorcov a uvedených príkladov, výpočet rozptylu a matematického očakávania nie je z aritmetického hľadiska najjednoduchší postup. Aby sa nestrácal čas, má zmysel používať program používaný vo vysokých školách - nazýva sa „R“. Má funkcie, ktoré vám umožňujú vypočítať hodnoty pre mnohé pojmy zo štatistiky a teórie pravdepodobnosti.

Napríklad zadáte vektor hodnôt. Toto sa robí nasledovne: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Na záver

Rozptyl a matematické očakávania sú bez ktorých je ťažké v budúcnosti niečo vypočítať. V hlavnom kurze prednášok na vysokých školách sa o nich diskutuje už v prvých mesiacoch štúdia predmetu. Práve pre nepochopenie týchto jednoduchých pojmov a neschopnosť ich vypočítať mnohí študenti okamžite začnú v programe zaostávať a neskôr na konci sedenia dostanú zlé známky, čo ich pripraví o štipendiá.

Cvičte aspoň jeden týždeň, pol hodiny denne, riešte úlohy podobné tým, ktoré sú uvedené v tomto článku. Potom, na akomkoľvek teste z teórie pravdepodobnosti, budete schopní vyrovnať sa s príkladmi bez cudzích tipov a podvodných listov.

V štatistike je často pri analýze javu alebo procesu potrebné brať do úvahy nielen informácie o priemerných úrovniach skúmaných ukazovateľov, ale aj rozptyl alebo variácie hodnôt jednotlivých jednotiek , čo je dôležitá charakteristika skúmanej populácie.

Najviac podliehajú zmenám ceny akcií, ponuka a dopyt a úrokové sadzby v rôznych časových obdobiach a na rôznych miestach.

Hlavné ukazovatele charakterizujúce variáciu , sú rozsah, disperzia, štandardná odchýlka a variačný koeficient.

Rozsah variácií predstavuje rozdiel medzi maximálnymi a minimálnymi hodnotami charakteristiky: R = Xmax – Xmin. Nevýhodou tohto ukazovateľa je, že hodnotí len hranice variácie vlastnosti a neodráža jej variabilitu v rámci týchto hraníc.

Disperzia tento nedostatok chýba. Vypočítava sa ako priemerná štvorec odchýlok hodnôt atribútov od ich priemernej hodnoty:

Zjednodušený spôsob výpočtu rozptylu vykonáva sa pomocou nasledujúcich vzorcov (jednoduchých a vážených):

Príklady použitia týchto vzorcov sú uvedené v úlohách 1 a 2.

V praxi široko používaný ukazovateľ je smerodajná odchýlka :

Smerodajná odchýlka je definovaná ako druhá odmocnina rozptylu a má rovnaký rozmer ako skúmaná charakteristika.

Uvažované ukazovatele nám umožňujú získať absolútnu hodnotu variácie, t.j. vyhodnotiť v jednotkách merania sledovanej charakteristiky. Na rozdiel od nich, variačný koeficient meria variabilitu v relatívnom vyjadrení – vo vzťahu k priemernej úrovni, ktorá je v mnohých prípadoch výhodnejšia.

Vzorec na výpočet variačného koeficientu.

Príklady riešenia problémov na tému „Ukazovatele variácie v štatistike“

Problém 1 . Pri skúmaní vplyvu reklamy na veľkosť priemerného mesačného vkladu v bankách v kraji boli skúmané 2 banky. Boli získané nasledujúce výsledky:

Definuj:
1) pre každú banku: a) priemerný vklad za mesiac; b) rozptyl príspevkov;
2) priemerný mesačný vklad za dve banky spolu;
3) Odchýlka vkladu pre 2 banky v závislosti od inzercie;
4) Odchýlka vkladu pre 2 banky v závislosti od všetkých faktorov okrem reklamy;
5) Celkový rozptyl pomocou pravidla sčítania;
6) Koeficient určenia;
7) Korelačný vzťah.

Riešenie

1) Vytvorme kalkulačnú tabuľku pre banku s reklamou . Na určenie priemerného mesačného vkladu nájdeme stredy intervalov. V tomto prípade sa hodnota otvoreného intervalu (prvý) podmienečne rovná hodnote susediaceho intervalu (druhého).

Priemernú veľkosť vkladu zistíme pomocou vzorca váženého aritmetického priemeru:

29 000/50 = 580 rub.

Rozptyl príspevku zistíme pomocou vzorca:

23 400/50 = 468

Vykonáme podobné akcie pre banku bez reklamy :

2) Poďme spolu nájsť priemernú veľkosť vkladu pre dve banky. Хср = (580 × 50 + 542,8 × 50)/100 = 561,4 rub.

3) Rozptyl vkladu pre dve banky v závislosti od inzercie zistíme pomocou vzorca: σ 2 =pq (vzorec pre rozptyl alternatívneho atribútu). Tu p=0,5 je podiel faktorov závislých od reklamy; q=1-0,5, potom a2=0,5*0,5=0,25.

4) Keďže podiel ostatných faktorov je 0,5, tak rozptyl vkladu pre dve banky v závislosti od všetkých faktorov okrem reklamy je tiež 0,25.

5) Určte celkový rozptyl pomocou pravidla sčítania.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 skutočnosť + σ 2 zvyšok = 552,08 + 345,96 = 898,04

6) Koeficient determinácie η 2 = σ 2 skutočnosť / σ 2 = 345,96/898,04 = 0,39 = 39 % - veľkosť príspevku závisí od reklamy z 39 %.

7) Empirický korelačný pomer η = √η 2 = √0,39 = 0,62 – vzťah je pomerne tesný.

Problém 2 . Existuje zoskupenie podnikov podľa veľkosti obchodovateľných produktov:

Určite: 1) rozptyl hodnoty obchodovateľných produktov; 2) štandardná odchýlka; 3) variačný koeficient.

Riešenie

1) Podľa podmienok je prezentovaný intervalový distribučný rad. Musí byť vyjadrený diskrétne, to znamená nájsť stred intervalu (x"). V skupinách uzavretých intervalov nájdeme stred pomocou jednoduchého aritmetického priemeru. V skupinách s hornou hranicou - ako rozdiel medzi touto hornou hranicou a polovičná veľkosť nasledujúceho intervalu (200-(400 -200):2=100).

V skupinách s dolnou hranicou - súčet tejto dolnej hranice a polovičnej veľkosti predchádzajúceho intervalu (800+(800-600):2=900).

Priemernú hodnotu obchodovateľných produktov vypočítame pomocou vzorca:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Tu a=500 je veľkosť opcie pri najvyššej frekvencii, k=600-400=200 je veľkosť intervalu pri najvyššej frekvencii Výsledok dajme do tabuľky:

Priemerná hodnota komerčnej produkcie za sledované obdobie sa teda vo všeobecnosti rovná Хср = (-5:37)×200+500=472,97 tisíc rubľov.

2) Zistíme rozptyl pomocou nasledujúceho vzorca:

σ2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) štandardná odchýlka: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 tisíc rubľov.

4) variačný koeficient: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52 %

.

Naopak, ak je nezáporné a.e. fungovať tak, že , potom existuje absolútne spojitá miera pravdepodobnosti na takej, že je to jej hustota.

    Nahradenie miery v Lebesgueovom integráli:

,

kde je akákoľvek Borelova funkcia, ktorá je integrovateľná vzhľadom na mieru pravdepodobnosti.

Disperzia, druhy a vlastnosti disperzie Pojem disperzia

Rozptyl v štatistike sa zistí ako štandardná odchýlka jednotlivých hodnôt charakteristiky na druhú od aritmetického priemeru. V závislosti od počiatočných údajov sa určuje pomocou jednoduchých a vážených vzorcov rozptylu:

1. Jednoduchá variácia(pre nezoskupené údaje) sa vypočíta pomocou vzorca:

2. Vážená odchýlka (pre série variácií):

kde n je frekvencia (opakovateľnosť faktora X)

Príklad hľadania rozptylu

Táto stránka popisuje štandardný príklad hľadania odchýlky, môžete sa pozrieť aj na iné problémy na jej nájdenie

Príklad 1. Určenie skupinového, skupinového priemeru, medziskupinového a celkového rozptylu

Príklad 2. Nájdenie rozptylu a variačného koeficientu v zoskupovacej tabuľke

Príklad 3. Hľadanie rozptylu v diskrétnom rade

Príklad 4. Nasledujúce údaje sú dostupné pre skupinu 20 korešpondenčných študentov. Je potrebné zostrojiť intervalový rad rozdelenia charakteristiky, vypočítať priemernú hodnotu charakteristiky a študovať jej rozptyl

Zostavme intervalové zoskupenie. Určme rozsah intervalu pomocou vzorca:

kde X max je maximálna hodnota charakteristiky zoskupenia; X min – minimálna hodnota zoskupovacej charakteristiky; n – počet intervalov:

Akceptujeme n=5. Krok je: h = (192 - 159)/5 = 6,6

Vytvorme intervalové zoskupenie

Pre ďalšie výpočty vytvoríme pomocnú tabuľku:

X"i – stred intervalu. (napríklad stred intervalu 159 – 165,6 = 162,3)

Priemernú výšku študentov určíme pomocou vzorca váženého aritmetického priemeru:

Stanovme rozptyl pomocou vzorca:

Vzorec je možné transformovať takto:

Z tohto vzorca to vyplýva rozptyl sa rovná rozdiel medzi priemerom druhých mocnín možností a druhou mocninou a priemerom.

Rozptyl vo variačných sériách s rovnakými intervalmi pomocou metódy momentov možno vypočítať nasledujúcim spôsobom pomocou druhej vlastnosti disperzie (vydelením všetkých možností hodnotou intervalu). Určenie rozptylu, vypočítané pomocou metódy momentov, pomocou nasledujúceho vzorca je menej prácne:

kde i je hodnota intervalu; A je konvenčná nula, pre ktorú je vhodné použiť stred intervalu s najvyššou frekvenciou; m1 je druhá mocnina momentu prvého rádu; m2 - moment druhého rádu

Alternatívny rozptyl vlastností (ak sa v štatistickej populácii charakteristika zmení tak, že existujú iba dve vzájomne sa vylučujúce možnosti, potom sa takáto variabilita nazýva alternatívna) možno vypočítať pomocou vzorca:

Dosadením q = 1- p do tohto disperzného vzorca dostaneme:

Typy rozptylu

Celkový rozptyl meria variácie charakteristiky v celej populácii ako celku pod vplyvom všetkých faktorov, ktoré spôsobujú túto variáciu. Rovná sa strednej štvorci odchýlok jednotlivých hodnôt charakteristiky x od celkovej strednej hodnoty x a možno ju definovať ako jednoduchý rozptyl alebo vážený rozptyl.

Rozptyl v rámci skupiny charakterizuje náhodnú variáciu, t.j. časť variácie, ktorá je spôsobená vplyvom nezapočítaných faktorov a nezávisí od atribútu faktora, ktorý tvorí základ skupiny. Takáto disperzia sa rovná strednej štvorci odchýlok jednotlivých hodnôt atribútu v rámci skupiny X od aritmetického priemeru skupiny a možno ju vypočítať ako jednoduchú disperziu alebo ako váženú disperziu.

teda merania rozptylu v rámci skupiny variácia vlastnosti v rámci skupiny a je určená vzorcom:

kde xi je priemer skupiny; ni je počet jednotiek v skupine.

Napríklad vnútroskupinové odchýlky, ktoré je potrebné určiť pri úlohe študovať vplyv kvalifikácie pracovníkov na úroveň produktivity práce v dielni, vykazujú odchýlky vo výstupe v každej skupine spôsobené všetkými možnými faktormi (technický stav zariadení, dostupnosť nástroje a materiály, vek pracovníkov, pracovná náročnosť atď.), okrem rozdielov v kvalifikačnej kategórii (v rámci skupiny majú všetci pracovníci rovnakú kvalifikáciu).

Priemer odchýlok v rámci skupiny odzrkadľuje náhodnú variáciu, to znamená tú časť variácie, ktorá sa vyskytla pod vplyvom všetkých ostatných faktorov, s výnimkou faktora zoskupovania. Vypočíta sa pomocou vzorca:

Medziskupinový rozptyl charakterizuje systematickú variáciu výslednej charakteristiky, ktorá je spôsobená vplyvom faktora-atribútu, ktorý tvorí základ skupiny. Rovná sa strednej štvorci odchýlok skupinových priemerov od celkového priemeru. Medziskupinový rozptyl sa vypočíta podľa vzorca:

Rozptyl je miera rozptylu, ktorá popisuje komparatívnu odchýlku medzi hodnotami údajov a priemerom. Je to najpoužívanejšia miera rozptylu v štatistike, vypočítaná súčtom a druhou mocninou odchýlky každej hodnoty údajov od priemeru. Vzorec na výpočet rozptylu je uvedený nižšie:

s 2 – výberový rozptyl;

x av—priemer vzorky;

n veľkosť vzorky (počet hodnôt údajov),

(x i – x avg) je odchýlka od priemernej hodnoty pre každú hodnotu súboru údajov.

Aby sme lepšie pochopili vzorec, pozrime sa na príklad. Nemám rád varenie, takže to robím len zriedka. Aby som však nehladoval, musím z času na čas zájsť k sporáku, aby som zrealizoval plán nasýtenia tela bielkovinami, tukmi a sacharidmi. Nižšie uvedený súbor údajov ukazuje, koľkokrát Renat varí každý mesiac:

Prvým krokom pri výpočte rozptylu je určiť výberový priemer, ktorý je v našom príklade 7,8-krát za mesiac. Ostatné výpočty je možné zjednodušiť pomocou nasledujúcej tabuľky.

Záverečná fáza výpočtu rozptylu vyzerá takto:

Pre tých, ktorí radi robia všetky výpočty naraz, by rovnica vyzerala takto:

Použitie metódy surového počtu (príklad varenia)

Existuje efektívnejší spôsob výpočtu rozptylu, známy ako metóda hrubého počítania. Aj keď sa rovnica môže zdať na prvý pohľad dosť ťažkopádna, v skutočnosti nie je taká desivá. Môžete sa o tom uistiť a potom sa rozhodnúť, ktorá metóda sa vám najviac páči.

je súčet každej hodnoty údajov po kvadratúre,

je druhá mocnina súčtu všetkých hodnôt údajov.

Nestrácaj hlavu hneď teraz. Dajme si to všetko do tabuľky a uvidíte, že je tu menej výpočtov ako v predchádzajúcom príklade.

Ako vidíte, výsledok bol rovnaký ako pri použití predchádzajúcej metódy. Výhody tejto metódy sa prejavia so zväčšovaním veľkosti vzorky (n).

Výpočet odchýlky v Exceli

Ako ste už pravdepodobne uhádli, Excel má vzorec, ktorý vám umožňuje vypočítať rozptyl. Okrem toho, počnúc Excelom 2010, môžete nájsť 4 typy vzorcov rozptylu:

1) VARIANCE.V – Vráti rozptyl vzorky. Booleovské hodnoty a text sú ignorované.

2) DISP.G - Vráti rozptyl populácie. Booleovské hodnoty a text sú ignorované.

3) VARIANCE – Vracia rozptyl vzorky, berúc do úvahy boolovské a textové hodnoty.

4) VARIANCE – Vracia rozptyl populácie, berúc do úvahy logické a textové hodnoty.

Najprv pochopme rozdiel medzi vzorkou a populáciou. Účelom popisných štatistík je zhrnúť alebo zobraziť údaje, aby ste rýchlo získali celkový obraz, takpovediac prehľad. Štatistická inferencia vám umožňuje robiť závery o populácii na základe vzorky údajov z tejto populácie. Populácia predstavuje všetky možné výsledky alebo merania, ktoré nás zaujímajú. Vzorka je podmnožinou populácie.

Napríklad nás zaujíma skupina študentov jednej z ruských univerzít a potrebujeme určiť priemerné skóre skupiny. Vieme vypočítať priemerný výkon žiakov a výsledný údaj bude potom parametrom, keďže do našich výpočtov bude zapojená celá populácia. Ak však chceme vypočítať GPA všetkých študentov u nás, tak táto skupina bude našou vzorkou.

Rozdiel vo vzorci na výpočet rozptylu medzi vzorkou a populáciou je menovateľ. Kde pre vzorku sa bude rovnať (n-1) a pre všeobecnú populáciu iba n.

Teraz sa pozrime na funkcie na výpočet rozptylu s koncovkami A, ktorého popis uvádza, že pri výpočte sa berú do úvahy textové a logické hodnoty. V tomto prípade pri výpočte rozptylu konkrétnej množiny údajov, kde sa vyskytujú nečíselné hodnoty, bude Excel interpretovať text a falošné boolovské hodnoty ako rovné 0 a skutočné boolovské hodnoty ako rovné 1.

Ak teda máte dátové pole, výpočet jeho rozptylu nebude zložitý pomocou jednej z vyššie uvedených funkcií Excelu.



Tento článok je dostupný aj v nasledujúcich jazykoch: thajčina

  • Ďalej

    ĎAKUJEME za veľmi užitočné informácie v článku. Všetko je prezentované veľmi jasne. Zdá sa, že na analýze fungovania obchodu eBay sa urobilo veľa práce

    • Ďakujem vám a ostatným pravidelným čitateľom môjho blogu. Bez vás by som nebol dostatočne motivovaný venovať veľa času údržbe tejto stránky. Môj mozog je štruktúrovaný takto: rád sa hrabem do hĺbky, systematizujem roztrúsené dáta, skúšam veci, ktoré ešte nikto nerobil alebo sa na ne nepozeral z tohto uhla. Je škoda, že naši krajania nemajú čas na nákupy na eBay kvôli kríze v Rusku. Nakupujú na Aliexpress z Číny, keďže tam je tovar oveľa lacnejší (často na úkor kvality). Ale online aukcie eBay, Amazon, ETSY jednoducho poskytnú Číňanom náskok v sortimente značkových predmetov, historických predmetov, ručne vyrábaných predmetov a rôzneho etnického tovaru.

      • Ďalej

        Na vašich článkoch je cenný váš osobný postoj a rozbor témy. Nevzdávaj tento blog, chodím sem často. Takých by nás malo byť veľa. Napíšte mi Nedávno som dostal email s ponukou naučiť ma obchodovať na Amazone a eBayi.

  • Je tiež pekné, že pokusy eBay rusifikovať rozhranie pre používateľov z Ruska a krajín SNŠ začali prinášať ovocie. Veď drvivá väčšina občanov krajín bývalého ZSSR nemá silné znalosti cudzích jazykov. Nie viac ako 5% populácie hovorí anglicky. Medzi mladými je ich viac. Preto je aspoň rozhranie v ruštine - to je veľká pomoc pre online nakupovanie na tejto obchodnej platforme. eBay sa nevydal cestou svojho čínskeho náprotivku Aliexpress, kde sa vykonáva strojový (veľmi nemotorný a nezrozumiteľný, miestami vyvolávajúci smiech) preklad popisov produktov. Dúfam, že v pokročilejšom štádiu vývoja umelej inteligencie sa kvalitný strojový preklad z akéhokoľvek jazyka do akéhokoľvek v priebehu niekoľkých sekúnd stane realitou. Zatiaľ máme toto (profil jedného z predajcov na eBay s ruským rozhraním, ale anglickým popisom):
    https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png