Vendar ta lastnost sama po sebi ni dovolj za preučevanje naključne spremenljivke. Predstavljajmo si dva strelca, ki streljata v tarčo. Eden strelja natančno in zadene blizu centra, drugi pa ... se samo zabava in niti ne cilja. A smešno je, da on povprečje rezultat bo popolnoma enak kot pri prvem strelcu! To stanje običajno ponazarjajo naslednje naključne spremenljivke:

»Ostrostrelsko« matematično pričakovanje je enako , vendar je za »zanimivo osebo«: – tudi nič!

Zato je treba kvantificirati, kako daleč razpršena nabojev (vrednosti naključne spremenljivke) glede na sredino tarče (matematično pričakovanje). No razpršenost prevedeno iz latinščine ni drugače kot disperzija .

Poglejmo, kako je ta numerična značilnost določena z enim od primerov iz 1. dela lekcije:

Tam smo ugotovili razočarajoče matematično pričakovanje te igre, zdaj pa moramo izračunati njeno varianco, ki označen z skozi.

Ugotovimo, kako daleč so zmage/izgube »razpršene« glede na povprečno vrednost. Očitno moramo za to izračunati razlike med vrednosti naključnih spremenljivk in njo matematično pričakovanje:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Zdaj se zdi, da morate sešteti rezultate, vendar ta način ni primeren - iz razloga, ker se bodo nihanja v levo izničila z nihanji v desno. Torej, na primer, "amaterski" strelec (zgornji primer) razlike bodo , prišteti pa bodo dali ničlo, tako da ne bomo dobili ocene razpršenosti njegovega streljanja.

Da bi se izognili tej težavi, lahko razmislite moduli razlike, vendar se je zaradi tehničnih razlogov pristop uveljavil, ko so na kvadrat. Primerneje je oblikovati rešitev v tabeli:

In tukaj je treba izračunati tehtano povprečje vrednost kvadratov odstopanj. In KAJ je to? To je njihovo matematično pričakovanje, ki je mera razpršenosti:

definicija odstopanja. Iz definicije je takoj jasno, da varianca ne more biti negativna– upoštevajte za vajo!

Spomnimo se, kako najti pričakovano vrednost. Kvadrat razlike pomnožite z ustreznimi verjetnostmi (nadaljevanje tabele):
– figurativno rečeno, to je »vlečna sila«,
in povzemite rezultate:

Se vam ne zdi, da se je rezultat v primerjavi z dobitkom izkazal za prevelikega? Tako je – kvadrirali smo ga in da se vrnemo k razsežnosti naše igre, moramo izvleči kvadratni koren. Ta količina se imenuje standardni odklon in je označena z grško črko "sigma":

Ta vrednost se včasih imenuje standardni odklon .

Kaj je njen pomen? Če od matematičnega pričakovanja odstopamo v levo in desno za standardni odklon:

- potem bodo najverjetnejše vrednosti naključne spremenljivke "koncentrirane" na tem intervalu. Kaj dejansko opazimo:

Vendar se zgodi, da pri analizi sipanja skoraj vedno operiramo s konceptom disperzije. Ugotovimo, kaj to pomeni v zvezi z igrami. Če v primeru puščic govorimo o "natančnosti" zadetkov glede na sredino tarče, potem tukaj disperzija označuje dve stvari:

Prvič, očitno je, da se z večanjem stav povečuje tudi razpršenost. Torej, če na primer povečamo za 10-krat, se bo matematično pričakovanje povečalo za 10-krat, varianca pa za 100-krat. (ker je to kvadratna količina). Vendar upoštevajte, da se sama pravila igre niso spremenila! Spremenile so se samo stopnje, grobo rečeno, prej smo stavili 10 rubljev, zdaj 100.

Druga, bolj zanimiva točka je, da varianca označuje stil igre. Mentalno popravite stave v igri na neki določeni ravni, in poglejmo, kaj je kaj:

Igra z nizko varianco je previdna igra. Igralec ponavadi izbere najbolj zanesljive sheme, kjer ne izgubi/dobi preveč naenkrat. Na primer, sistem rdeče/črno v ruleti (glej primer 4 članka Naključne spremenljivke) .

Igra z visoko varianco. Pogosto jo kličejo disperzivno igra. To je pustolovski ali agresivni stil igre, kjer igralec izbira "adrenalinske" sheme. Spomnimo se vsaj "Martingale", v kateri so zneski na kocki za rede velikosti večji od »tihe« igre iz prejšnje točke.

Razmere v pokru so indikativne: obstajajo ti tesen igralci, ki so ponavadi previdni in "tresoči" glede svojih skladov za igre na srečo (bankroll). Ni presenetljivo, da njihov bankroll ne niha bistveno (nizka varianca). Nasprotno, če ima igralec visoko varianco, potem je agresor. Pogosto tvega, sklepa velike stave in lahko bodisi zlomi ogromno banko bodisi izgubi v drobce.

Enako se zgodi na Forexu in tako naprej – primerov je veliko.

Poleg tega v vseh primerih ni pomembno, ali se igra za penije ali na tisoče dolarjev. Vsaka raven ima igralce z nizko in visoko razpršenostjo. No, kot se spomnimo, je povprečni dobitek "odgovoren" matematično pričakovanje.

Verjetno ste opazili, da je iskanje variance dolg in mukotrpen proces. Toda matematika je radodarna:

Formula za iskanje variance

Ta formula izhaja neposredno iz definicije variance in jo takoj damo v uporabo. Zgoraj bom kopiral znak z našo igro:

in ugotovljeno matematično pričakovanje.

Izračunajmo varianco na drugi način. Najprej poiščimo matematično pričakovanje – kvadrat naključne spremenljivke. Avtor: določitev matematičnega pričakovanja:

V tem primeru:

Tako po formuli:

Kot pravijo, občutite razliko. In v praksi je seveda bolje uporabiti formulo (če pogoj ne zahteva drugače).

Obvladamo tehniko reševanja in projektiranja:

Primer 6

Poiščite njegovo matematično pričakovanje, varianco in standardni odklon.

To nalogo najdemo povsod in je praviloma brez smiselnega pomena.
Lahko si predstavljate več žarnic s številkami, ki z določeno verjetnostjo zasvetijo v norišnici :)

rešitev: priročno je povzeti osnovne izračune v tabeli. Najprej v zgornji dve vrstici zapišemo začetne podatke. Nato izračunamo zmnožke, nato in na koncu vsote v desnem stolpcu:

Pravzaprav je skoraj vse pripravljeno. Tretja vrstica prikazuje že pripravljeno matematično pričakovanje: .

Varianco izračunamo po formuli:

In končno, standardni odklon:
– Osebno običajno zaokrožim na 2 decimalki.

Vse izračune lahko izvedete na kalkulatorju ali še bolje v Excelu:

Tukaj se težko zmotiš :)

Odgovori:

Kdor želi, si lahko še bolj poenostavi življenje in izkoristi mojo kalkulator (demo), ki ne bo le takoj rešil te težave, ampak tudi zgradil tematske grafike (kmalu pridemo tja). Program je lahko prenesite iz knjižnice– če ste prenesli vsaj eno izobraževalno gradivo ali prejeli drug način. Hvala za podporo projektu!

Nekaj ​​nalog, ki jih rešite sami:

Primer 7

Izračunajte varianco naključne spremenljivke v prejšnjem primeru po definiciji.

In podoben primer:

Primer 8

Diskretno naključno spremenljivko določa njen porazdelitveni zakon:

Da, vrednosti naključnih spremenljivk so lahko precej velike (primer iz resničnega dela), tukaj pa po možnosti uporabite Excel. Kot mimogrede v primeru 7 - je hitrejši, zanesljivejši in prijetnejši.

Rešitve in odgovori na dnu strani.

Za zaključek 2. dela lekcije si bomo ogledali še en tipičen problem, lahko bi rekli celo majhno uganko:

Primer 9

Diskretna naključna spremenljivka ima lahko samo dve vrednosti: in , in . Verjetnost, matematično pričakovanje in varianca so znani.

rešitev: Začnimo z neznano verjetnostjo. Ker lahko naključna spremenljivka zavzame samo dve vrednosti, je vsota verjetnosti ustreznih dogodkov:

in od takrat, potem.

Ostalo je le najti..., je lahko reči :) Ampak oh, pa gremo. Po definiciji matematičnega pričakovanja:
– nadomestiti znane količine:

– in iz te enačbe ni mogoče iztisniti ničesar več, razen da jo lahko prepišete v običajno smer:

ali:

Mislim, da lahko uganete naslednje korake. Sestavimo in rešimo sistem:

Decimalke so seveda popolna sramota; pomnožite obe enačbi z 10:

in delimo z 2:

Tako je bolje. Iz 1. enačbe izrazimo:
(to je lažji način)– nadomestimo v 2. enačbo:


Gradimo na kvadrat in naredi poenostavitve:

Pomnoži z:

Rezultat je bil kvadratna enačba, najdemo njegovo diskriminanco:
- Odlično!

in dobimo dve rešitvi:

1) če , To ;

2) če , to .

Prvi par vrednosti izpolnjuje pogoj. Z veliko verjetnostjo je vse pravilno, vendar kljub temu zapišimo distribucijski zakon:

in opravite preverjanje, in sicer poiščite pričakovanje:

Če je populacija razdeljena v skupine glede na preučevano značilnost, potem lahko za to populacijo izračunamo naslednje vrste variance: skupno, skupinsko (znotraj skupine), povprečje skupine (povprečje znotraj skupine), medskupinsko.

Na začetku izračuna koeficient determinacije, ki pokaže, kolikšen del celotne variacije preučevane lastnosti predstavlja medskupinska variacija, tj. zaradi značilnosti združevanja:

Empirično korelacijsko razmerje označuje tesnost povezave med združevanjem (faktorialom) in značilnostmi delovanja.

Empirično korelacijsko razmerje lahko zavzame vrednosti od 0 do 1.

Za oceno tesnosti povezave na podlagi empiričnega korelacijskega razmerja lahko uporabite Chaddockove relacije:

Primer 4. O izvajanju del projektantskih in geodetskih organizacij različnih oblik lastništva so na voljo naslednji podatki:

Določite:

1) skupna varianca;

2) skupinske variance;

3) povprečje skupinskih varianc;

4) medskupinska varianca;

5) skupno varianco na podlagi pravila za seštevanje varianc;


6) koeficient determinacije in empirično korelacijsko razmerje.

Potegnite zaključke.

rešitev:

1. Določimo povprečni obseg dela, ki ga opravijo podjetja dveh oblik lastništva:

Izračunajmo skupno varianco:

2. Določite povprečja skupine:

milijonov rubljev;

milijonov rubljev

Skupinska odstopanja:

;

3. Izračunajte povprečje skupinskih varianc:

4. Določimo medskupinsko varianco:

5. Izračunajte skupno varianco na podlagi pravila za seštevanje varianc:

6. Določimo koeficient determinacije:

.

Tako je obseg dela, ki ga izvajajo projektantske in geodetske organizacije, za 22% odvisen od oblike lastništva podjetij.

Empirično korelacijsko razmerje se izračuna po formuli

.

Vrednost izračunanega kazalnika kaže, da je odvisnost obsega dela od oblike lastnine podjetja majhna.

Primer 5. S pregledom tehnološke discipline proizvodnih površin so bili pridobljeni naslednji podatki:

Določite koeficient determinacije

Izračunajmo vMSEXCELvzorčna varianca in standardni odklon. Izračunali bomo tudi varianco naključne spremenljivke, če je znana njena porazdelitev.

Najprej razmislimo disperzija, potem standardni odklon.

Varianca vzorca

Varianca vzorca (vzorčna varianca,vzorecvarianca) označuje širjenje vrednosti v matriki glede na .

Vse 3 formule so matematično enakovredne.

Iz prve formule je jasno, da vzorčna varianca je vsota kvadratov odstopanj vsake vrednosti v matriki od povprečja, deljeno z velikostjo vzorca minus 1.

odstopanja vzorcev uporabljena je funkcija DISP(), angl. ime VAR, tj. VARIANCA. Od različice MS EXCEL 2010 je priporočljiva uporaba njegovega analoga DISP.V(), angl. ime VURS, tj. Vzorec VARiance. Poleg tega je od različice MS EXCEL 2010 na voljo funkcija DISP.Г(), angleščina. ime VARP, tj. Population VARiance, ki izračuna disperzija Za prebivalstvo. Celotna razlika se zmanjša na imenovalec: namesto n-1, kot je DISP.V(), ima DISP.G() samo n v imenovalcu. Pred MS EXCEL 2010 se je za izračun variance populacije uporabljala funkcija VAR().

Varianca vzorca
=QUADROTCL(vzorec)/(ŠTEVILO(vzorec)-1)
=(SUM(vzorec)-COUNT(vzorec)*POVPREČJE(vzorec)^2)/ (COUNT(vzorec)-1)– običajna formula
=SUM((Vzorec -AVERAGE(Vzorec))^2)/ (ŠTEVILO(Vzorec)-1) –

Varianca vzorca je enako 0, le če so vse vrednosti enake med seboj in posledično enake povprečna vrednost. Običajno je večja vrednost odstopanja, večja je razpršenost vrednosti v matriki.

Varianca vzorca je točkovna ocena odstopanja porazdelitev naključne spremenljivke, iz katere je bila narejena vzorec. O gradnji intervali zaupanja pri ocenjevanju odstopanja lahko preberete v članku.

Varianca naključne spremenljivke

Za izračun disperzija naključna spremenljivka, jo morate poznati.

Za odstopanja naključna spremenljivka X je pogosto označena kot Var(X). Razpršenost enako kvadratu odstopanja od povprečja E(X): Var(X)=E[(X-E(X)) 2 ]

disperzija izračunano po formuli:

kjer je x i vrednost, ki jo lahko zavzame naključna spremenljivka, μ pa povprečna vrednost (), p(x) je verjetnost, da bo naključna spremenljivka zavzela vrednost x.

Če ima naključna spremenljivka , potem disperzija izračunano po formuli:

Dimenzija odstopanja ustreza kvadratu merske enote prvotnih vrednosti. Na primer, če vrednosti v vzorcu predstavljajo meritve delne teže (v kg), bi bila dimenzija variance kg 2 . To je lahko težko razlagati, zato je za opredelitev širjenja vrednosti vrednost enaka kvadratnemu korenu odstopanjastandardni odklon.

Nekatere lastnosti odstopanja:

Var(X+a)=Var(X), kjer je X naključna spremenljivka in a konstanta.

Var(aH)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ta lastnost disperzije se uporablja v članek o linearni regresiji.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), kjer sta X in Y naključni spremenljivki, Cov(X;Y) je kovarianca teh naključnih spremenljivk.

Če so naključne spremenljivke neodvisne, potem so kovarianca je enako 0 in zato Var(X+Y)=Var(X)+Var(Y). Ta lastnost disperzije se uporablja pri izpeljavi.

Pokažimo, da je za neodvisne količine Var(X-Y)=Var(X+Y). Dejansko Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Ta lastnost disperzije se uporablja za konstrukcijo.

Standardni odklon vzorca

Standardni odklon vzorca je merilo, kako široko so razpršene vrednosti v vzorcu glede na njihove .

po definiciji standardni odklon enako kvadratnemu korenu iz odstopanja:

Standardni odklon ne upošteva velikosti vrednosti v vzorec, temveč le stopnjo razpršenosti vrednot okoli njih povprečje. Za ponazoritev tega navedimo primer.

Izračunajmo standardno deviacijo za 2 vzorca: (1; 5; 9) in (1001; 1005; 1009). V obeh primerih je s=4. Očitno je, da se razmerje med standardnim odklonom in vrednostmi niza med vzorci bistveno razlikuje. Za take primere se uporablja Koeficient variacije(Koeficient variacije, CV) - razmerje Standardni odklon do povprečja aritmetika, izraženo v odstotkih.

V MS EXCEL 2007 in starejših različicah za izračun Standardni odklon vzorca uporabljena je funkcija =STDEVAL(), angleščina. ime STDEV, tj. Standardno odstopanje. Od različice MS EXCEL 2010 je priporočljivo uporabiti njegov analog =STANDDEV.B() , angleško. ime STDEV.S, tj. Vzorec standardnega odstopanja.

Poleg tega je od različice MS EXCEL 2010 na voljo funkcija STANDARDEV.G(), angleščina. ime STDEV.P, tj. Standardni odklon populacije, ki izračuna standardni odklon Za prebivalstvo. Celotna razlika se zmanjša na imenovalec: namesto n-1 kot v STANDARDEV.V(), ima STANDARDEVAL.G() samo n v imenovalcu.

Standardni odklon lahko izračunate tudi neposredno z uporabo spodnjih formul (glejte primer datoteke)
=ROOT(QUADROTCL(vzorec)/(ŠTEVILO(vzorec)-1))
=ROOT((SUM(vzorec)-COUNT(vzorec)*AVERAGE(vzorec)^2)/(COUNT(vzorec)-1))

Druge mere razpršenosti

Funkcija SQUADROTCL() izračuna z vsota kvadratov odstopanj vrednosti od njihovih povprečje. Ta funkcija bo vrnila enak rezultat kot formula =DISP.G( Vzorec)*PREVERI( Vzorec), kje Vzorec- sklic na obseg, ki vsebuje niz vzorčnih vrednosti (). Izračuni v funkciji QUADROCL() so narejeni po formuli:

Funkcija SROTCL() je tudi merilo širjenja nabora podatkov. Funkcija SROTCL() izračuna povprečje absolutnih vrednosti odstopanj vrednosti od povprečje. Ta funkcija bo vrnila enak rezultat kot formula =SUMPRODUCT(ABS(Vzorec-POVPREČJE(Vzorec)))/ŠTEVILO(Vzorec), Kje Vzorec- povezava do obsega, ki vsebuje niz vzorčnih vrednosti.

Izračuni v funkciji SROTCL () so narejeni po formuli:

.

Nasprotno, če je nenegativen a.e. deluje tako, da , potem obstaja absolutno zvezna verjetnostna mera na takšni, da je to njegova gostota.

    Zamenjava mere v Lebesgueovem integralu:

,

kjer je katera koli Borelova funkcija, ki je integrabilna glede na verjetnostno mero.

Disperzija, vrste in lastnosti disperzije Pojem disperzije

Disperzija v statistiki se ugotovi kot standardni odklon posameznih vrednosti značilnosti na kvadrat od aritmetične sredine. Glede na začetne podatke se določi z uporabo enostavnih in tehtanih formul variance:

1. Preprosta varianta(za nezdružene podatke) se izračuna po formuli:

2. Utežena varianca (za serije variacij):

kjer je n frekvenca (ponovljivost faktorja X)

Primer iskanja variance

Ta stran opisuje standardni primer iskanja variance, ogledate pa si lahko tudi druge težave za iskanje

Primer 1. Določitev skupinskega, skupinskega povprečja, medskupinske in skupne variance

Primer 2. Iskanje variance in koeficienta variacije v grupirni tabeli

Primer 3. Iskanje variance v diskretni seriji

Primer 4. Za skupino 20 dopisnih študentov so na voljo naslednji podatki. Treba je zgraditi intervalno serijo porazdelitve značilnosti, izračunati povprečno vrednost značilnosti in preučiti njeno disperzijo.

Zgradimo intervalno skupino. Določimo obseg intervala z uporabo formule:

kjer je X max največja vrednost značilnosti združevanja; X min – najmanjša vrednost značilnosti združevanja; n – število intervalov:

Sprejemamo n=5. Korak je: h = (192 - 159)/ 5 = 6,6

Ustvarimo intervalno skupino

Za nadaljnje izračune bomo zgradili pomožno tabelo:

X"i – sredina intervala. (npr. sredina intervala 159 – 165,6 = 162,3)

Povprečno višino študentov določimo s formulo uteženega aritmetičnega povprečja:

Določimo varianco s formulo:

Formulo lahko preoblikujemo takole:

Iz te formule sledi, da varianca je enaka razlika med povprečjem kvadratov možnosti ter kvadratom in povprečjem.

Disperzija v variacijskih serijah z enakimi intervali z uporabo metode momentov lahko izračunamo na naslednji način z uporabo druge lastnosti disperzije (deljenje vseh možnosti z vrednostjo intervala). Določanje variance, izračunana z metodo trenutkov, z uporabo naslednje formule je manj naporna:

kjer je i vrednost intervala; A je običajna ničla, za katero je primerno uporabiti sredino intervala z najvišjo frekvenco; m1 je kvadrat momenta prvega reda; m2 - trenutek drugega reda

Varianca alternativne lastnosti (če se v statistični populaciji značilnost spremeni tako, da obstajata samo dve medsebojno izključujoči možnosti, potem se takšna variabilnost imenuje alternativna) lahko izračunate z uporabo formule:

Če nadomestimo q = 1- p v to disperzijsko formulo, dobimo:

Vrste variance

Skupna varianca meri variacijo lastnosti v celotni populaciji kot celoti pod vplivom vseh dejavnikov, ki povzročajo to variacijo. Je enaka povprečju kvadrata odstopanj posameznih vrednosti značilnosti x od celotne srednje vrednosti x in jo je mogoče opredeliti kot preprosto varianco ali uteženo varianco.

Varianca znotraj skupine označuje naključno variacijo, tj. del variacije, ki je posledica vpliva neupoštevanih dejavnikov in ni odvisen od dejavnika-atributa, ki tvori osnovo skupine. Takšna disperzija je enaka srednjemu kvadratu odstopanj posameznih vrednosti atributa znotraj skupine X od aritmetične sredine skupine in se lahko izračuna kot enostavna disperzija ali kot utežena disperzija.

torej mere variance znotraj skupine variacija lastnosti znotraj skupine in je določena s formulo:

kjer je xi povprečje skupine; ni je število enot v skupini.

Na primer, variance znotraj skupine, ki jih je treba določiti pri nalogi preučevanja vpliva kvalifikacij delavcev na raven produktivnosti dela v delavnici, kažejo razlike v proizvodnji v vsaki skupini, ki jih povzročajo vsi možni dejavniki (tehnično stanje opreme, razpoložljivost orodja in materiali, starost delavcev, intenzivnost dela itd.), razen razlik v kvalifikacijski kategoriji (znotraj skupine imajo vsi delavci enako kvalifikacijo).

Povprečje znotrajskupinskih varianc odraža naključno variacijo, to je tisti del variacije, ki je nastal pod vplivom vseh drugih dejavnikov, razen faktorja združevanja. Izračuna se po formuli:

Medskupinska varianca označuje sistematično variacijo nastale značilnosti, ki je posledica vpliva dejavnika-atributa, ki tvori osnovo skupine. Je enak povprečju kvadrata odstopanj skupinskih povprečij od celotnega povprečja. Varianca med skupinami se izračuna po formuli:

Razpršenostnaključna spremenljivka- merilo širjenja danega naključna spremenljivka, torej njo odstopanja od matematičnega pričakovanja. V statistiki se za označevanje disperzije pogosto uporablja zapis (sigma na kvadrat). Imenuje se kvadratni koren variance, ki je enak standardni odklon ali standardni namaz. Standardni odklon se meri v istih enotah kot sama naključna spremenljivka, varianca pa se meri v kvadratih te enote.

Čeprav je zelo priročno uporabiti samo eno vrednost (kot je povprečje ali način in mediana) za oceno celotnega vzorca, lahko ta pristop zlahka vodi do napačnih zaključkov. Razlog za takšno stanje ni v sami vrednosti, temveč v dejstvu, da ena vrednost nikakor ne odraža širjenja vrednosti podatkov.

Na primer, v vzorcu:

povprečna vrednost je 5.

Vendar pa v samem vzorcu ni niti enega elementa z vrednostjo 5. Morda boste morali poznati stopnjo bližine vsakega elementa v vzorcu njegovi srednji vrednosti. Ali z drugimi besedami, poznati boste morali varianco vrednosti. Če poznate stopnjo spremembe podatkov, jih lahko bolje interpretirate povprečna vrednost, mediana in moda. Stopnja, do katere se vrednosti vzorca spremenijo, se določi z izračunom njihove variance in standardnega odklona.



Varianca in kvadratni koren variance, imenovana standardna deviacija, označujeta povprečno odstopanje od vzorčnega povprečja. Med tema dvema količinama je najpomembnejša standardni odklon. To vrednost si lahko predstavljamo kot povprečno oddaljenost elementov od srednjega elementa vzorca.

Varianco je težko smiselno interpretirati. Vendar pa je kvadratni koren te vrednosti standardna deviacija in jo je mogoče enostavno interpretirati.

Standardni odklon se izračuna tako, da se najprej določi varianca in nato vzame kvadratni koren variance.

Na primer, za niz podatkov, prikazan na sliki, bodo pridobljene naslednje vrednosti:

Slika 1

Tukaj je povprečna vrednost kvadratov razlik 717,43. Če želite dobiti standardno odstopanje, ostane le, da izvlečete kvadratni koren tega števila.

Rezultat bo približno 26,78.

Ne pozabite, da se standardna deviacija razlaga kot povprečna razdalja elementov od povprečja vzorca.

Standardni odklon meri, kako dobro povprečje opisuje celoten vzorec.

Recimo, da ste vodja proizvodnega oddelka za sestavljanje osebnih računalnikov. Četrtletno poročilo navaja, da je proizvodnja v zadnjem četrtletju znašala 2500 osebnih računalnikov. Je to dobro ali slabo? Zahtevali ste (ali pa ta stolpec že obstaja v poročilu) za prikaz standardnega odklona za te podatke v poročilu. Standardna deviacija je na primer 2000. Vam kot vodji oddelka postane jasno, da proizvodna linija zahteva boljše vodenje (prevelika odstopanja v številu sestavljenih osebnih računalnikov).

Spomnimo se, da so podatki pri velikem standardnem odklonu močno razpršeni okoli povprečja, pri majhnem standardnem odklonu pa se združujejo blizu povprečja.

Štiri statistične funkcije VAR(), VAR(), STDEV() in STDEV() so zasnovane za izračun variance in standardnega odklona števil v obsegu celic. Preden lahko izračunate varianco in standardni odklon nabora podatkov, morate ugotoviti, ali podatki predstavljajo populacijo ali vzorec populacije. V primeru vzorca iz splošne populacije uporabite funkciji VAR() in STDEV(), v primeru splošne populacije pa funkciji VAR() in STDEV():

Prebivalstvo funkcija

DISPR()

STANDOTLONP()
Vzorec

DISP()

STDEV()

Disperzija (kot tudi standardna deviacija), kot smo omenili, označuje obseg, v katerem so vrednosti, vključene v nabor podatkov, razpršene okoli aritmetične sredine.

Majhna vrednost variance ali standardnega odklona kaže, da so vsi podatki koncentrirani okoli aritmetične sredine, velika vrednost teh vrednosti pa kaže, da so podatki razpršeni v širokem razponu vrednosti.

Razpršenost je precej težko smiselno interpretirati (kaj pomeni majhna vrednost, velika?). Izvedba Naloge 3 vam bo omogočil, da vizualno, na grafu, prikažete pomen variance za niz podatkov.

Naloge

· Naloga 1.

· 2.1. Podajte pojma: disperzija in standardni odklon; njihova simbolna oznaka za statistično obdelavo podatkov.

· 2.2. Izpolnite delovni list v skladu s sliko 1 in naredite potrebne izračune.

· 2.3. Navedite osnovne formule, ki se uporabljajo pri izračunih

· 2.4. Pojasni vse oznake ( , , )

· 2.5. Pojasnite praktični pomen konceptov disperzije in standardnega odklona.

Naloga 2.

1.1. Podajte pojma: generalna populacija in vzorec; matematično pričakovanje in njihova aritmetična sredina simbolna oznaka za statistično obdelavo podatkov.

1.2. V skladu s sliko 2 pripravite delovni list in naredite izračune.

1.3. Navedite osnovne formule, uporabljene pri izračunih (za splošno populacijo in vzorec).

Slika 2

1.4. Pojasnite, zakaj je mogoče dobiti takšne aritmetične srednje vrednosti v vzorcih, kot sta 46,43 in 48,78 (glej prilogo datoteke). Potegnite zaključke.

Naloga 3.

Obstajata dva vzorca z različnimi nizi podatkov, vendar bo povprečje zanju enako:

Slika 3

3.1. Izpolnite delovni list v skladu s sliko 3 in naredite potrebne izračune.

3.2. Podajte osnovne formule za izračun.

3.3. Sestavite grafe v skladu s slikama 4, 5.

3.4. Razloži dobljene odvisnosti.

3.5. Izvedite podobne izračune za podatke dveh vzorcev.

Originalni vzorec 11119999

Izberite vrednosti drugega vzorca tako, da je aritmetična sredina za drugi vzorec enaka, na primer:

Vrednosti za drugi vzorec izberite sami. Izračune in grafe uredite podobno kot na slikah 3, 4, 5. Pokažite osnovne formule, ki so bile uporabljene pri izračunih.

Pripravite ustrezne zaključke.

Vse naloge opravite v obliki poročila z vsemi potrebnimi slikami, grafi, formulami in kratkimi pojasnili.

Opomba: izdelava grafov mora biti pojasnjena z risbami in kratkimi pojasnili.



Ta članek je na voljo tudi v naslednjih jezikih: tajska

  • Naprej

    Najlepša HVALA za zelo koristne informacije v članku. Vse je predstavljeno zelo jasno. Zdi se, da je bilo z analizo delovanja trgovine eBay vloženega veliko dela

    • Hvala vam in ostalim rednim bralcem mojega bloga. Brez vas ne bi bil dovolj motiviran, da bi posvetil veliko časa vzdrževanju te strani. Moji možgani so tako zgrajeni: rad se poglabljam, sistematiziram razpršene podatke, preizkušam stvari, ki jih še nihče ni naredil ali pogledal s tega zornega kota. Škoda, da naši rojaki zaradi krize v Rusiji nimajo časa za nakupovanje na eBayu. Kupujejo pri Aliexpressu iz Kitajske, saj je tam blago veliko cenejše (pogosto na račun kakovosti). Toda spletne dražbe eBay, Amazon, ETSY bodo Kitajcem zlahka dale prednost pri ponudbi blagovnih znamk, vintage predmetov, ročno izdelanih predmetov in različnih etničnih izdelkov.

      • Naprej

        V vaših člankih je dragocen vaš osebni odnos in analiza teme. Ne opustite tega bloga, sem pogosto. Takšnih bi nas moralo biti veliko. Pošlji mi e-pošto Pred kratkim sem prejel e-pošto s ponudbo, da me bodo naučili trgovati na Amazonu in eBayu.

  • In spomnil sem se vaših podrobnih člankov o teh poslih. območje
    Še enkrat sem vse prebral in ugotovil, da so tečaji prevara. Ničesar še nisem kupil na eBayu. Nisem iz Rusije, ampak iz Kazahstana (Almaty). Ampak tudi dodatnih stroškov še ne potrebujemo.