Denne egenskab alene er dog ikke nok til at studere en tilfældig variabel. Lad os forestille os to skytter, der skyder mod et mål. Den ene skyder præcist og rammer tæt på midten, mens den anden... bare har det sjovt og ikke engang sigter. Men det sjove er, at han gennemsnit resultatet bliver nøjagtigt det samme som det første skydespil! Denne situation er konventionelt illustreret af følgende tilfældige variable:

Den "sniper" matematiske forventning er dog lig med for den "interessante person": - den er også nul!

Der er således behov for at kvantificere, hvor langt spredt kugler (tilfældige variable værdier) i forhold til midten af ​​målet (matematisk forventning). Godt spredning oversat fra latin er ingen anden måde end spredning .

Lad os se, hvordan denne numeriske karakteristik bestemmes ved hjælp af et af eksemplerne fra 1. del af lektionen:

Der fandt vi en skuffende matematisk forventning til dette spil, og nu skal vi beregne dets varians, hvilket betegnet med igennem.

Lad os finde ud af, hvor langt gevinsterne/tabene er "spredt" i forhold til gennemsnitsværdien. Det er klart, for dette skal vi beregne forskelle mellem tilfældige variable værdier og hende matematisk forventning:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Nu ser det ud til, at du skal opsummere resultaterne, men denne måde er ikke egnet - af den grund, at udsving til venstre vil ophæve hinanden med udsving til højre. Så for eksempel en "amatør" skydespil (eksempel ovenfor) forskellene vil være , og når de tilføjes, vil de give nul, så vi får ikke noget skøn over spredningen af ​​hans skydning.

For at omgå dette problem kan du overveje moduler forskelle, men af ​​tekniske årsager har tilgangen slået rod, når de er kvadreret. Det er mere bekvemt at formulere løsningen i en tabel:

Og her beder det om at regne vægtet gennemsnit værdien af ​​de kvadrerede afvigelser. Og HVAD er det her? Det er deres matematisk forventning, som er et mål for spredning:

definition afvigelser. Det fremgår umiddelbart af definitionen varians kan ikke være negativ– læg mærke til øvelsen!

Lad os huske, hvordan man finder den forventede værdi. Gang de kvadrerede forskelle med de tilsvarende sandsynligheder (tabel fortsat):
– billedligt talt er dette "trækkraft",
og opsummer resultaterne:

Synes du ikke, at resultatet i forhold til gevinsterne viste sig at være for stort? Det er rigtigt - vi kvadrerede det, og for at vende tilbage til dimensionen af ​​vores spil, skal vi tage kvadratroden. Denne mængde kaldes standardafvigelse og er betegnet med det græske bogstav "sigma":

Denne værdi kaldes nogle gange standardafvigelse .

Hvad er dens betydning? Hvis vi afviger fra den matematiske forventning til venstre og højre med standardafvigelsen:

– så vil de mest sandsynlige værdier af den stokastiske variabel være "koncentreret" på dette interval. Hvad vi faktisk observerer:

Det forholder sig dog sådan, at man ved analyse af spredning næsten altid opererer med spredningsbegrebet. Lad os finde ud af, hvad det betyder i forhold til spil. Hvis vi i tilfælde af pile taler om "nøjagtigheden" af hits i forhold til midten af ​​målet, så karakteriserer spredning her to ting:

For det første er det indlysende, at når indsatserne stiger, stiger spredningen også. Så hvis vi for eksempel øger med 10 gange, så vil den matematiske forventning stige med 10 gange, og variansen vil stige med 100 gange (da dette er en kvadratisk størrelse). Men bemærk, at selve spillets regler ikke har ændret sig! Kun satserne har groft sagt ændret sig, før vi satsede 10 rubler, nu er det 100.

Den anden, mere interessante pointe er, at varians kendetegner spillestilen. Mentalt fikser spillets indsatser på et vist niveau, og lad os se, hvad der er hvad:

Et spil med lav varians er et forsigtigt spil. Spilleren har en tendens til at vælge de mest pålidelige ordninger, hvor han ikke taber/vinder for meget på én gang. For eksempel det rød/sort system i roulette (se eksempel 4 i artiklen Tilfældige variable) .

Spil med høj varians. Hun bliver ofte kaldt dispersiv spil. Dette er en eventyrlig eller aggressiv spillestil, hvor spilleren vælger "adrenalin"-skemaer. Lad os i det mindste huske "Martingale", hvor beløbene på spil er størrelsesordener større end det "stille" spil i det foregående punkt.

Situationen i poker er vejledende: der er såkaldte tæt spillere, der har tendens til at være forsigtige og "rystende" over deres spillemidler (bankroll). Ikke overraskende svinger deres bankroll ikke væsentligt (lav varians). Tværtimod, hvis en spiller har høj varians, så er han en aggressor. Han tager ofte risici, laver store væddemål og kan enten bryde en kæmpe bank eller miste sig selv i småstykker.

Det samme sker i Forex, og så videre – der er masser af eksempler.

Desuden er det i alle tilfælde ligegyldigt, om spillet spilles for øre eller tusindvis af dollars. Hvert niveau har sine lav- og højspredningsspillere. Nå, som vi husker, er den gennemsnitlige gevinst "ansvarlig" matematisk forventning.

Du har sikkert bemærket, at det er en lang og omhyggelig proces at finde varians. Men matematik er generøst:

Formel til at finde varians

Denne formel er afledt direkte fra definitionen af ​​varians, og vi tog den straks i brug. Jeg kopierer skiltet med vores spil øverst:

og den fundne matematiske forventning.

Lad os beregne variansen på den anden måde. Lad os først finde den matematiske forventning - kvadratet af den stokastiske variabel. Ved bestemmelse af matematisk forventning:

I dette tilfælde:

Altså ifølge formlen:

Som de siger, mærk forskellen. Og i praksis er det selvfølgelig bedre at bruge formlen (medmindre betingelsen kræver andet).

Vi mestrer teknikken til at løse og designe:

Eksempel 6

Find dens matematiske forventning, varians og standardafvigelse.

Denne opgave findes overalt og går som regel uden mening.
Du kan forestille dig flere pærer med tal, der lyser op i et galehus med visse sandsynligheder :)

Løsning: Det er praktisk at opsummere de grundlæggende beregninger i en tabel. Først skriver vi de indledende data i de to øverste linjer. Derefter beregner vi produkterne, derefter og til sidst summen i højre kolonne:

Faktisk er næsten alt klar. Den tredje linje viser en færdiglavet matematisk forventning: .

Vi beregner variansen ved hjælp af formlen:

Og endelig standardafvigelsen:
– Personligt plejer jeg at afrunde til 2 decimaler.

Alle beregninger kan udføres på en lommeregner, eller endnu bedre – i Excel:

Det er svært at gå galt her :)

Svar:

De, der ønsker det, kan forenkle deres liv endnu mere og drage fordel af min kalkulator (demo), som ikke kun øjeblikkeligt løser dette problem, men også bygger tematisk grafik (vi kommer der snart). Programmet kan være download fra biblioteket– hvis du har downloadet mindst ét ​​undervisningsmateriale, eller modtager en anden måde. Tak for din støtte til projektet!

Et par opgaver du skal løse på egen hånd:

Eksempel 7

Beregn variansen af ​​den stokastiske variabel i det foregående eksempel pr. definition.

Og et lignende eksempel:

Eksempel 8

En diskret stokastisk variabel er specificeret af dens fordelingslov:

Ja, tilfældige variable værdier kan være ret store (eksempel fra rigtigt arbejde), og her, hvis det er muligt, brug Excel. Som i eksempel 7 - det er hurtigere, mere pålideligt og sjovere.

Løsninger og svar nederst på siden.

For at afslutte 2. del af lektionen vil vi se på et andet typisk problem, man kan endda sige et lille puslespil:

Eksempel 9

En diskret tilfældig variabel kan kun tage to værdier: og , og . Sandsynligheden, den matematiske forventning og variansen er kendt.

Løsning: Lad os starte med en ukendt sandsynlighed. Da en tilfældig variabel kun kan tage to værdier, er summen af ​​sandsynligheden for de tilsvarende hændelser:

og siden da.

Tilbage er bare at finde..., det er nemt at sige :) Men nåja, så er det. Per definition af matematisk forventning:
– erstatte kendte mængder:

– og der kan ikke presses mere ud af denne ligning, bortset fra at du kan omskrive den i den sædvanlige retning:

eller:

Jeg tror, ​​du kan gætte de næste skridt. Lad os sammensætte og løse systemet:

Decimaler er naturligvis en fuldstændig skændsel; gange begge ligninger med 10:

og dividere med 2:

Det er bedre. Fra 1. ligning udtrykker vi:
(det er den nemmeste måde)– indsæt i 2. ligning:


Vi bygger firkantet og gør forenklinger:

Multiplicer med:

Resultatet var andengradsligning, finder vi dens diskriminerende:
- Fantastisk!

og vi får to løsninger:

1) hvis , Det ;

2) hvis , Det .

Det første par værdier opfylder betingelsen. Med stor sandsynlighed er alt korrekt, men lad os ikke desto mindre skrive distributionsloven ned:

og udfør en kontrol, nemlig find forventningen:

Hvis populationen er opdelt i grupper i henhold til den karakteristik, der undersøges, kan følgende typer af varians beregnes for denne population: total, gruppe (inden for gruppen), gennemsnit af gruppen (gennemsnit af inden for gruppen), intergruppe.

I første omgang udregner den bestemmelseskoefficienten, som viser hvilken del af den samlede variation af den egenskab, der undersøges, der er intergruppevariation, dvs. på grund af grupperingskarakteristikken:

Det empiriske korrelationsforhold karakteriserer tætheden af ​​sammenhængen mellem gruppering (faktorielle) og præstationskarakteristika.

Det empiriske korrelationsforhold kan tage værdier fra 0 til 1.

For at vurdere tætheden af ​​forbindelsen baseret på det empiriske korrelationsforhold, kan du bruge Chaddock-relationerne:

Eksempel 4. Følgende data er tilgængelige om udførelsen af ​​arbejde udført af design- og undersøgelsesorganisationer med forskellige former for ejerskab:

Definere:

1) total varians;

2) gruppevarianser;

3) gennemsnittet af gruppevarianserne;

4) intergruppevarians;

5) total varians baseret på reglen for tilføjelse af varianser;


6) bestemmelseskoefficient og empirisk korrelationsforhold.

Træk konklusioner.

Løsning:

1. Lad os bestemme den gennemsnitlige mængde arbejde udført af virksomheder med to former for ejerskab:

Lad os beregne den samlede varians:

2. Bestem gruppegennemsnit:

millioner rubler;

millioner rubler

Gruppe afvigelser:

;

3. Beregn gennemsnittet af gruppevarianserne:

4. Lad os bestemme intergruppevariansen:

5. Beregn den samlede varians baseret på reglen for tilføjelse af varians:

6. Lad os bestemme bestemmelseskoefficienten:

.

Mængden af ​​arbejde, der udføres af design- og undersøgelsesorganisationer, afhænger således med 22 % af virksomhedernes ejerskabsform.

Det empiriske korrelationsforhold beregnes ved hjælp af formlen

.

Værdien af ​​den beregnede indikator indikerer, at afhængigheden af ​​arbejdsmængden af ​​virksomhedens ejerskabsform er lille.

Eksempel 5. Som et resultat af en undersøgelse af produktionsområdernes teknologiske disciplin blev følgende data opnået:

Bestem bestemmelseskoefficienten

Lad os regne indMSEXCELprøvevarians og standardafvigelse. Vi vil også beregne variansen af ​​en stokastisk variabel, hvis dens fordeling er kendt.

Lad os først overveje spredning, så standardafvigelse.

Prøvevarians

Prøvevarians (prøvevarians,prøvevarians) karakteriserer spredningen af ​​værdier i arrayet i forhold til .

Alle 3 formler er matematisk ækvivalente.

Fra den første formel er det klart, at prøvevarians er summen af ​​de kvadrerede afvigelser af hver værdi i arrayet fra gennemsnittet, divideret med stikprøvestørrelse minus 1.

afvigelser prøver DISP()-funktionen bruges, engelsk. navnet VAR, dvs. VARIANS. Fra version MS EXCEL 2010 anbefales det at bruge dens analoge DISP.V(), engelsk. navnet VARS, dvs. Prøve VARians. Derudover er der fra versionen af ​​MS EXCEL 2010 en funktion DISP.Г(), engelsk. navn VARP, dvs. Population VARians, som beregner spredning For befolkning. Hele forskellen kommer ned til nævneren: i stedet for n-1 ligesom DISP.V(), har DISP.G() kun n i nævneren. Før MS EXCEL 2010 blev funktionen VAR() brugt til at beregne variansen af ​​populationen.

Prøvevarians
=QUADROTCL(Sample)/(COUNT(Sample)-1)
=(SUM(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/ (COUNT(Sample)-1)– sædvanlig formel
=SUM((Sample -AVERAGE(Sample))^2)/ (COUNT(Sample)-1) –

Prøvevarians er lig med 0, kun hvis alle værdier er lig med hinanden og følgelig ens gennemsnitsværdi. Normalt er værdien større afvigelser, jo større spredning af værdier i arrayet.

Prøvevarians er et punktestimat afvigelser fordeling af den stokastiske variabel, som den er lavet af prøve. Om byggeri konfidensintervaller ved vurdering afvigelser kan læses i artiklen.

Varians af en tilfældig variabel

At beregne spredning tilfældig variabel, du skal vide det.

For afvigelser stokastisk variabel X betegnes ofte Var(X). Spredning lig med kvadratet af afvigelsen fra middelværdien E(X): Var(X)=E[(X-E(X)) 2 ]

spredning beregnet med formlen:

hvor x i er den værdi, som en stokastisk variabel kan tage, og μ er gennemsnitsværdien (), p(x) er sandsynligheden for, at den stokastiske variabel tager værdien x.

Hvis en tilfældig variabel har , så spredning beregnet med formlen:

Dimension afvigelser svarer til kvadratet af måleenheden for de oprindelige værdier. For eksempel, hvis værdierne i prøven repræsenterer delvægtmålinger (i kg), så ville variansdimensionen være kg 2 . Dette kan være svært at fortolke, så for at karakterisere spredningen af ​​værdier, en værdi lig med kvadratroden af afvigelserstandardafvigelse.

nogle ejendomme afvigelser:

Var(X+a)=Var(X), hvor X er en stokastisk variabel, og a er en konstant.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Denne spredningsegenskab bruges i artikel om lineær regression.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), hvor X og Y er stokastiske variable, Cov(X;Y) er kovariansen af ​​disse stokastiske variable.

Hvis tilfældige variable er uafhængige, så er de kovarians er lig med 0, og derfor Var(X+Y)=Var(X)+Var(Y). Denne spredningsegenskab bruges til afledning.

Lad os vise, at for uafhængige størrelser Var(X-Y)=Var(X+Y). Faktisk, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Denne spredningsegenskab bruges til at konstruere .

Eksempel på standardafvigelse

Eksempel på standardafvigelse er et mål for, hvor vidt spredt værdierne i en prøve er i forhold til deres .

Per definition, standardafvigelse lig med kvadratroden af afvigelser:

Standardafvigelse tager ikke højde for størrelsen af ​​værdierne i prøve, men kun graden af ​​spredning af værdier omkring dem gennemsnit. For at illustrere dette, lad os give et eksempel.

Lad os beregne standardafvigelsen for 2 prøver: (1; 5; 9) og (1001; 1005; 1009). I begge tilfælde er s=4. Det er indlysende, at forholdet mellem standardafvigelsen og arrayværdierne for prøverne er væsentligt anderledes. Til sådanne tilfælde bruges det Variationskoefficient(Variationskoefficient, CV) - forhold Standardafvigelse til gennemsnittet aritmetik, udtrykt i procent.

I MS EXCEL 2007 og tidligere versioner til beregning Eksempel på standardafvigelse funktionen =STDEVAL() bruges, engelsk. navn STDEV, dvs. STANDARD DEVIATION. Fra versionen af ​​MS EXCEL 2010 anbefales det at bruge dens analoge =STDEV.B() , engelsk. navn STDEV.S, dvs. Eksempel på standard DEViation.

Derudover er der fra versionen af ​​MS EXCEL 2010 en funktion STANDARDEV.G(), engelsk. navn STDEV.P, dvs. Population Standard DEViation, som beregner standardafvigelse For befolkning. Hele forskellen kommer ned til nævneren: i stedet for n-1 som i STANDARDEV.V(), har STANDARDEVAL.G() kun n i nævneren.

Standardafvigelse kan også beregnes direkte ved hjælp af formlerne nedenfor (se eksempelfil)
=ROOT(QUADROTCL(Sample)/(COUNT(Sample)-1))
=ROOT((SUM(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/(COUNT(Sample)-1))

Andre mål for spredning

Funktionen SQUADROTCL() beregner med en sum af kvadrerede afvigelser af værdier fra deres gennemsnit. Denne funktion vil returnere det samme resultat som formlen =DISP.G( Prøve)*CHECK( Prøve), Hvor Prøve- en reference til et område, der indeholder en matrix af prøveværdier (). Beregninger i QUADROCL()-funktionen udføres efter formlen:

Funktionen SROTCL() er også et mål for spredningen af ​​et sæt data. Funktionen SROTCL() beregner gennemsnittet af de absolutte værdier af afvigelser af værdier fra gennemsnit. Denne funktion vil returnere det samme resultat som formlen =SUMPRODUKT(ABS(Sample-AVERAGE(Sample)))/COUNT(Sample), Hvor Prøve- et link til et område, der indeholder en række prøveværdier.

Beregninger i funktionen SROTCL () udføres efter formlen:

.

Omvendt, hvis er en ikke-negativ a.e. fungere sådan , så er der et absolut kontinuerligt sandsynlighedsmål på sådan, at det er dens tæthed.

    Udskiftning af mål i Lebesgue-integralet:

,

hvor er enhver Borel-funktion, der er integrerbar med hensyn til sandsynlighedsmålingen.

Spredning, dispersionstyper og egenskaber Begrebet spredning

Spredning i statistik findes som standardafvigelsen af ​​karakteristikkens individuelle værdier i anden kvadrat fra det aritmetiske middelværdi. Afhængigt af de indledende data bestemmes det ved hjælp af de simple og vægtede variansformler:

1. Simpel varians(for ikke-grupperede data) beregnes ved hjælp af formlen:

2. Vægtet varians (for variationsserier):

hvor n er frekvens (gentagelighed af faktor X)

Et eksempel på at finde varians

Denne side beskriver et standardeksempel på at finde varians, du kan også se på andre problemer for at finde den

Eksempel 1. Bestemmelse af gruppe, gruppegennemsnit, intergruppe og total varians

Eksempel 2. Find variansen og variationskoefficienten i en grupperingstabel

Eksempel 3. Find varians i en diskret serie

Eksempel 4. Følgende data er tilgængelige for en gruppe på 20 korrespondancestuderende. Det er nødvendigt at konstruere en intervalserie af fordelingen af ​​karakteristikken, beregne gennemsnitsværdien af ​​karakteristikken og studere dens spredning

Lad os bygge en intervalgruppering. Lad os bestemme området for intervallet ved hjælp af formlen:

hvor X max er den maksimale værdi af grupperingskarakteristikken; X min – minimumsværdi for grupperingskarakteristikken; n – antal intervaller:

Vi accepterer n=5. Trinet er: h = (192 - 159)/ 5 = 6,6

Lad os oprette en intervalgruppering

For yderligere beregninger vil vi bygge en hjælpetabel:

X"i – midten af ​​intervallet. (f.eks. midten af ​​intervallet 159 – 165,6 = 162,3)

Vi bestemmer den gennemsnitlige højde for elever ved hjælp af den vægtede aritmetiske gennemsnitsformel:

Lad os bestemme variansen ved hjælp af formlen:

Formlen kan omdannes således:

Af denne formel følger det varians er lig med forskellen mellem gennemsnittet af kvadraterne af mulighederne og kvadratet og gennemsnittet.

Spredning i variationsserier med lige store intervaller ved hjælp af metoden for momenter kan beregnes på følgende måde ved hjælp af den anden egenskab for spredning (dividere alle muligheder med værdien af ​​intervallet). Bestemmelse af varians, beregnet ved hjælp af momentmetoden, ved hjælp af følgende formel er mindre besværlig:

hvor i er værdien af ​​intervallet; A er et konventionelt nul, for hvilket det er praktisk at bruge midten af ​​intervallet med den højeste frekvens; m1 er kvadratet af første ordensmoment; m2 - moment af anden orden

Alternativ trækvarians (hvis i en statistisk population en karakteristik ændres på en sådan måde, at der kun er to gensidigt udelukkende muligheder, så kaldes en sådan variabilitet alternativ) kan beregnes ved hjælp af formlen:

Ved at erstatte q = 1-p i denne dispersionsformel får vi:

Typer af varians

Total varians måler variationen af ​​en karakteristik på tværs af hele befolkningen som helhed under indflydelse af alle faktorer, der forårsager denne variation. Det er lig med middelkvadraten af ​​afvigelserne af individuelle værdier af en karakteristisk x fra den samlede middelværdi af x og kan defineres som simpel varians eller vægtet varians.

Inden for gruppen varians kendetegner tilfældig variation, dvs. en del af variationen, der skyldes påvirkning af ikke-redegjorte faktorer og ikke afhænger af den faktor-attribut, der danner grundlag for gruppen. En sådan spredning er lig med middelkvadraten af ​​afvigelserne af individuelle værdier af attributten inden for gruppe X fra gruppens aritmetiske middelværdi og kan beregnes som simpel spredning eller som vægtet spredning.

Således, inden for gruppe variansmålinger variation af en egenskab inden for en gruppe og bestemmes af formlen:

hvor xi er gruppegennemsnittet; ni er antallet af enheder i gruppen.

For eksempel viser intragruppe-varianser, der skal bestemmes i opgaven med at studere indflydelsen af ​​arbejdernes kvalifikationer på niveauet af arbejdsproduktivitet i et værksted, variationer i output i hver gruppe forårsaget af alle mulige faktorer (udstyrets tekniske tilstand, tilgængelighed af værktøjer og materialer, arbejdernes alder, arbejdsintensitet osv. .), bortset fra forskelle i kvalifikationskategori (inden for en gruppe har alle arbejdere de samme kvalifikationer).

Gennemsnittet af varianser inden for gruppe afspejler tilfældig variation, det vil sige den del af variationen, der opstod under indflydelse af alle andre faktorer, med undtagelse af grupperingsfaktoren. Det beregnes ved hjælp af formlen:

Intergroup varians karakteriserer den systematiske variation af den resulterende karakteristik, som skyldes påvirkningen af ​​den faktor-attribut, der danner grundlaget for gruppen. Det er lig med middelkvadraten af ​​afvigelserne af gruppemiddelværdierne fra det samlede gennemsnit. Intergroup varians beregnes ved hjælp af formlen:

Spredningtilfældig variabel- mål for spredningen af ​​en given tilfældig variabel, altså hende afvigelser fra matematisk forventning. I statistik bruges notationen (sigma squared) ofte til at betegne spredning. Kvadratroden af ​​variansen lig med kaldes standardafvigelse eller standardspredning. Standardafvigelsen måles i de samme enheder som den stokastiske variabel selv, og variansen måles i kvadraterne af den pågældende enhed.

Selvom det er meget bekvemt kun at bruge én værdi (såsom middelværdi eller mode og median) til at estimere hele prøven, kan denne tilgang nemt føre til forkerte konklusioner. Årsagen til denne situation ligger ikke i selve værdien, men i det faktum, at én værdi ikke på nogen måde afspejler spredningen af ​​dataværdier.

For eksempel i eksemplet:

gennemsnitsværdien er 5.

I selve prøven er der dog ikke et enkelt element med en værdi på 5. Du skal muligvis kende graden af ​​nærhed af hvert element i prøven til dets middelværdi. Eller med andre ord, du bliver nødt til at kende variansen af ​​værdierne. Ved at kende graden af ​​ændring i dataene, kan du bedre fortolke gennemsnitsværdi, median Og mode. I hvilken grad prøveværdierne ændres bestemmes ved at beregne deres varians og standardafvigelse.



Variansen og kvadratroden af ​​variansen, kaldet standardafvigelsen, karakteriserer den gennemsnitlige afvigelse fra prøvegennemsnittet. Blandt disse to mængder er den vigtigste standardafvigelse. Denne værdi kan opfattes som den gennemsnitlige afstand, som elementer er fra det midterste element i prøven.

Varians er svær at fortolke meningsfuldt. Kvadratroden af ​​denne værdi er dog standardafvigelsen og kan let fortolkes.

Standardafvigelsen beregnes ved først at bestemme variansen og derefter tage kvadratroden af ​​variansen.

For eksempel, for dataarrayet vist i figuren, vil følgende værdier blive opnået:

Figur 1

Her er gennemsnitsværdien af ​​kvadratforskellene 717,43. For at få standardafvigelsen er der kun tilbage at tage kvadratroden af ​​dette tal.

Resultatet bliver cirka 26,78.

Husk, at standardafvigelsen fortolkes som den gennemsnitlige afstand, som elementerne er fra prøvegennemsnittet.

Standardafvigelsen måler, hvor godt gennemsnittet beskriver hele prøven.

Lad os sige, at du er leder af en produktionsafdeling for pc-montage. Kvartalsrapporten oplyser, at produktionen for sidste kvartal var på 2.500 pc'er. Er dette godt eller dårligt? Du bad (eller der er allerede denne kolonne i rapporten) om at få vist standardafvigelsen for disse data i rapporten. Standardafvigelsestallet er for eksempel 2000. Det bliver tydeligt for dig som afdelingsleder, at produktionslinjen kræver bedre styring (for store afvigelser i antallet af monterede pc'er).

Husk, at når standardafvigelsen er stor, er data bredt spredt rundt om middelværdien, og når standardafvigelsen er lille, samler de sig tæt på middelværdien.

De fire statistiske funktioner VAR(), VAR(), STDEV() og STDEV() er designet til at beregne variansen og standardafvigelsen af ​​tal i et celleområde. Før du kan beregne variansen og standardafvigelsen for et sæt data, skal du bestemme, om dataene repræsenterer en population eller en stikprøve af en population. I tilfælde af en stikprøve fra en generel population, skal du bruge funktionerne VAR() og STDEV(), og i tilfælde af en generel population, funktionerne VAR() og STDEV():

Befolkning Fungere

DISPR()

STANDOTLONP()
Prøve

DISP()

STDEV()

Spredning (såvel som standardafvigelse), som vi bemærkede, angiver, i hvilket omfang værdierne i datasættet er spredt omkring det aritmetiske gennemsnit.

En lille variansværdi eller standardafvigelse indikerer, at alle data er koncentreret omkring det aritmetiske middelværdi, og en stor værdi af disse værdier indikerer, at dataene er spredt over en bred vifte af værdier.

Spredning er ret svær at fortolke meningsfuldt (hvad betyder en lille værdi, en stor værdi?). Udførelse Opgaver 3 giver dig mulighed for visuelt på en graf at vise betydningen af ​​variansen for et datasæt.

Quests

· Opgave 1.

· 2.1. Giv begreberne: spredning og standardafvigelse; deres symbolske betegnelse for statistisk databehandling.

· 2.2. Udfyld arbejdsarket i overensstemmelse med figur 1 og lav de nødvendige beregninger.

· 2.3. Angiv de grundlæggende formler, der bruges i beregninger

· 2.4. Forklar alle betegnelser ( , , )

· 2.5. Forklar den praktiske betydning af begreberne spredning og standardafvigelse.

Opgave 2.

1.1. Giv begreberne: generel befolkning og stikprøve; matematisk forventning og deres aritmetiske middelværdi symbolsk betegnelse for statistisk databehandling.

1.2. I overensstemmelse med figur 2, udarbejde et arbejdsark og lav beregninger.

1.3. Angiv de grundlæggende formler, der bruges i beregningerne (for den generelle befolkning og stikprøve).

Figur 2

1.4. Forklar, hvorfor det er muligt at opnå sådanne aritmetiske middelværdier i prøver som 46,43 og 48,78 (se filtillæg). Træk konklusioner.

Opgave 3.

Der er to prøver med forskellige datasæt, men gennemsnittet for dem vil være det samme:

Figur 3

3.1. Udfyld arbejdsarket i overensstemmelse med figur 3 og foretag de nødvendige beregninger.

3.2. Angiv de grundlæggende beregningsformler.

3.3. Konstruer grafer i overensstemmelse med figur 4, 5.

3.4. Forklar de opnåede afhængigheder.

3.5. Udfør lignende beregninger for data fra to prøver.

Original prøve 11119999

Vælg værdierne for den anden prøve, så den aritmetiske middelværdi for den anden prøve er den samme, for eksempel:

Vælg selv værdierne for den anden prøve. Arranger beregninger og grafer svarende til figur 3, 4, 5. Vis de grundlæggende formler, der blev brugt i beregningerne.

Træk passende konklusioner.

Forbered alle opgaver i form af en rapport med alle nødvendige billeder, grafer, formler og korte forklaringer.

Bemærk: opbygningen af ​​grafer skal forklares med tegninger og korte forklaringer.



Denne artikel er også tilgængelig på følgende sprog: Thai

  • Næste

    TAK for den meget nyttige information i artiklen. Alt er præsenteret meget tydeligt. Det føles som om der er blevet gjort meget arbejde for at analysere driften af ​​eBay-butikken

    • Tak til jer og andre faste læsere af min blog. Uden dig ville jeg ikke være motiveret nok til at dedikere megen tid til at vedligeholde denne side. Min hjerne er struktureret på denne måde: Jeg kan godt lide at grave dybt, systematisere spredte data, prøve ting, som ingen har gjort før eller set fra denne vinkel. Det er en skam, at vores landsmænd ikke har tid til at shoppe på eBay på grund af krisen i Rusland. De køber fra Aliexpress fra Kina, da varer der er meget billigere (ofte på bekostning af kvalitet). Men online-auktioner eBay, Amazon, ETSY vil nemt give kineserne et forspring inden for rækken af ​​mærkevarer, vintageartikler, håndlavede varer og forskellige etniske varer.

      • Næste

        Det, der er værdifuldt i dine artikler, er din personlige holdning og analyse af emnet. Giv ikke op denne blog, jeg kommer her ofte. Sådan burde vi være mange. Email mig Jeg modtog for nylig en e-mail med et tilbud om at lære mig at handle på Amazon og eBay.

  • Og jeg huskede dine detaljerede artikler om disse handler. areal Jeg genlæste alt igen og konkluderede, at kurserne er et fupnummer. Jeg har ikke købt noget på eBay endnu. Jeg er ikke fra Rusland, men fra Kasakhstan (Almaty). Men vi har heller ikke brug for ekstra udgifter endnu.
    Jeg ønsker dig held og lykke og vær sikker i Asien.