Jednak sama ta cecha nie wystarczy do badania zmiennej losowej. Wyobraźmy sobie dwóch strzelców strzelających do celu. Jeden strzela celnie i trafia blisko środka, a drugi... po prostu się bawi i nawet nie celuje. Ale najśmieszniejsze jest to, że on przeciętny wynik będzie dokładnie taki sam jak pierwszego strzelca! Sytuację tę tradycyjnie ilustrują następujące zmienne losowe:

Oczekiwanie matematyczne „snajpera” jest jednak równe , dla „osoby interesującej”: – także wynosi zero!

Należy zatem określić ilościowo, jak daleko rozsiany pocisków (wartości zmiennych losowych) względem środka celu (oczekiwanie matematyczne). Dobrze rozpraszanie przetłumaczone z łaciny nie jest niczym innym jak dyspersja .

Zobaczmy, jak wyznacza się tę charakterystykę liczbową na jednym z przykładów z pierwszej części lekcji:

Tam znaleźliśmy rozczarowujące oczekiwania matematyczne dla tej gry, a teraz musimy obliczyć jej wariancję, która oznaczony przez Poprzez .

Dowiedzmy się, jak bardzo wygrane/przegrane są „rozproszone” w stosunku do wartości średniej. Oczywiście w tym celu musimy obliczyć różnice między losowe wartości zmiennych i ona oczekiwanie matematyczne:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Teraz wydaje się, że trzeba podsumować wyniki, ale ten sposób nie jest odpowiedni - z tego powodu, że wahania w lewo znoszą się wzajemnie z wahaniami w prawo. Na przykład strzelanka „amatorska”. (przykład powyżej) różnice będą , a po dodaniu dadzą zero, więc nie otrzymamy żadnego oszacowania rozrzutu jego strzału.

Aby obejść ten problem, możesz rozważyć moduły różnice, ale z powodów technicznych podejście zakorzeniło się po podniesieniu ich do kwadratu. Wygodniej jest sformułować rozwiązanie w tabeli:

I tu aż prosi się o kalkulację średnia ważona wartość kwadratów odchyleń. A CO to jest? To jest ich oczekiwanie matematyczne, który jest miarą rozproszenia:

definicja odchylenia. Z definicji od razu wynika, że wariancja nie może być ujemna– uwaga do ćwiczeń!

Pamiętajmy, jak znaleźć wartość oczekiwaną. Pomnóż kwadraty różnic przez odpowiednie prawdopodobieństwa (tabela ciąg dalszy):
– w przenośni jest to „siła uciągu”,
i podsumuj wyniki:

Nie sądzicie, że w porównaniu do wygranych wynik okazał się za duży? Zgadza się – podnieśliśmy to do kwadratu i wracając do wymiaru naszej gry, musimy wziąć pierwiastek kwadratowy. Ta ilość nazywa się odchylenie standardowe i jest oznaczony grecką literą „sigma”:

Ta wartość jest czasami nazywana odchylenie standardowe .

Jakie jest jego znaczenie? Jeśli odejdziemy od oczekiwań matematycznych w lewo i w prawo o odchylenie standardowe:

– wówczas najbardziej prawdopodobne wartości zmiennej losowej zostaną „skoncentrowane” na tym przedziale. Co faktycznie obserwujemy:

Tak się jednak składa, że ​​analizując rozpraszanie, prawie zawsze operujemy pojęciem dyspersji. Zastanówmy się, co to oznacza w odniesieniu do gier. Jeśli w przypadku strzał mówimy o „celności” trafień względem środka celu, to tutaj rozrzut charakteryzuje się dwiema rzeczami:

Po pierwsze, oczywiste jest, że wraz ze wzrostem zakładów zwiększa się również rozrzut. Tak więc, jeśli na przykład zwiększymy 10 razy, to oczekiwanie matematyczne wzrośnie 10 razy, a wariancja wzrośnie 100 razy (ponieważ jest to wielkość kwadratowa). Pamiętaj jednak, że same zasady gry się nie zmieniły! Zmieniły się tylko stawki, z grubsza mówiąc, zanim postawiliśmy 10 rubli, teraz jest 100.

Drugą, bardziej interesującą kwestią jest to, że styl gry charakteryzuje się wariancją. Mentalnie napraw zakłady w grze na pewnym poziomie i zobaczmy co jest co:

Gra o niskiej wariancji jest grą ostrożną. Gracz ma tendencję do wybierania najbardziej niezawodnych schematów, na których nie traci/nie wygrywa za jednym razem. Na przykład system czerwony/czarny w ruletce (patrz przykład 4 artykułu Zmienne losowe) .

Gra o dużej wariancji. Często jest nazywana dyspersyjny gra. Jest to ryzykowny lub agresywny styl gry, w którym gracz wybiera schematy „adrenaliny”. Przynajmniej pamiętajmy „Martyngał”, w którym stawki są o rząd wielkości większe niż w przypadku „cichej” gry opisanej w poprzednim punkcie.

Sytuacja w pokerze jest orientacyjna: istnieją tzw obcisły graczy, którzy są ostrożni i „niepewni” w kwestii swoich funduszy na grę (forsa). Nic dziwnego, że ich bankroll nie podlega znaczącym wahaniom (niska wariancja). I odwrotnie, jeśli gracz ma dużą wariancję, jest agresorem. Często podejmuje ryzyko, dokonuje dużych zakładów i może albo rozbić ogromny bank, albo rozbić się na kawałki.

To samo dzieje się na rynku Forex i tak dalej – przykładów jest mnóstwo.

Co więcej, we wszystkich przypadkach nie ma znaczenia, czy gra się za grosze, czy o tysiące dolarów. Każdy poziom ma swoich graczy o niskim i wysokim rozproszeniu. Cóż, jak pamiętamy, przeciętna wygrana jest „odpowiedzialna” oczekiwanie matematyczne.

Prawdopodobnie zauważyłeś, że znajdowanie wariancji jest długim i żmudnym procesem. Ale matematyka jest hojna:

Wzór na znalezienie wariancji

Wzór ten wywodzi się bezpośrednio z definicji wariancji i od razu go stosujemy. Skopiuję znak z naszą grą na górze:

i znalezione oczekiwanie matematyczne.

Obliczmy wariancję w drugi sposób. Najpierw znajdźmy oczekiwanie matematyczne – kwadrat zmiennej losowej. Przez wyznaczanie oczekiwań matematycznych:

W tym przypadku:

Zatem zgodnie ze wzorem:

Jak to mówią, poczuj różnicę. A w praktyce oczywiście lepiej zastosować wzór (chyba że warunek wymaga inaczej).

Opanujemy technikę rozwiązywania i projektowania:

Przykład 6

Znajdź jego matematyczne oczekiwanie, wariancję i odchylenie standardowe.

To zadanie można znaleźć wszędzie i z reguły nie ma znaczącego znaczenia.
Można sobie wyobrazić kilka żarówek z liczbami, które zapalają się w domu wariatów z pewnym prawdopodobieństwem :)

Rozwiązanie: Wygodnie jest podsumować podstawowe obliczenia w tabeli. Najpierw zapisujemy dane początkowe w dwóch górnych wierszach. Następnie obliczamy iloczyny, a na koniec sumy w prawej kolumnie:

Właściwie prawie wszystko jest gotowe. Trzecia linia pokazuje gotowe oczekiwanie matematyczne: .

Wariancję obliczamy korzystając ze wzoru:

I na koniec odchylenie standardowe:
– Osobiście zazwyczaj zaokrąglam liczbę do 2 miejsc po przecinku.

Wszelkie obliczenia można przeprowadzić na kalkulatorze, a jeszcze lepiej – w Excelu:

Trudno się tu pomylić :)

Odpowiedź:

Ci, którzy chcą, mogą jeszcze bardziej uprościć swoje życie i skorzystać z mojego kalkulator (demonstracja), który nie tylko natychmiast rozwiąże ten problem, ale także zbuduje grafika tematyczna (wkrótce tam dotrzemy). Program może być pobrać z biblioteki– jeśli pobrałeś lub otrzymałeś przynajmniej jeden materiał edukacyjny inny sposób. Dziękujemy za wsparcie projektu!

Kilka zadań do samodzielnego rozwiązania:

Przykład 7

Oblicz wariancję zmiennej losowej z poprzedniego przykładu z definicji.

I podobny przykład:

Przykład 8

Dyskretna zmienna losowa jest określona przez prawo dystrybucji:

Tak, wartości zmiennych losowych mogą być dość duże (przykład z prawdziwej pracy), a tutaj, jeśli to możliwe, użyj Excela. Swoją drogą, jak w przykładzie 7 – jest szybciej, pewniej i przyjemniej.

Rozwiązania i odpowiedzi na dole strony.

Na zakończenie drugiej części lekcji przyjrzymy się innemu typowemu problemowi, można nawet powiedzieć, małej zagadce:

Przykład 9

Dyskretna zmienna losowa może przyjmować tylko dwie wartości: i , oraz . Znane jest prawdopodobieństwo, oczekiwanie matematyczne i wariancja.

Rozwiązanie: Zacznijmy od nieznanego prawdopodobieństwa. Ponieważ zmienna losowa może przyjmować tylko dwie wartości, suma prawdopodobieństw odpowiednich zdarzeń wynosi:

i od tego czasu .

Pozostaje tylko znaleźć..., łatwo powiedzieć :) No ale cóż, zaczynamy. Z definicji oczekiwań matematycznych:
– zastąpić znane ilości:

– i nic więcej nie da się z tego równania wycisnąć, poza tym, że można je przepisać w zwykłym kierunku:

Lub:

Myślę, że można się domyślić kolejnych kroków. Skomponujmy i rozwiążmy system:

Ułamki dziesiętne są oczywiście całkowitą hańbą; pomnóż oba równania przez 10:

i podziel przez 2:

To jest lepsze. Z pierwszego równania wyrażamy:
(to jest łatwiejszy sposób)– podstawiamy do drugiego równania:


Budujemy do kwadratu i dokonaj uproszczeń:

Pomnóż przez:

Rezultat był równanie kwadratowe, znajdujemy jego wyróżnik:
- Świetnie!

i otrzymujemy dwa rozwiązania:

1) jeśli , To ;

2) jeśli , To .

Pierwsza para wartości spełnia warunek. Z dużym prawdopodobieństwem wszystko się zgadza, ale mimo to zapiszmy prawo dystrybucji:

i wykonaj sprawdzenie, a mianowicie znajdź oczekiwanie:

Jeśli populację podzielimy na grupy ze względu na badaną cechę, to dla tej populacji można obliczyć następujące typy wariancji: całkowita, grupowa (w obrębie grupy), średnia grupy (średnia wewnątrzgrupowa), międzygrupowa.

Początkowo oblicza współczynnik determinacji, który pokazuje, jaka część całkowitego zmienności badanej cechy stanowi zmienność międzygrupową, tj. ze względu na cechę grupowania:

Empiryczna zależność korelacyjna charakteryzuje bliskość powiązania między grupowaniem (czynnikowym) a charakterystyką wydajności.

Empiryczny współczynnik korelacji może przyjmować wartości od 0 do 1.

Aby ocenić bliskość powiązania na podstawie empirycznego współczynnika korelacji, można skorzystać z relacji Chaddocka:

Przykład 4. Dostępne są następujące dane na temat wykonywania prac przez organizacje projektujące i badawcze o różnych formach własności:

Określić:

1) wariancja całkowita;

2) wariancje grupowe;

3) średnia wariancji grupowych;

4) wariancja międzygrupowa;

5) wariancja całkowita na podstawie reguły dodawania wariancji;


6) współczynnik determinacji i współczynnik korelacji empirycznej.

Wyciągać wnioski.

Rozwiązanie:

1. Określmy średni wolumen pracy wykonany przez przedsiębiorstwa dwóch form własności:

Obliczmy całkowitą wariancję:

2. Określ średnie grupowe:

milion rubli;

milion rubli

Wariancje grupowe:

;

3. Oblicz średnią wariancji grupowych:

4. Wyznaczmy wariancję międzygrupową:

5. Oblicz wariancję całkowitą w oparciu o regułę dodawania wariancji:

6. Wyznaczmy współczynnik determinacji:

.

Zatem ilość pracy wykonanej przez organizacje projektowe i badawcze zależy o 22% od formy własności przedsiębiorstw.

Empiryczny współczynnik korelacji oblicza się ze wzoru

.

Wartość obliczonego wskaźnika wskazuje, że zależność wielkości pracy od formy własności przedsiębiorstwa jest niewielka.

Przykład 5. W wyniku badania dyscypliny technologicznej obszarów produkcyjnych uzyskano następujące dane:

Wyznacz współczynnik determinacji

ObliczmySMPRZEWYŻSZAĆwariancja próbki i odchylenie standardowe. Obliczymy także wariancję zmiennej losowej, jeśli znany jest jej rozkład.

Najpierw rozważmy dyspersja, Następnie odchylenie standardowe.

Odchylenie próbki

Odchylenie próbki (wariancja próbki,próbkazmienność) charakteryzuje rozrzut wartości w tablicy względem .

Wszystkie 3 wzory są matematycznie równoważne.

Z pierwszego wzoru wynika, że wariancja próbki jest sumą kwadratów odchyleń każdej wartości w tablicy od średniej podzielone przez wielkość próby minus 1.

odchylenia próbki używana jest funkcja DISP(), angielski. nazwa VAR, tj. Zmienność. Od wersji MS EXCEL 2010 zaleca się stosowanie jej analogu DISP.V(), w języku angielskim. nazwa VARS, tj. Przykładowa zmienność. Dodatkowo począwszy od wersji MS EXCEL 2010 dostępna jest funkcja DISP.Г(), w języku angielskim. nazwa VARP, tj. Wariancja populacji, która oblicza dyspersja Dla populacja. Cała różnica sprowadza się do mianownika: zamiast n-1, jak DISP.V(), DISP.G() ma w mianowniku tylko n. Przed wersją MS EXCEL 2010 do obliczania wariancji populacji używano funkcji VAR().

Odchylenie próbki
=QUADROTCL(Próbka)/(LICZBA(Próbka)-1)
=(SUMA(Próbka)-LICZBA(Próbka)*ŚREDNIA(Próbka)^2)/ (LICZBA(Próbka)-1)– zwykła formuła
=SUMA((Próbka -ŚREDNIA(Próbka))^2)/ (LICZBA(Próbka)-1) –

Odchylenie próbki jest równy 0, tylko wtedy, gdy wszystkie wartości są sobie równe i odpowiednio równe średnia wartość. Zwykle im większa wartość odchylenia, tym większy jest rozrzut wartości w tablicy.

Odchylenie próbki jest oceną punktową odchylenia rozkład zmiennej losowej, z której został utworzony próbka. O budowie przedziały ufności podczas oceniania odchylenia można przeczytać w artykule.

Wariancja zmiennej losowej

Aby obliczyć dyspersja zmienna losowa, musisz ją znać.

Dla odchylenia zmienna losowa X jest często oznaczana jako Var(X). Dyspersja równy kwadratowi odchylenia od średniej E(X): Var(X)=E[(X-E(X)) 2 ]

dyspersja obliczane według wzoru:

gdzie x i to wartość, jaką może przyjąć zmienna losowa, a μ to wartość średnia (), p(x) to prawdopodobieństwo, że zmienna losowa przyjmie wartość x.

Jeśli zmienna losowa ma , to dyspersja obliczane według wzoru:

Wymiar odchylenia odpowiada kwadratowi jednostki miary wartości pierwotnych. Na przykład, jeśli wartości w próbce reprezentują pomiary masy części (w kg), wówczas wymiarem wariancji będzie kg 2 . Może to być trudne do zinterpretowania, aby scharakteryzować rozrzut wartości, wartość równą pierwiastkowi kwadratowemu odchyleniaodchylenie standardowe.

Niektóre właściwości odchylenia:

Var(X+a)=Var(X), gdzie X jest zmienną losową, a a jest stałą.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ta właściwość dyspersji jest wykorzystywana w artykuł o regresji liniowej.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), gdzie X i Y to zmienne losowe, Cov(X;Y) to kowariancja tych zmiennych losowych.

Jeśli zmienne losowe są niezależne, to tak kowariancja jest równe 0, a zatem Var(X+Y)=Var(X)+Var(Y). Ta właściwość dyspersji jest wykorzystywana w wyprowadzaniu.

Pokażmy, że dla wielkości niezależnych Var(X-Y)=Var(X+Y). Rzeczywiście, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Ta właściwość dyspersji służy do konstruowania .

Przykładowe odchylenie standardowe

Przykładowe odchylenie standardowe jest miarą tego, jak bardzo rozproszone są wartości w próbce w stosunku do ich wartości.

Z definicji odchylenie standardowe równy pierwiastkowi kwadratowemu z odchylenia:

Odchylenie standardowe nie bierze pod uwagę wielkości wartości w próbka, a jedynie stopień rozproszenia wartości wokół nich przeciętny. Aby to zilustrować, podamy przykład.

Obliczmy odchylenie standardowe dla 2 próbek: (1; 5; 9) i (1001; 1005; 1009). W obu przypadkach s=4. Oczywiste jest, że stosunek odchylenia standardowego do wartości tablicowych próbek jest znacząco różny. W takich przypadkach się go stosuje Współczynnik zmienności(Współczynnik zmienności, CV) - stosunek Odchylenie standardowe do średniej arytmetyka, wyrażona w procentach.

W MS EXCEL 2007 i wcześniejszych wersjach do obliczeń Przykładowe odchylenie standardowe używana jest funkcja =STDEVAL(), angielski. nazwa STDEV, tj. Odchylenie standardowe. Od wersji MS EXCEL 2010 zaleca się stosowanie jego odpowiednika =STDEV.B() , angielskiego. nazwa STDEV.S, tj. Przykładowe odchylenie standardowe.

Dodatkowo począwszy od wersji MS EXCEL 2010 dostępna jest funkcja STANDARDEV.G(), angielska. nazwa STDEV.P, tj. Odchylenie standardowe populacji, które oblicza odchylenie standardowe Dla populacja. Cała różnica sprowadza się do mianownika: zamiast n-1 jak w STANDARDEV.V(), STANDARDEVAL.G() ma w mianowniku tylko n.

Odchylenie standardowe można również obliczyć bezpośrednio za pomocą poniższych wzorów (patrz przykładowy plik)
=ROOT(QUADROTCL(próbka)/(LICZBA(próbka)-1))
=ROOT((SUMA(Próbka)-LICZ(Próbka)*ŚREDNIA(Próbka)^2)/(LICZBA(Próbka)-1))

Inne miary rozproszenia

Funkcja SQUADROTCL() wykonuje obliczenia za pomocą suma kwadratów odchyleń wartości od ich przeciętny. Ta funkcja zwróci taki sam wynik jak formuła =DISP.G( Próbka)*SPRAWDZAĆ( Próbka) , Gdzie Próbka- odwołanie do zakresu zawierającego tablicę przykładowych wartości (). Obliczenia w funkcji QUADROCL() wykonujemy według wzoru:

Funkcja SROTCL() jest także miarą rozproszenia zbioru danych. Funkcja SROTCL() oblicza średnią z wartości bezwzględnych odchyleń wartości od przeciętny. Ta funkcja zwróci taki sam wynik jak formuła =SUMAPRODUKT(ABS(Próbka-ŚREDNIA(Próbka)))/LICZBA(Próbka), Gdzie Próbka- link do zakresu zawierającego tablicę przykładowych wartości.

Obliczenia w funkcji SROTCL() wykonujemy według wzoru:

.

I odwrotnie, jeśli jest nieujemnym a.e. funkcjonować tak, że , to istnieje absolutnie ciągła miara prawdopodobieństwa taka, że ​​jest to jej gęstość.

    Zastąpienie miary w całce Lebesgue’a:

,

gdzie jest dowolną funkcją borelową, która jest całkowalna względem miary prawdopodobieństwa.

Dyspersja, rodzaje i właściwości dyspersji. Pojęcie dyspersji

Rozproszenie w statystyce oblicza się jako odchylenie standardowe poszczególnych wartości cechy do kwadratu od średniej arytmetycznej. W zależności od danych początkowych wyznacza się ją za pomocą prostych i ważonych wzorów na wariancję:

1. Prosta różnica(dla danych niezgrupowanych) oblicza się ze wzoru:

2. Wariancja ważona (dla serii zmian):

gdzie n to częstotliwość (powtarzalność współczynnika X)

Przykład znajdowania wariancji

Na tej stronie opisano standardowy przykład znajdowania wariancji. Możesz także przyjrzeć się innym problemom związanym ze znalezieniem wariancji

Przykład 1. Wyznaczanie wariancji grupowej, średniej grupowej, międzygrupowej i całkowitej

Przykład 2. Znajdowanie wariancji i współczynnika zmienności w tabeli grupującej

Przykład 3. Znajdowanie wariancji w szeregu dyskretnym

Przykład 4. Poniższe dane są dostępne dla grupy 20 studentów korespondencyjnych. Należy skonstruować szereg przedziałowy rozkładu cechy, obliczyć średnią wartość cechy i zbadać jej rozproszenie

Zbudujmy grupowanie interwałowe. Wyznaczmy zakres przedziału korzystając ze wzoru:

gdzie X max jest maksymalną wartością cechy grupującej; X min – minimalna wartość cechy grupującej; n – liczba przedziałów:

Przyjmujemy n=5. Krok wynosi: h = (192 - 159)/ 5 = 6,6

Utwórzmy grupowanie interwałowe

Do dalszych obliczeń zbudujemy tabelę pomocniczą:

X"i – środek przedziału. (np. środek przedziału 159 – 165,6 = 162,3)

Średni wzrost uczniów określamy za pomocą wzoru na średnią ważoną arytmetyczną:

Wyznaczmy wariancję korzystając ze wzoru:

Formułę można przekształcić w następujący sposób:

Z tego wzoru wynika, że wariancja jest równa różnica między średnią kwadratów opcji a kwadratem i średnią.

Dyspersja w szeregach wariacyjnych o równych odstępach metodą momentów można obliczyć w następujący sposób, korzystając z drugiej właściwości dyspersji (dzielenie wszystkich opcji przez wartość przedziału). Określanie wariancji, obliczony metodą momentów, zastosowanie poniższego wzoru jest mniej pracochłonne:

gdzie i jest wartością przedziału; A jest konwencjonalnym zerem, dla którego wygodnie jest użyć środka przedziału o najwyższej częstotliwości; m1 jest kwadratem momentu pierwszego rzędu; m2 - moment drugiego rzędu

Alternatywna wariancja cechy (jeżeli w populacji statystycznej cecha zmienia się w taki sposób, że istnieją tylko dwie wzajemnie wykluczające się opcje, to taką zmienność nazywamy alternatywną) można obliczyć ze wzoru:

Podstawiając q = 1- p do tego wzoru na dyspersję, otrzymujemy:

Rodzaje wariancji

Całkowita rozbieżność mierzy zmienność cechy w całej populacji jako całości pod wpływem wszystkich czynników powodujących tę zmienność. Jest równy średniemu kwadratowi odchyleń poszczególnych wartości cechy x od ogólnej średniej wartości x i można go zdefiniować jako wariancję prostą lub wariancję ważoną.

Wariancja wewnątrzgrupowa charakteryzuje się zmiennością losową, tj. część zmienności, która wynika z wpływu nieuwzględnionych czynników i nie zależy od atrybutu czynnika, który stanowi podstawę grupy. Rozrzut taki jest równy średniemu kwadratowi odchyleń poszczególnych wartości atrybutu w obrębie grupy X od średniej arytmetycznej grupy i można go obliczyć jako rozproszenie proste lub rozproszenie ważone.

Zatem, miary wariancji wewnątrzgrupowej zmienność cechy w obrębie grupy i określa się ją według wzoru:

gdzie xi jest średnią grupy; ni to liczba jednostek w grupie.

Na przykład wariancje wewnątrzgrupowe, które należy określić w zadaniu badania wpływu kwalifikacji pracowników na poziom wydajności pracy w warsztacie, pokazują zróżnicowanie wydajności w każdej grupie spowodowane wszystkimi możliwymi czynnikami (stan techniczny sprzętu, dostępność narzędzia i materiały, wiek pracowników, pracochłonność itp.), z wyjątkiem różnic w kategorii kwalifikacji (w obrębie grupy wszyscy pracownicy mają takie same kwalifikacje).

Średnia wariancji wewnątrzgrupowych odzwierciedla wariancję losową, czyli tę część wariancji, która wystąpiła pod wpływem wszystkich pozostałych czynników, z wyjątkiem czynnika grupującego. Oblicza się go za pomocą wzoru:

Wariancja międzygrupowa charakteryzuje systematyczną zmienność wynikowej cechy, która wynika z wpływu czynnika-atrybutu, który stanowi podstawę grupy. Jest równy średniemu kwadratowi odchyleń średnich grupowych od średniej ogólnej. Wariancję międzygrupową oblicza się za pomocą wzoru:

Dyspersjazmienna losowa- miara rozprzestrzeniania się danego zmienna losowa, czyli ona odchylenia od oczekiwań matematycznych. W statystyce do oznaczenia dyspersji często używa się zapisu (sigma kwadrat). Nazywa się pierwiastek kwadratowy z wariancji równej odchylenie standardowe lub standardowy spread. Odchylenie standardowe mierzy się w tych samych jednostkach, co sama zmienna losowa, a wariancję mierzy się w kwadratach tej jednostki.

Chociaż bardzo wygodnie jest używać tylko jednej wartości (takiej jak średnia lub moda i mediana) do oszacowania całej próby, podejście to może łatwo prowadzić do błędnych wniosków. Przyczyną tej sytuacji nie jest sama wartość, ale fakt, że jedna wartość w żaden sposób nie odzwierciedla rozrzutu wartości danych.

Na przykład w próbce:

średnia wartość wynosi 5.

Jednak w samej próbie nie ma ani jednego elementu o wartości 5. Być może będziesz musiał znać stopień bliskości każdego elementu w próbie do jego wartości średniej. Innymi słowy, będziesz musiał znać wariancję wartości. Znając stopień zmiany danych, można lepiej je zinterpretować średnia wartość, mediana I moda. Stopień zmiany wartości próbek określa się poprzez obliczenie ich wariancji i odchylenia standardowego.



Wariancja i pierwiastek kwadratowy wariancji, zwane odchyleniem standardowym, charakteryzują średnie odchylenie od średniej próbki. Spośród tych dwóch wielkości najważniejsza jest odchylenie standardowe. Wartość tę można traktować jako średnią odległość elementów od środkowego elementu próbki.

Wariancję trudno jest sensownie zinterpretować. Jednak pierwiastek kwadratowy tej wartości jest odchyleniem standardowym i można go łatwo zinterpretować.

Odchylenie standardowe oblicza się, najpierw określając wariancję, a następnie obliczając pierwiastek kwadratowy z wariancji.

Przykładowo dla tablicy danych pokazanej na rysunku zostaną uzyskane następujące wartości:

Rysunek 1

Tutaj średnia wartość kwadratów różnic wynosi 717,43. Aby uzyskać odchylenie standardowe, pozostaje tylko wyciągnąć pierwiastek kwadratowy z tej liczby.

Wynik wyniesie około 26,78.

Pamiętaj, że odchylenie standardowe jest interpretowane jako średnia odległość pozycji od średniej próbki.

Odchylenie standardowe mierzy, jak dobrze średnia opisuje całą próbkę.

Załóżmy, że jesteś szefem działu produkcji montażu komputerów PC. Z raportu kwartalnego wynika, że ​​produkcja w ostatnim kwartale wyniosła 2500 komputerów osobistych. Czy to dobrze czy źle? Prosiłeś (lub istnieje już ta kolumna w raporcie) o wyświetlenie odchylenia standardowego dla tych danych w raporcie. Wartość odchylenia standardowego wynosi na przykład 2000. Dla Ciebie, jako kierownika działu, staje się jasne, że linia produkcyjna wymaga lepszego zarządzania (zbyt duże odchylenia w liczbie zmontowanych komputerów).

Przypomnijmy, że gdy odchylenie standardowe jest duże, dane są szeroko rozproszone wokół średniej, a gdy odchylenie standardowe jest małe, skupiają się blisko średniej.

Cztery funkcje statystyczne VAR(), VAR(), STDEV() i STDEV() służą do obliczania wariancji i odchylenia standardowego liczb w zakresie komórek. Zanim będzie można obliczyć wariancję i odchylenie standardowe zbioru danych, należy określić, czy dane reprezentują populację, czy próbkę populacji. W przypadku próby z populacji ogólnej należy skorzystać z funkcji VAR() i STDEV(), a w przypadku populacji ogólnej z funkcji VAR() i STDEV():

Populacja Funkcjonować

ROZŚWIEŻ()

STANDOTLONP()
Próbka

WYŚW()

Odchylenie standardowe()

Rozproszenie (a także odchylenie standardowe), jak zauważyliśmy, wskazuje, w jakim stopniu wartości zawarte w zbiorze danych są rozproszone wokół średniej arytmetycznej.

Mała wartość wariancji lub odchylenia standardowego wskazuje, że wszystkie dane skupiają się wokół średniej arytmetycznej, natomiast duża wartość tych wartości wskazuje, że dane są rozproszone w szerokim zakresie wartości.

Rozproszenie jest dość trudne do sensownej interpretacji (co oznacza mała wartość, duża wartość?). Wykonanie Zadania 3 pozwoli Ci wizualnie pokazać na wykresie znaczenie wariancji dla zbioru danych.

Zadania

· Zadanie 1.

· 2.1. Podaj pojęcia: dyspersja i odchylenie standardowe; ich symboliczne oznaczenie do przetwarzania danych statystycznych.

· 2.2. Uzupełnij arkusz zgodnie z rysunkiem 1 i wykonaj niezbędne obliczenia.

· 2.3. Podaj podstawowe wzory stosowane w obliczeniach

· 2.4. Wyjaśnij wszystkie oznaczenia ( , , )

· 2.5. Wyjaśnij praktyczne znaczenie pojęć dyspersja i odchylenie standardowe.

Zadanie 2.

1.1. Podaj pojęcia: populacja ogólna i próba; oczekiwanie matematyczne i ich średnia arytmetyczna, symboliczne oznaczenie do przetwarzania danych statystycznych.

1.2. Zgodnie z rysunkiem 2 przygotuj arkusz kalkulacyjny i wykonaj obliczenia.

1.3. Podaj podstawowe wzory stosowane w obliczeniach (dla populacji ogólnej i próby).

Rysunek 2

1.4. Wyjaśnij, dlaczego możliwe jest uzyskanie w próbkach takich średnich arytmetycznych jak 46,43 i 48,78 (patrz załącznik). Wyciągać wnioski.

Zadanie 3.

Istnieją dwie próbki z różnymi zestawami danych, ale średnia dla nich będzie taka sama:

Rysunek 3

3.1. Uzupełnij arkusz zgodnie z rysunkiem 3 i wykonaj niezbędne obliczenia.

3.2. Podaj podstawowe wzory obliczeniowe.

3.3. Zbuduj wykresy zgodnie z rysunkami 4, 5.

3.4. Wyjaśnij otrzymane zależności.

3.5. Podobne obliczenia wykonaj dla danych dwóch próbek.

Oryginalna próbka 11119999

Wybierz wartości drugiej próbki tak, aby średnia arytmetyczna dla drugiej próbki była taka sama, na przykład:

Sam wybierz wartości dla drugiej próbki. Ułóż obliczenia i wykresy analogicznie do rysunków 3, 4, 5. Pokaż podstawowe wzory, które zostały użyte w obliczeniach.

Wyciągnij odpowiednie wnioski.

Przygotuj wszystkie zadania w formie raportu zawierającego wszystkie niezbędne zdjęcia, wykresy, wzory i krótkie objaśnienia.

Uwaga: budowę wykresów należy objaśnić rysunkami i krótkimi objaśnieniami.



Ten artykuł jest również dostępny w następujących językach: tajski

  • Następny

    DZIĘKUJĘ bardzo za bardzo przydatne informacje zawarte w artykule. Wszystko jest przedstawione bardzo przejrzyście. Wydaje się, że włożono dużo pracy w analizę działania sklepu eBay

    • Dziękuję Tobie i innym stałym czytelnikom mojego bloga. Bez Was nie miałbym wystarczającej motywacji, aby poświęcić dużo czasu na utrzymanie tej witryny. Mój mózg jest zbudowany w ten sposób: lubię kopać głęboko, systematyzować rozproszone dane, próbować rzeczy, których nikt wcześniej nie robił i nie patrzył na to z tej perspektywy. Szkoda, że ​​nasi rodacy nie mają czasu na zakupy w serwisie eBay ze względu na kryzys w Rosji. Kupują na Aliexpress z Chin, ponieważ towary tam są znacznie tańsze (często kosztem jakości). Ale aukcje internetowe eBay, Amazon i ETSY z łatwością zapewnią Chińczykom przewagę w zakresie artykułów markowych, przedmiotów vintage, przedmiotów ręcznie robionych i różnych towarów etnicznych.

      • Następny

        W Twoich artykułach cenne jest osobiste podejście i analiza tematu. Nie rezygnuj z tego bloga, często tu zaglądam. Takich powinno być nas dużo. Wyślij mi e-mail Niedawno otrzymałem e-mail z ofertą, że nauczą mnie handlu na Amazon i eBay.

  • Przypomniałem sobie Twoje szczegółowe artykuły na temat tych zawodów. obszar Przeczytałem wszystko jeszcze raz i doszedłem do wniosku, że te kursy to oszustwo. Jeszcze nic nie kupiłem na eBayu. Nie jestem z Rosji, ale z Kazachstanu (Ałmaty). Ale nie potrzebujemy jeszcze żadnych dodatkowych wydatków.
    Życzę powodzenia i bezpiecznego pobytu w Azji.