Enakovreden pristop k razlagi rezultatov testa bi bil domneva, da je ničelna hipoteza resnična, lahko izračunamo, kako velika verjetnost dobiti t- merilo, ki je enako ali večje od realne vrednosti, ki smo jo izračunali iz razpoložljivih vzorčnih podatkov. Če se izkaže, da je ta verjetnost manjša od predhodno sprejete ravni pomembnosti (na primer P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Recimo, da imamo podatke o dnevnem vnosu energije s hrano (kJ/dan) za 11 žensk (primer iz knjige Altman D. G. (1981) Praktična statistika za medicinske raziskave, Chapman & Hall, London):


Povprečje teh 11 opazovanj je:


Vprašanje: Ali se povprečje tega vzorca razlikuje od uveljavljene norme 7725 kJ/dan? Razlika med našo vrednostjo vzorca in tem standardom je precejšnja: 7725 - 6753,6 = 971,4. Kako velika pa je ta razlika statistično? En sam vzorec bo pomagal odgovoriti na to vprašanje. t-test. Tako kot druge možnosti t-test se v R izvede t test z enim vzorcem s funkcijo t.test():


Vprašanje: Ali se ta povprečja statistično razlikujejo? Preverimo hipotezo, da ni razlike z uporabo t-test:

Toda kako lahko v takih primerih statistično ocenimo prisotnost učinka posega? Na splošno lahko Studentov t-test predstavimo kot

​ Studentov t-test je splošno ime za razred metod za statistično preverjanje hipotez (statistični testi) na podlagi Studentove porazdelitve. Najpogostejša uporaba t-testa vključuje testiranje enakosti srednjih vrednosti v dveh vzorcih.

1. Zgodovina razvoja t-testa

To merilo je bilo razvito William Gossett oceniti kakovost piva v podjetju Guinness. Zaradi obveznosti do podjetja glede nerazkrivanja poslovnih skrivnosti je bil Gossetov članek leta 1908 objavljen v reviji Biometrics pod psevdonimom "Student".

2. Za kaj se uporablja Studentov t-test?

Za ugotavljanje statistične pomembnosti razlik v povprečjih se uporablja Studentov t test. Lahko se uporablja tako v primerih primerjave neodvisnih vzorcev ( na primer skupine diabetikov in zdrave skupine) in pri primerjavi sorodnih populacij ( na primer povprečni srčni utrip pri istih bolnikih pred in po jemanju antiaritmičnega zdravila).

3. V katerih primerih se lahko uporabi Studentov t-test?

Za uporabo Studentovega t-testa je potrebno imeti originalne podatke normalna porazdelitev. V primeru uporabe dvovzorčnega kriterija za neodvisne vzorce je treba izpolniti tudi pogoj enakost (homoskedastičnost) varianc.

Če ti pogoji niso izpolnjeni, je treba pri primerjavi vzorčnih povprečij uporabiti podobne metode. neparametrične statistike, med katerimi so najbolj znani Mann-Whitneyjev U test(kot dvovzorčni test za neodvisne vzorce) in merilo znaka in Wilcoxonov test(uporablja se v primerih odvisnih vzorcev).

4. Kako izračunati Studentov t-test?

Za primerjavo povprečnih vrednosti se Studentov t-test izračuna po naslednji formuli:

kje M 1- aritmetična sredina prve primerjane populacije (skupine), M 2- aritmetična sredina druge primerjane populacije (skupine), m 1- povprečna napaka prve aritmetične sredine, m 2- povprečna napaka druge aritmetične sredine.

5. Kako interpretirati vrednost Studentovega t-testa?

Dobljeno vrednost Studentovega t-testa je treba pravilno interpretirati. Da bi to naredili, moramo poznati število subjektov v vsaki skupini (n 1 in n 2). Iskanje števila prostostnih stopinj f po naslednji formuli:

f = (n 1 + n 2) - 2

Po tem določimo kritično vrednost Studentovega t-testa za zahtevano stopnjo pomembnosti (na primer p = 0,05) in za dano število prostostnih stopinj. f po tabeli ( glej spodaj).

Primerjamo kritične in izračunane vrednosti merila:

  • Če je izračunana vrednost Studentovega t-testa enako ali večje kritične, ugotovljene iz tabele, sklepamo, da so razlike med primerjanimi vrednostmi statistično značilne.
  • Če vrednost izračunanega Studentovega t-testa manj tabelarno, kar pomeni, da razlike med primerjanimi vrednostmi niso statistično pomembne.

6. Primer izračuna Studentovega t-testa

Za proučevanje učinkovitosti novega pripravka železa sta bili izbrani dve skupini bolnikov z anemijo. V prvi skupini so bolniki dva tedna prejemali novo zdravilo, v drugi skupini pa placebo. Po tem so izmerili raven hemoglobina v periferni krvi. V prvi skupini je bila povprečna raven hemoglobina 115,4±1,2 g/l, v drugi skupini pa 103,7±2,3 g/l (podatki so predstavljeni v obliki M±m), primerjane populacije imajo normalno porazdelitev. Število prve skupine je bilo 34, druge pa 40 bolnikov. Treba je sklepati o statistični pomembnosti dobljenih razlik in učinkovitosti novega pripravka železa.

rešitev: Za oceno pomembnosti razlik uporabljamo Studentov t-test, izračunan kot razlika srednjih vrednosti, deljena z vsoto kvadratov napak:

Po izvedbi izračunov se je izkazalo, da je vrednost t-testa 4,51. Število prostostnih stopinj najdemo kot (34 + 40) - 2 = 72. Dobljeno vrednost Studentovega t-testa 4,51 primerjamo s kritično vrednostjo pri p = 0,05, navedeno v tabeli: 1,993. Ker je izračunana vrednost kriterija večja od kritične vrednosti, sklepamo, da so opažene razlike statistično značilne (stopnja pomembnosti p<0,05).

Metoda vam omogoča, da preizkusite hipotezo, da so povprečne vrednosti dveh splošnih populacij, iz katerih so izluščene primerjane odvisen izbori se med seboj razlikujejo. Predpostavka o odvisnosti največkrat pomeni, da se lastnost na istem vzorcu meri dvakrat, na primer pred posegom in po njem. V splošnem primeru je vsakemu predstavniku enega vzorca dodeljen predstavnik iz drugega vzorca (združeni so v pare), tako da sta obe seriji podatkov med seboj pozitivno korelirani. Šibkejši tipi vzorčne odvisnosti: vzorec 1 - možje, vzorec 2 - njihove žene; vzorec 1 - enoletni otroci, vzorec 2 sestavljajo dvojčki otrok v vzorcu 1 itd.

Preverljiva statistična hipoteza, kot v prejšnjem primeru, H 0: M 1 = M 2(povprečne vrednosti v vzorcih 1 in 2 so enake). Če je zavrnjena, se sprejme alternativna hipoteza, da M 1 več (manj) M 2.

Začetne predpostavke za statistično testiranje:

Vsak predstavnik enega vzorca (iz ene splošne populacije) je povezan s predstavnikom drugega vzorca (iz druge splošne populacije);

Podatki iz obeh vzorcev so pozitivno korelirani (oblika parov);

Porazdelitev proučevane lastnosti v obeh vzorcih ustreza normalni zakonitosti.

Struktura izvornih podatkov: za vsak predmet (za vsak par) obstajata dve vrednosti proučevane lastnosti.

Omejitve: porazdelitev lastnosti v obeh vzorcih se ne sme bistveno razlikovati od običajne; podatki dveh meritev, ki ustrezata enemu in drugemu vzorcu, so v pozitivni korelaciji.

Alternative: Wilcoxonov T test, če se porazdelitev za vsaj en vzorec bistveno razlikuje od normalne; t-Studentov test za neodvisne vzorce - če podatki za dva vzorca ne korelirajo pozitivno.

Formula kajti empirična vrednost Studentovega t testa odraža dejstvo, da je enota analize razlik razlika (premik) vrednosti atributov za vsak par opazovanj. V skladu s tem se za vsakega od N parov vrednosti atributov najprej izračuna razlika d i = x 1 i - x 2 i.

kjer je M d povprečna razlika vrednosti; σ d - standardna deviacija razlik.

Primer izračuna:

Recimo, da je med preizkusom učinkovitosti usposabljanja vsakemu od 8 članov skupine zastavljeno vprašanje "Kako pogosto se vaše mnenje ujema z mnenjem skupine?" - dvakrat, pred in po treningu. Za odgovore je bila uporabljena 10-stopenjska lestvica: 1 - nikoli, 5 - polovično, 10 - vedno. Preizkušena je bila hipoteza, da bi se zaradi usposabljanja povečala konformistična samopodoba (želja biti kot drugi v skupini) udeležencev (α = 0,05). Izdelajmo tabelo za vmesne izračune (tabela 3).


Tabela 3

Aritmetična sredina za razliko M d = (-6)/8 = -0,75. Odštejte to vrednost od vsakega d (predzadnji stolpec tabele).

Formula za standardni odklon se razlikuje le po tem, da se v njej namesto X pojavi d. Nadomestimo vse potrebne vrednosti, dobimo:

σ d = = 0,886.

Korak 1. Izračunajte empirično vrednost kriterija z uporabo formule (3): povprečna razlika Md= -0,75; standardni odklon σ d = 0,886; t e = 2,39; df = 7.

Korak 2. Z uporabo tabele kritičnih vrednosti t-Studentovega kriterija določimo p-stopnjo pomembnosti. Za df = 7 je empirična vrednost med kritičnimi vrednostmi za r= 0,05 in p — 0,01. torej r< 0,05.

df R
0,05 0,01 0,001
2,365 3,499 5,408

Korak 3. Sprejmemo statistično odločitev in oblikujemo sklep. Statistična hipoteza o enakosti povprečnih vrednosti je zavrnjena. Zaključek: kazalnik samoocene konformnosti udeležencev se je po usposabljanju statistično značilno povečal (na stopnji pomembnosti str< 0,05).

Parametrične metode vključujejo primerjava varianc dveh vzorcev glede na kriterij F-Fisher. Včasih ta metoda vodi do dragocenih in smiselnih zaključkov, v primeru primerjave povprečij za neodvisne vzorce pa je primerjava varianc obvezno postopek.

Za izračun F em najti morate razmerje med variancama obeh vzorcev in tako, da je večja varianca v števcu, manjša pa v imenovalcu.

Primerjava varianc. Metoda omogoča testiranje hipoteze, da se variance obeh splošnih populacij, iz katerih so vzeti primerjani vzorci, med seboj razlikujejo. Preverjena statistična hipoteza H 0: σ 1 2 = σ 2 2 (varianca v vzorcu 1 je enaka varianci v vzorcu 2). Če je zavrnjena, se sprejme alternativna hipoteza, da je ena varianca večja od druge.

Začetne predpostavke: dva vzorca se naključno vzameta iz različnih populacij z normalno porazdelitvijo značilnosti, ki se proučuje.

Struktura izvornih podatkov: preučevana lastnost se meri v objektih (predmetih), od katerih vsak pripada enemu od dveh primerjanih vzorcev.

Omejitve: porazdelitve lastnosti v obeh vzorcih se bistveno ne razlikujejo od normalnih.

Alternativna metoda: Levenov test, katerega uporaba ne zahteva preverjanja predpostavke normalnosti (uporablja se v programu SPSS).

Formula za empirično vrednost Fisherjevega F testa:

(4)

kjer je σ 1 2 velika disperzija in σ 2 2 - manjša disperzija. Ker vnaprej ni znano, katera disperzija je večja, se za določitev p-nivoja uporabi le-ta Tabela kritičnih vrednosti za neusmerjene alternative.če F e > F Kp za ustrezno število prostostnih stopinj, torej r< 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Primer izračuna:

Otroci so dobili redne aritmetične naloge, po katerih so naključno izbrani polovici učencev povedali, da testa niso opravili, preostalim pa nasprotno. Vsakega otroka so nato vprašali, koliko sekund bi potrebovali za rešitev podobnega problema. Eksperimentator je izračunal razliko med časom klicanega otroka in rezultatom opravljene naloge (v sekundah). Pričakovati je bilo, da bo sporočilo o neuspehu povzročilo določeno pomanjkljivost v otrokovi samopodobi. Testirana hipoteza (na ravni α = 0,005) je bila, da varianca agregatne samopodobe ni odvisna od poročil o uspehu ali neuspehu (H 0: σ 1 2 = σ 2 2).

Pridobljeni so bili naslednji podatki:

Korak 1. Izračunajte empirično vrednost kriterija in število prostostnih stopinj z uporabo formul (4):

Korak 2. Glede na tabelo kritičnih vrednosti Fisherjevega f-merila za nesmerno alternative, za katere najdemo kritično vrednost df številka= 11; df vem= 11. Vendar obstaja kritična vrednost samo za df številka= 10 in df vem = 12. Večjega števila prostostnih stopinj ne moremo vzeti, zato vzamemo kritično vrednost za df številka= 10: Za r= 0,05 F Kp = 3,526; Za r= 0,01 F Kp = 5,418.

3. korak. Priprava statistične odločitve in smiselnega zaključka. Ker empirična vrednost presega kritično vrednost za r= 0,01 (še bolj pa za p = 0,05), potem je v tem primeru p< 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (str< 0,01). Posledično je po sporočilu o neuspehu neustreznost samopodobe višja kot po sporočilu o uspehu.

Študentov t testza neodvisne vzorce

Študentov t test ( t- Študentski test ali preprosto " t-test") se uporablja, če morate primerjati samo dve skupini kvantitativne značilnosti z normalno porazdelitvijo (poseben primer analize variance). Opomba: tega kriterija ni mogoče uporabiti pri primerjavi več skupin v parih; v tem primeru je treba uporabiti analizo variance. Napačna uporaba Studentovega t testa poveča verjetnost »razkritja« razlik, ki ne obstajajo. Na primer, namesto da bi več načinov zdravljenja priznali kot enako učinkovite (ali neučinkovite), je eno od njih razglašeno za boljše.

Dva dogodka imenujemo neodvisna, če pojav enega od njiju na noben način ne vpliva na pojav drugega. Podobno lahko dve zbirki imenujemo neodvisni, če lastnosti ene od njiju niso na noben način povezane z lastnostmi druge.

Primer izvedbe t-test v programu STATISTICA.

Ženske so v povprečju nižje od moških, vendar to ni posledica vpliva moških na ženske - gre za genetske značilnosti spola. Z uporabo t- S testom je treba preveriti, ali obstaja statistično pomembna razlika med srednjimi višinami v skupinah moških in žensk. (Za izobraževalne namene predpostavljamo, da podatki o višini sledijo normalni porazdelitvi in ​​zato t- velja test).

Slika 1. Primer oblikovanja podatkov za izvedbo t-

Bodite pozorni na to, kako so podatki oblikovani na sliki 1. Kot pri konstruiranju grafov, kot jeZaplet z brki oz Škatla z brki, sta v tabeli dve spremenljivki: ena od njiju je združevanje (Skupinska spremenljivka) (“Spol”) - vsebuje kode (mož in žena), ki programu omogočajo, da ugotovi kateri od podatkov o višini pripada kateri skupini; drugi - tako imenovani odvisna spremenljivka (Odvisna spremenljivka) (“Rast”) - vsebuje dejanske podatke, ki se analizirajo. Vendar pa pri izvajanjut-test za neodvisne vzorce v programu STATISTICA je možna še ena možnost zasnove - podatke za vsako od skupin (»moški« in »ženske«) lahko vnesete v ločene stolpce (slika 2).

Slika 2. Druga možnost za oblikovanje podatkov za izvedbo t- test neodvisnih vzorcev

Za izvedbo t-Za neodvisni test vzorcev morate narediti naslednje:

1-a. Zagonski modul t- testo z menija Statistika > Osnovna statistika/Tabele > t-test, samostojno, po skupinah(če je v podatkovni tabeli spremenljivka za združevanje, glejte sliko 3).

ALI

1-b. Zaženi modul t- testo z menija Statistika > Osnovna statistika/Tabele > t-test, neodvisen, po spremenljivkah(če so podatki vneseni v samostojne stolpce, glej sliko 4).

Spodaj je različica testa, v kateri je v podatkovni tabeli spremenljivka za združevanje.

2. V oknu, ki se odpre, kliknite gumb Spremenljivke in povejte programu, katere od spremenljivk tabele Preglednica je združevanje in ki je odvisno (sliki 5-6).

Slika 5. Izbira spremenljivk za vključitev t-test

Slika 6. Okno z notranjo izbrane spremenljivke za vodenje t-test

3. Pritisnite gumbPovzetek: T-testi.

Slika 7. Rezultati t-test za neodvisne vzorce

Posledično bo program izdelal delovni zvezekDelovni zvezek, ki vsebuje tabelo z rezultatit-test (slika 7 ). Ta tabela ima več stolpcev:

  • Zlobno(moški) - povprečna višina v skupini "Moški";
  • Zlobno(ženska) - povprečna višina v skupini "Ženske";
  • t- vrednost: vrednost izračunana s programom t- Študentski test;
  • df- število prostostnih stopenj;
  • p- verjetnost veljavnosti hipoteze, da se primerjane povprečne vrednosti ne razlikujejo. Pravzaprav je to najpomembnejši rezultat analize, saj je vrednost p pove, ali je hipoteza, ki se testira, resnična. V našem primeru je P > 0,05, iz česar lahko sklepamo, da med višino moških in žensk ni statistično značilnih razlik.
  • Velja N(moški) - velikost vzorca "Moški";
  • Velja N(ženske) - velikost vzorca “Ženske”;
  • Std. razv. (moški) - standardni odklon vzorca "Moški";
  • Std. razv. (ženske) - standardna deviacija vzorca »Ženske«;
  • F-razmerje, odstopanja- vrednost Fisherjevega F-testa, s pomočjo katerega se preverja hipoteza o enakosti varianc v primerjanih vzorcih;
  • P,Variance- verjetnost veljavnosti hipoteze, da se variance primerjanih vzorcev ne razlikujejo.

Preizkušanje statističnih hipotez nam omogoča močne sklepe o značilnostih populacije na podlagi vzorčnih podatkov. Obstajajo različne hipoteze. Ena izmed njih je hipoteza o povprečju (matematično pričakovanje). Njegovo bistvo je, da samo na podlagi razpoložljivega vzorca pravilno sklepamo o tem, kje se generalna havarija nahaja ali pa tudi ne (natančne resnice ne bomo nikoli izvedeli, lahko pa zožimo iskanje).

Splošni pristop k testiranju hipotez je bil opisan, zato preidimo takoj k bistvu. Najprej predpostavimo, da je vzorec vzet iz običajne populacije naključnih spremenljivk X s splošno havarijo μ in varianco σ 2(Vem, vem, da se to ne zgodi, ampak ne prekinjajte me!). Aritmetična sredina tega vzorca je očitno sama naključna spremenljivka. Če izvlečete veliko takih vzorcev in izračunate njihova povprečja, bodo imeli tudi matematično pričakovanje μ in

Nato naključna spremenljivka

Postavlja se vprašanje: ali bo splošno povprečje s 95% verjetnostjo znotraj ±1,96? s x̅. Z drugimi besedami, so porazdelitve naključnih spremenljivk

enakovreden.

To vprašanje je prvi postavil (in rešil) kemik, ki je delal v tovarni piva Guinness v Dublinu (Irska). Kemiku je bilo ime William Seely Gossett in vzel je vzorce piva za kemično analizo. V nekem trenutku so Williama očitno začeli mučiti nejasni dvomi o porazdelitvi povprečij. Izkazalo se je, da je malo bolj razmazan, kot bi morala biti običajna porazdelitev.

Ko je zbral matematično osnovo in izračunal vrednosti porazdelitvene funkcije, ki jo je odkril, je dublinski kemik William Gosset napisal opombo, ki je bila marca 1908 objavljena v številki revije Biometrics (glavni urednik - Karl Pearson). Ker Guinness je strogo prepovedal izdajanje pivovarskih skrivnosti; Gossett se je podpisoval s psevdonimom Student.

Kljub dejstvu, da je K. Pearson že izumil distribucijo, je splošna ideja normalnosti še vedno prevladovala. Nihče si ni mislil, da porazdelitev vzorčnih rezultatov morda ni normalna. Zato je ostal članek W. Gosseta praktično neopažen in pozabljen. In samo Ronald Fisher je cenil Gossetovo odkritje. Fischer je novo distribucijo uporabil pri svojem delu in ji dal ime Studentova t-razdelitev. Merilo za testiranje hipotez je v skladu s tem postalo Študentov t-test. Tako je prišlo do »revolucije« v statistiki, ki je zakorakala v dobo analize vzorčnih podatkov. To je bil kratek izlet v zgodovino.

Poglejmo, kaj je videl W. Gosset. Ustvarimo 20 tisoč normalnih vzorcev iz 6 opazovanj s povprečjem ( ) 50 in standardni odklon ( σ ) 10. Nato normaliziramo vzorčna sredstva z uporabo splošna varianca:

Dobljenih 20 tisoč povprečij bomo združili v intervale dolžine 0,1 in izračunali frekvence. Na diagramu ponazorimo dejansko (Norm) in teoretično (ENorm) frekvenčno porazdelitev vzorčnih povprečij.

Točke (opazovane frekvence) praktično sovpadajo s premico (teoretične frekvence). To je razumljivo, saj so podatki vzeti iz iste splošne populacije, razlike pa so zgolj vzorčne napake.

Izvedimo nov poskus. Povprečja normaliziramo z uporabo vzorčna varianca.

Ponovno preštejmo frekvence in jih na diagram narišemo v obliki točk, za primerjavo pa pustimo črto standardne normalne porazdelitve. Empirično pogostost povprečij označimo recimo s črko t.

Vidi se, da se razdelitve tokrat ne ujemajo preveč. Blizu, da, vendar ne isto. Repi so postali bolj "težki".

Gosset-Student sicer ni imel najnovejše različice MS Excela, vendar je opazil ravno ta učinek. Zakaj se to zgodi? Razlaga je, da naključna spremenljivka

ni odvisna samo od vzorčne napake (števec), ampak tudi od standardne napake sredine (imenovalec), ki je prav tako naključna spremenljivka.

Poglejmo malo, kakšno porazdelitev naj bi imela takšna naključna spremenljivka. Najprej se boste morali nekaj spomniti (ali naučiti) iz matematične statistike. Obstaja Fisherjev izrek, ki pravi, da v vzorcu iz normalne porazdelitve:

1. srednje in vzorčna varianca s 2 so neodvisne količine;

2. razmerje variance vzorca in populacije, pomnoženo s številom svobodnih stopenj, ima porazdelitev χ 2(hi-kvadrat) z enakim številom prostostnih stopinj, tj.

kje k– število prostostnih stopinj (v angleščini degrees of freedom (d.f.))

Številni drugi rezultati v statistiki normalnih modelov temeljijo na tem zakonu.

Vrnimo se k porazdelitvi povprečja. Razdelite števec in imenovalec izraza

na σ X̅. Dobimo

Števec je standardna normalna naključna spremenljivka (označujemo ξ (xi)). Izrazimo imenovalec iz Fisherjevega izreka.

Nato bo prvotni izraz prevzel obliko

To je tisto, kar je v splošni obliki (odnos Študent). Njegovo distribucijsko funkcijo lahko izpeljete neposredno, ker porazdelitvi obeh naključnih spremenljivk v tem izrazu sta znani. Pustimo to veselje matematikom.

Studentova funkcija t-distribucije ima formulo, ki je precej težko razumljiva, zato je nima smisla analizirati. Itak ga nihče ne uporablja, ker... verjetnosti so podane v posebnih tabelah Studentovih porazdelitev (včasih imenovanih tabele Studentovih koeficientov) ali pa so vključene v formule PC.

Torej, oboroženi s tem novim znanjem, lahko razumete uradno definicijo distribucije Student.
Naključna spremenljivka, za katero velja Studentova porazdelitev k prostostne stopnje je razmerje neodvisnih naključnih spremenljivk

kje ξ porazdeljeno po standardnem normalnem zakonu in χ 2 k uboga distribucijo χ 2 c k stopnje svobode.

Torej, Studentova t testna formula za aritmetično sredino

Poseben primer je študentski odnos

Iz formule in definicije sledi, da je porazdelitev Studentovega t-testa odvisna samo od števila prostostnih stopinj.

pri k> 30 t-test se praktično ne razlikuje od standardne normalne porazdelitve.

Za razliko od hi-kvadrata je t-test lahko enostranski ali dvostranski. Običajno uporabljajo dvostransko, ob predpostavki, da lahko pride do odstopanja v obe smeri od povprečja. Če pa problemski pogoj dovoljuje odstopanje le v eno smer, potem je smiselno uporabiti enostranski kriterij. To nekoliko poveča moč, ker... pri fiksni ravni pomembnosti se kritična vrednost rahlo približa ničli.

Pogoji za uporabo Studentovega t-testa

Kljub temu, da je Studentovo odkritje nekoč revolucioniralo statistiko, je t-test še vedno precej omejen v možnostih uporabe, saj izhaja iz predpostavke normalne porazdelitve izvirnih podatkov. Če podatki niso normalni (kar je običajno), potem t-test ne bo imel več Studentove porazdelitve. Vendar pa zaradi delovanja centralnega mejnega izreka povprečje tudi za nenormalne podatke hitro dobi zvonasto porazdelitev.

Upoštevajte na primer podatke, ki so močno nagnjeni v desno, kot je porazdelitev hi-kvadrat s 5 prostostnimi stopnjami.

Sedaj pa ustvarimo 20 tisoč vzorcev in opazujmo, kako se porazdelitev povprečij spreminja glede na njihov obseg.

Razlika je precej opazna pri majhnih vzorcih do 15-20 opazovanj. Potem pa hitro izgine. Tako nenormalnost porazdelitve seveda ni dobra, ni pa kritična.

Predvsem pa se t-test “boji” outlierjev, tj. nenormalna odstopanja. Vzemimo 20 tisoč običajnih vzorcev po 15 opazovanj in nekaterim od njih dodajmo en naključni izstop.

Slika se izkaže za mračno. Dejanske frekvence povprečij se zelo razlikujejo od teoretičnih. Uporaba t-distribucije v takšnih razmerah postane zelo tvegan podvig.

Tako je v ne zelo majhnih vzorcih (iz 15 opazovanj) t-test relativno odporen na nenormalno porazdelitev izvirnih podatkov. Toda odstopanja v podatkih močno izkrivljajo porazdelitev t-testa, kar lahko posledično povzroči napake v statističnem sklepanju, zato je treba nenormalna opazovanja odpraviti. Pogosto se iz vzorca odstranijo vse vrednosti, ki spadajo v ±2 standardna odstopanja od povprečja.

Primer testiranja hipoteze o matematičnem pričakovanju s Studentovim t-testom v MS Excelu

Excel ima več funkcij, povezanih s t-porazdelitvijo. Poglejmo jih.

STUDENT.DIST – “klasična” levostranska Studentova t-porazdelitev. Vnos je vrednost t-kriterija, število prostostnih stopinj in možnost (0 ali 1), ki določa, kaj je treba izračunati: gostoto ali vrednost funkcije. Na izhodu dobimo gostoto oziroma verjetnost, da bo naključna spremenljivka manjša od t-kriterija, določenega v argumentu.

STUDENT.DIST.2X – dvosmerna distribucija. Argument je absolutna vrednost (modulo) t-testa in število prostostnih stopinj. Posledično dobimo verjetnost, da dobimo enako ali celo večjo vrednost t-kriterija, tj. dejanska stopnja pomembnosti (p-raven).

STUDENT.DIST.PH – desnostranska t-porazdelitev. Torej, 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PH(2;5) = 0,05097. Če je t-test pozitiven, je posledična verjetnost p-raven.

STUDENT.INR – uporablja se za izračun levorepe inverzne t-porazdelitve. Argument je verjetnost in število prostostnih stopinj. Na izhodu dobimo vrednost t-kriterija, ki ustreza tej verjetnosti. Štetje verjetnosti je na levi strani. Zato levi rep zahteva samo stopnjo pomembnosti α , za desno pa 1 - α .

STUDENT.OBR.2X – inverzna vrednost za dvostransko Studentovo porazdelitev, tj. vrednost t-testa (modulo). Stopnja pomembnosti je prav tako dobavljena vhodu α . Le da tokrat štetje poteka z obeh strani hkrati, tako da je verjetnost porazdeljena na dva repa. Torej, STUDENT.ARV(1-0,025;5) = STUDENT.ARV.2X(0,05;5) = 2,57058

STUDENT.TEST je funkcija za preverjanje hipoteze o enakosti matematičnih pričakovanj v dveh vzorcih. Nadomesti kup računic, saj Dovolj je, da določite samo dva obsega s podatki in še nekaj parametrov. Izhod je na ravni p.

CONFIDENCE.STUDENT – izračun intervala zaupanja povprečja ob upoštevanju t-porazdelitve.

Oglejmo si ta primer usposabljanja. V podjetju cement pakirajo v vreče po 50 kg. Zaradi naključnosti je pri posamezni vreči dovoljeno odstopanje od pričakovane mase, vendar naj splošno povprečje ostane 50 kg. Oddelek za nadzor kakovosti je naključno stehtal 9 vrečk in dobil naslednje rezultate: povprečna teža ( ) je bila 50,3 kg, standardna deviacija ( s) – 0,5 kg.

Ali je ta rezultat skladen z ničelno hipotezo, da je splošno povprečje 50 kg? Z drugimi besedami, ali je možno dobiti takšen rezultat po naključju, če oprema deluje pravilno in proizvede povprečno polnjenje 50 kg? Če hipoteza ni zavrnjena, potem nastala razlika ustreza območju naključnih nihanj, če pa je hipoteza zavrnjena, je najverjetneje prišlo do napake v nastavitvah stroja, ki polni vrečke. Treba ga je preveriti in konfigurirati.

Kratek pogoj v splošno sprejetem zapisu izgleda takole.

H0: μ = 50 kg

H1: μ ≠ 50 kg

Obstaja razlog za domnevo, da porazdelitev polnjenja vreč sledi normalni porazdelitvi (ali se od nje ne razlikuje zelo). To pomeni, da lahko za preizkus hipoteze o matematičnem pričakovanju uporabite Studentov t-test. Naključna odstopanja se lahko pojavijo v katero koli smer, kar pomeni, da je potreben dvostranski t-test.

Najprej bomo uporabili predpotopna sredstva: ročni izračun t-kriterija in njegovo primerjavo s kritično vrednostjo tabele. Izračunani t-test:

Zdaj pa ugotovimo, ali dobljeno število presega kritično raven na ravni pomembnosti α = 0,05. Uporabimo Studentovo tabelo t-distribucije (na voljo v katerem koli učbeniku statistike).

Stolpci prikazujejo verjetnost desne strani porazdelitve, vrstice pa število prostostnih stopinj. Zanima nas dvostranski t-test s stopnjo pomembnosti 0,05, ki je enakovredna t-vrednosti za polovico ravni pomembnosti na desni: 1 - 0,05/2 = 0,975. Število prostostnih stopinj je velikost vzorca minus 1, tj. 9 - 1 = 8. Na presečišču najdemo tabelarno vrednost t-testa - 2,306. Če bi uporabili standardno normalno porazdelitev, bi bila kritična točka 1,96, tukaj pa je večja, ker T-porazdelitev v majhnih vzorcih je bolj sploščena.

Primerjajmo dejansko (1,8) in tabelarno vrednost (2,306). Izračunani kriterij se je izkazal za nižjega od tabelarnega. Posledično razpoložljivi podatki ne nasprotujejo hipotezi H 0, da je splošno povprečje 50 kg (vendar je tudi ne dokazujejo). To je vse, kar se lahko naučimo z uporabo tabel. Seveda lahko poskusite najti tudi p-nivo, vendar bo približno. In praviloma se za preverjanje hipotez uporablja p-raven. Zato se naslednjič premaknemo v Excel.

V Excelu ni pripravljene funkcije za izračun t-testa. Toda to ni strašljivo, saj je Studentova formula t-testa precej preprosta in jo je mogoče enostavno zgraditi kar v Excelovi celici.

Imamo enakega 1.8. Najprej poiščimo kritično vrednost. Vzamemo alfa 0,05, kriterij je dvostranski. Za dvostransko hipotezo STUDENT.OBR.2X potrebujemo inverzno t-porazdelitveno funkcijo.

Dobljena vrednost odreže kritično območje. Opazovani t-test vanjo ne spada, zato hipoteza ni zavrnjena.

Vendar je to enak način testiranja hipoteze z uporabo vrednosti tabele. Bolj informativno bi bilo izračunati p-nivo, tj. verjetnost, da dobimo opaženo ali celo večje odstopanje od povprečja 50 kg, če je ta hipoteza pravilna. Za dvostransko hipotezo STUDENT.DIST.2X boste potrebovali Studentovo distribucijsko funkcijo.

P-raven je 0,1096, kar je več od sprejemljive ravni pomembnosti 0,05 – hipoteze ne zavračamo. Toda zdaj lahko ocenimo stopnjo dokaza. Izkazalo se je, da je P-raven precej blizu ravni, ko je hipoteza zavrnjena, kar vodi v drugačna razmišljanja. Na primer, da je bil vzorec premajhen, da bi zaznali pomembno odstopanje.

Po določenem času naj se nadzorni oddelek ponovno odloči, da preveri, kako se vzdržuje standard polnjenja vrečk. Tokrat za večjo zanesljivost ni bilo izbranih 9, ampak 25 vrečk. Intuitivno je jasno, da se bo širjenje povprečja zmanjšalo, s tem pa se bodo povečale možnosti za odkrivanje napake v sistemu.

Recimo, da sta bili pridobljeni enaki vrednosti povprečja in standardnega odklona za vzorec kot prvič (50,3 oziroma 0,5). Izračunajmo t-test.


Kritična vrednost za 24 prostostnih stopinj in α = 0,05 je 2,064. Spodnja slika prikazuje, da t-test spada v območje zavrnitve hipoteze.

Ugotovimo lahko, da se z verjetnostjo zaupanja več kot 95% splošno povprečje razlikuje od 50 kg. Da bomo bolj prepričljivi, poglejmo p-nivo (zadnja vrstica v tabeli). Verjetnost, da dobimo povprečje z enakim ali še večjim odstopanjem od 50, če je hipoteza pravilna, je 0,0062 oziroma 0,62 %, kar je z eno samo meritvijo praktično nemogoče. Na splošno zavračamo hipotezo kot malo verjetno.

Izračun intervala zaupanja z uporabo Studentove t-distribucije

Druga statistična metoda je tesno povezana s testiranjem hipotez – izračun intervalov zaupanja. Če nastali interval vsebuje vrednost, ki ustreza ničelni hipotezi, potem je to enakovredno dejstvu, da ničelna hipoteza ni zavrnjena. V nasprotnem primeru se hipoteza zavrne z ustrezno stopnjo zaupanja. V nekaterih primerih analitiki sploh ne testirajo hipotez v klasični obliki, temveč le izračunajo intervale zaupanja. Ta pristop vam omogoča pridobivanje še več koristnih informacij.

Izračunajmo intervale zaupanja za povprečje za 9 in 25 opazovanj. Za to bomo uporabili Excelovo funkcijo CONFIDENT.STUDENT. Tukaj je, nenavadno, vse precej preprosto. Argumenti funkcije morajo navesti le stopnjo pomembnosti α , standardni odklon vzorca in velikost vzorca. Na izhodu dobimo polovično širino intervala zaupanja, to je vrednost, ki jo je treba postaviti na obe strani povprečja. Po izvedbi izračunov in risanju vizualnega diagrama dobimo naslednje.

Kot lahko vidite, pri vzorcu 9 opazovanj vrednost 50 spada v interval zaupanja (hipoteza ni zavrnjena), pri 25 opazovanjih pa ne spada v interval zaupanja (hipoteza je zavrnjena). Še več, pri poskusu s 25 vrečami lahko trdimo, da z verjetnostjo 97,5 % splošno povprečje presega 50,1 kg (spodnja meja intervala zaupanja je 50,094 kg). In to je zelo dragocena informacija.

Tako smo isti problem rešili na tri načine:

1. Uporaba starodavnega pristopa, primerjava izračunanih in tabelarnih vrednosti t-testa
2. Sodobnejši, z izračunom p-ravni, ki dodaja stopnjo zaupanja pri zavrnitvi hipoteze.
3. Še bolj informativen z izračunom intervala zaupanja in pridobitvijo minimalne vrednosti splošnega povprečja.

Pomembno je vedeti, da se t-test nanaša na parametrične metode, ker temelji na normalni porazdelitvi (ima dva parametra: povprečje in varianco). Zato je za njegovo uspešno uporabo pomembna vsaj približna normalnost začetnih podatkov in odsotnost izstopajočih vrednosti.

Na koncu predlagam ogled videoposnetka o tem, kako izvesti izračune, povezane s Studentovim t-testom v Excelu.



Ta članek je na voljo tudi v naslednjih jezikih: tajska

  • Naprej

    Najlepša HVALA za zelo koristne informacije v članku. Vse je predstavljeno zelo jasno. Zdi se, da je bilo z analizo delovanja trgovine eBay vloženega veliko dela

    • Hvala vam in ostalim rednim bralcem mojega bloga. Brez vas ne bi bil dovolj motiviran, da bi posvetil veliko časa vzdrževanju te strani. Moji možgani so tako zgrajeni: rad se poglabljam, sistematiziram razpršene podatke, preizkušam stvari, ki jih še nihče ni naredil ali pogledal s tega zornega kota. Škoda, da naši rojaki zaradi krize v Rusiji nimajo časa za nakupovanje na eBayu. Kupujejo pri Aliexpressu iz Kitajske, saj je tam blago veliko cenejše (pogosto na račun kakovosti). Toda spletne dražbe eBay, Amazon, ETSY bodo Kitajcem zlahka dale prednost pri ponudbi blagovnih znamk, vintage predmetov, ročno izdelanih predmetov in različnih etničnih izdelkov.

      • Naprej

        V vaših člankih je dragocen vaš osebni odnos in analiza teme. Ne opustite tega bloga, sem pogosto. Takšnih bi nas moralo biti veliko. Pošlji mi e-pošto Pred kratkim sem prejel e-pošto s ponudbo, da me bodo naučili trgovati na Amazonu in eBayu.

  • In spomnil sem se vaših podrobnih člankov o teh poslih. območje
    Še enkrat sem vse prebral in ugotovil, da so tečaji prevara. Ničesar še nisem kupil na eBayu. Nisem iz Rusije, ampak iz Kazahstana (Almaty). Ampak tudi dodatnih stroškov še ne potrebujemo.