Hypotézy sa testujú pomocou štatistickej analýzy. Štatistická významnosť sa zistí pomocou P-hodnoty, ktorá zodpovedá pravdepodobnosti danej udalosti za predpokladu, že niektoré tvrdenie (nulová hypotéza) je pravdivé. Ak je P-hodnota menšia ako špecifikovaná hladina štatistickej významnosti (zvyčajne 0,05), experimentátor môže bezpečne dospieť k záveru, že nulová hypotéza je nepravdivá a pristúpiť k zvažovaniu alternatívnej hypotézy. Pomocou Studentovho t testu môžete vypočítať P-hodnotu a určiť významnosť pre dva súbory údajov.

Kroky

Časť 1

Nastavenie experimentu

    Definujte svoju hypotézu. Prvým krokom pri hodnotení štatistickej významnosti je vybrať si otázku, na ktorú chcete odpovedať, a sformulovať hypotézu. Hypotéza je tvrdenie o experimentálnych údajoch, ich distribúcii a vlastnostiach. Pre každý experiment existuje nulová aj alternatívna hypotéza. Vo všeobecnosti budete musieť porovnať dva súbory údajov, aby ste zistili, či sú podobné alebo odlišné.

    • Nulová hypotéza (H 0) zvyčajne uvádza, že medzi dvoma súbormi údajov nie je žiadny rozdiel. Napríklad: tí študenti, ktorí si prečítajú látku pred vyučovaním, nedostanú vyššie známky.
    • Alternatívna hypotéza (H a) je opakom nulovej hypotézy a je to tvrdenie, ktoré je potrebné podložiť experimentálnymi údajmi. Napríklad: tí študenti, ktorí si prečítajú materiál pred vyučovaním, dostanú vyššie známky.
  1. Nastavte úroveň významnosti, aby ste určili, ako veľmi sa musí rozdelenie údajov líšiť od normálneho, aby sa považovalo za významný výsledok. Úroveň významnosti (nazývaná tiežα (\displaystyle \alpha )

    • -úroveň) je hranica, ktorú definujete pre štatistickú významnosť. Ak je P-hodnota menšia alebo rovná hladine významnosti, údaje sa považujú za štatisticky významné. Úroveň významnosti (nazývaná tiež Spravidla hladina významnosti (hodnota
    • ) sa považuje za 0,05, v takom prípade je pravdepodobnosť zistenia náhodného rozdielu medzi rôznymi súbormi údajov iba 5 %.
    • Ak chcete spoľahlivejšie výsledky, znížte P-hodnotu na 0,01. Vo výrobe sa zvyčajne používajú nižšie hodnoty P, keď je potrebné identifikovať chyby vo výrobkoch. V tomto prípade je potrebná vysoká spoľahlivosť, aby ste si boli istí, že všetky časti fungujú podľa očakávania.
    • Pre väčšinu experimentov s hypotézami je dostatočná hladina významnosti 0,05.
  2. Rozhodnite sa, ktoré kritérium použijete: jednostranné alebo obojstranné. Jedným z predpokladov v Studentovom t teste je, že údaje sú normálne rozložené. Normálne rozdelenie je krivka v tvare zvona s maximálnym počtom výsledkov v strede krivky. Študentov t-test je matematická metóda testovania údajov, ktorá vám umožňuje určiť, či údaje nespadajú mimo normálneho rozdelenia (viac, menej alebo v „koncoch“ krivky).

    • Ak si nie ste istí, či sú údaje nad alebo pod hodnotami kontrolnej skupiny, použite obojstranný test. To vám umožní určiť význam v oboch smeroch.
    • Ak viete, ktorým smerom môžu údaje spadať mimo normálneho rozdelenia, použite jednostranný test. Vo vyššie uvedenom príklade očakávame, že sa známky žiakov zvýšia, takže možno použiť jednostranný test.
  3. Určte veľkosť vzorky pomocou štatistickej sily.Štatistická sila štúdie je pravdepodobnosť, že pri danej veľkosti vzorky sa získa očakávaný výsledok. Bežný prah výkonu (alebo β) je 80 %. Analýza štatistickej sily bez akýchkoľvek predchádzajúcich údajov môže byť náročná, pretože sa vyžadujú určité informácie o očakávaných priemeroch v každej skupine údajov a ich štandardných odchýlkach. Na určenie optimálnej veľkosti vzorky pre vaše údaje použite online kalkulačku analýzy výkonu.

    • Výskumníci zvyčajne vykonávajú malú pilotnú štúdiu, ktorá poskytuje údaje pre štatistickú analýzu sily a určuje veľkosť vzorky potrebnú pre väčšiu a úplnejšiu štúdiu.
    • Ak nemôžete vykonať pilotnú štúdiu, skúste odhadnúť možné priemery na základe literatúry a výsledkov iných ľudí. To vám môže pomôcť určiť optimálnu veľkosť vzorky.

    Časť 2

    Vypočítajte smerodajnú odchýlku
    1. Napíšte vzorec pre štandardnú odchýlku. Smerodajná odchýlka ukazuje, aký veľký rozptyl je v údajoch. Umožňuje vám urobiť záver, ako blízko sú údaje získané z určitej vzorky. Vzorec sa na prvý pohľad zdá dosť komplikovaný, no vysvetlenia nižšie vám pomôžu pochopiť ho. Vzorec je nasledujúci: s = √∑((x i – µ) 2 /(N – 1)).

      • s - smerodajná odchýlka;
      • znamienko ∑ znamená, že by sa mali doplniť všetky údaje získané zo vzorky;
      • x i zodpovedá i-tej hodnote, to znamená samostatnému získanému výsledku;
      • µ je priemerná hodnota pre danú skupinu;
      • N je celkový počet údajov vo vzorke.
    2. Nájdite priemer v každej skupine. Ak chcete vypočítať štandardnú odchýlku, musíte najprv nájsť priemer pre každú študijnú skupinu. Stredná hodnota je označená gréckym písmenom µ (mu). Ak chcete zistiť priemer, jednoducho spočítajte všetky výsledné hodnoty a vydeľte ich množstvom údajov (veľkosť vzorky).

      • Ak chcete napríklad nájsť priemernú známku pre skupinu študentov, ktorí sa učia pred vyučovaním, zvážte malý súbor údajov. Pre jednoduchosť používame množinu piatich bodov: 90, 91, 85, 83 a 94.
      • Sčítajme všetky hodnoty: 90 + 91 + 85 + 83 + 94 = 443.
      • Vydeľme súčet počtom hodnôt, N = 5: 443/5 = 88,6.
      • Priemer tejto skupiny je teda 88,6.
    3. Odpočítajte každú získanú hodnotu od priemeru.Ďalším krokom je výpočet rozdielu (x i – µ). Ak to chcete urobiť, odčítajte každú získanú hodnotu od zistenej priemernej hodnoty. V našom príklade musíme nájsť päť rozdielov:

      • (90 – 88,6), (91 – 88,6), (85 – 88,6), (83 – 88,6) a (94 – 88,6).
      • V dôsledku toho dostaneme nasledujúce hodnoty: 1,4, 2,4, -3,6, -5,6 a 5,4.
    4. Odmocni každú získanú hodnotu a spočítaj ich. Každé z práve nájdených množstiev by malo byť umocnené na druhú. Tento krok odstráni všetky záporné hodnoty. Ak po tomto kroku máte stále záporné čísla, zabudli ste ich odmocniť.

      • Pre náš príklad dostaneme 1,96, 5,76, 12,96, 31,36 a 29,16.
      • Výsledné hodnoty spočítame: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Vydeliť veľkosťou vzorky mínus 1. Vo vzorci je súčet delený N – 1 z dôvodu, že neberieme do úvahy všeobecnú populáciu, ale na hodnotenie berieme vzorku všetkých žiakov.

      • Odčítajte: N – 1 = 5 – 1 = 4
      • Delenie: 81,2/4 = 20,3
    6. Vezmite druhú odmocninu. Po vydelení súčtu veľkosťou vzorky mínus jedna vezmite druhú odmocninu nájdenej hodnoty. Toto je posledný krok pri výpočte štandardnej odchýlky. Existujú štatistické programy, ktoré po zadaní počiatočných údajov vykonajú všetky potrebné výpočty.

      • V našom príklade je štandardná odchýlka známok tých študentov, ktorí si látku prečítali pred vyučovaním, s =√20,3 = 4,51.

      Časť 3

      Určite význam
      1. Vypočítajte rozptyl medzi týmito dvoma skupinami údajov. Pred týmto krokom sme sa pozreli na príklad len pre jednu skupinu údajov. Ak chcete porovnať dve skupiny, mali by ste samozrejme vziať údaje z oboch skupín. Vypočítajte štandardnú odchýlku pre druhú skupinu údajov a potom nájdite rozptyl medzi dvoma experimentálnymi skupinami. Rozptyl sa vypočíta pomocou nasledujúceho vzorca: s d = √((s 1 /N 1) + (s 2 /N 2)).

Vo výpočtovej praxi FCC je nevyhnutná štatistická spoľahlivosť. Už predtým bolo uvedené, že z rovnakej populácie je možné vybrať viacero vzoriek:

Ak sú správne vybrané, potom sa ich priemerné ukazovatele a ukazovatele všeobecnej populácie mierne líšia vo veľkosti chyby reprezentatívnosti, berúc do úvahy akceptovanú spoľahlivosť;

Ak sú vybrané z rôznych populácií, rozdiel medzi nimi sa ukazuje ako významný. Štatistika je o porovnávaní vzoriek;

Ak sa líšia nevýznamne, nepodstatne, nepodstatne, t. j. v skutočnosti patria do tej istej všeobecnej populácie, rozdiel medzi nimi sa nazýva štatisticky nespoľahlivý.

Štatisticky spoľahlivé Vzorový rozdiel je vzorka, ktorá sa výrazne a zásadne líši, to znamená, že patrí k rôznym všeobecným populáciám.

V FCC posúdenie štatistickej významnosti rozdielov vo vzorkách znamená riešenie mnohých praktických problémov. Napríklad zavádzanie nových vyučovacích metód, programov, súborov cvičení, testov, kontrolných cvičení je spojené s ich experimentálnym testovaním, ktoré má ukázať, že testovacia skupina sa zásadne líši od kontrolnej skupiny. Preto sa na zistenie prítomnosti alebo neprítomnosti štatisticky významného rozdielu medzi vzorkami používajú špeciálne štatistické metódy, nazývané kritériá štatistickej významnosti.

Všetky kritériá sú rozdelené do dvoch skupín: parametrické a neparametrické. Parametrické kritériá vyžadujú prítomnosť zákona normálneho rozdelenia, t.j. To znamená povinné určenie hlavných ukazovateľov normálneho zákona - aritmetického priemeru a smerodajnej odchýlky s. Parametrické kritériá sú najpresnejšie a najsprávnejšie. Neparametrické testy sú založené na poradových (ordinálnych) rozdieloch medzi prvkami vzorky.

Uveďme hlavné kritériá štatistickej významnosti používané v praxi FCC: Studentov test a Fisherov test.

Študentov t test pomenovaná podľa anglického vedca K. Gosseta (Študent - pseudonym), ktorý túto metódu objavil. Studentov t-test je parametrický a používa sa na porovnanie absolútnych hodnôt vzoriek. Vzorky sa môžu líšiť veľkosťou.

Študentov t test je definovaný takto.

1. Nájdite Studentov t test pomocou nasledujúceho vzorca:


kde sú aritmetické priemery porovnávaných vzoriek; t 1, t 2 - chyby reprezentatívnosti zistené na základe ukazovateľov porovnávaných vzoriek.

2. Prax v FCC ukázala, že pre športovú prácu stačí akceptovať spoľahlivosť účtu P = 0,95.

Pre spoľahlivosť počítania: P = 0,95 (a = 0,05), s počtom stupňov voľnosti

k = n 1 + n 2 - 2 z tabuľky v prílohe 4 zistíme hodnotu limitnej hodnoty kritéria ( t gr).

3. Na základe vlastností zákona normálneho rozdelenia, Studentovo kritérium porovnáva t a t gr.

Robíme závery:

ak t t gr, tak rozdiel medzi porovnávanými vzorkami je štatisticky významný;

ak t t gr, tak rozdiel je štatisticky nevýznamný.

Pre výskumníkov v oblasti FCS je posúdenie štatistickej významnosti prvým krokom pri riešení konkrétneho problému: či sa porovnávané vzorky od seba zásadne alebo zásadne líšia. Ďalším krokom je vyhodnotenie tohto rozdielu z pedagogického hľadiska, ktoré je dané podmienkami úlohy.

Uvažujme o aplikácii Študentského testu na konkrétnom príklade.

Príklad 2.14. Skupina 18 subjektov bola hodnotená na srdcovú frekvenciu (bpm) pred x i a po y i rozcvička.

Posúďte účinnosť zahrievania na základe srdcovej frekvencie. Počiatočné údaje a výpočty sú uvedené v tabuľke. 2.30 a 2.31.

Tabuľka 2.30

Spracovanie indikátorov srdcového tepu pred zahriatím


Chyby pre obe skupiny sa zhodovali, pretože veľkosti vzoriek boli rovnaké (rovnaká skupina bola študovaná za rôznych podmienok) a štandardné odchýlky boli s x = s y = 3 údery/min. Prejdime k definovaniu Študentovho testu:

Spoľahlivosť účtu sme nastavili: P = 0,95.

Počet stupňov voľnosti k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Z tabuľky v prílohe 4 zistíme t gr= 2,02.

Štatistický záver. Keďže t = 11,62, a hranica t gr = 2,02, potom 11,62 > 2,02, t.j. t > t gr, preto je rozdiel medzi vzorkami štatisticky významný.

Pedagogický záver. Zistilo sa, že z hľadiska srdcovej frekvencie je rozdiel medzi stavom skupiny pred a po rozcvičke štatisticky významný, t.j. významný, zásadný. Takže na základe indikátora srdcovej frekvencie môžeme konštatovať, že zahrievanie je účinné.

Fisherovo kritérium je parametrický. Používa sa pri porovnávaní mier rozptylu vzoriek. To spravidla znamená porovnanie z hľadiska stability športovej práce alebo stability funkčných a technických ukazovateľov v praxi telesnej kultúry a športu. Vzorky môžu mať rôznu veľkosť.

Fisherovo kritérium je definované v nasledujúcom poradí.

1. Nájdite Fisherovo kritérium F pomocou vzorca


kde , sú rozptyly porovnávaných vzoriek.

Podmienky Fisherovho kritéria stanovujú, že v čitateli vzorca F je tam veľký rozptyl, t.j. číslo F je vždy väčšie ako jedna.

Spoľahlivosť počítania nastavíme: P = 0,95 - a určíme počet stupňov voľnosti pre obe vzorky: k 1 = n 1 - 1, k 2 = n 2 - 1.

Pomocou tabuľky v prílohe 4 nájdeme limitnú hodnotu kritéria F gr.

Porovnanie kritérií F a F gr nám umožňuje formulovať závery:

ak F > F gr, potom je rozdiel medzi vzorkami štatisticky významný;

ak F< F гр, то различие между выборками статически недо­стоверно.

Uveďme konkrétny príklad.

Príklad 2.15. Poďme analyzovať dve skupiny hádzanárov: x i (n 1= 16 osôb) a y i (n 2 = 18 osôb). Tieto skupiny športovcov boli študované na čas (y) vzletu pri vhadzovaní lopty do cieľa.

Sú indikátory odporu rovnakého typu?

Počiatočné údaje a základné výpočty sú uvedené v tabuľke. 2,32 a 2,33.

Tabuľka 2.32

Spracovanie ukazovateľov odpudivosti prvej skupiny hádzanárov


Definujme Fisherovo kritérium:





Podľa údajov uvedených v tabuľke v prílohe 6 zistíme Fgr: Fgr = 2,4

Venujme pozornosť tomu, že v tabuľke v prílohe 6 sa pri približovaní sa k väčším číslam zhrubňuje zoznam počtov stupňov voľnosti väčšieho aj menšieho rozptylu. Počet stupňov voľnosti väčšej disperzie teda nasleduje v tomto poradí: 8, 9, 10, 11, 12, 14, 16, 20, 24 atď., A menší - 28, 29, 30, 40. , 50 atď. d.

Vysvetľuje to skutočnosť, že s rastúcou veľkosťou vzorky sa rozdiely v F-teste zmenšujú a je možné použiť tabuľkové hodnoty, ktoré sú blízke pôvodným údajom. Takže v príklade 2,15 = 17 chýba a najbližšia hodnota k nemu sa môže považovať za k = 16, z čoho dostaneme Fgr = 2,4.

Štatistický záver. Keďže Fisherov test F= 2,5 > F= 2,4, vzorky sú štatisticky významne rozlíšiteľné.

Pedagogický záver. Hodnoty času (s) vzletu pri vhadzovaní lopty do bránky sa u hádzanárov oboch skupín výrazne líšia. Tieto skupiny by sa mali považovať za odlišné.

Ďalší výskum by mal odhaliť dôvod tohto rozdielu.

Príklad 2.20.(o štatistickej spoľahlivosti vzorky ). Zlepšila sa kvalifikácia futbalistu, ak čas (y) od zadania signálu po kopnutie lopty na začiatku tréningu bol x i a na konci y i .

Počiatočné údaje a základné výpočty sú uvedené v tabuľke. 2,40 a 2,41.

Tabuľka 2.40

Spracovanie ukazovateľov času od poskytnutia signálu až po odpálenie lopty na začiatku tréningu


Určme rozdiel medzi skupinami ukazovateľov pomocou študentského kritéria:

Pri spoľahlivosti P = 0,95 a stupňoch voľnosti k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 pomocou tabuľky v prílohe 4 zistíme t gr= 2,02. Pretože t = 8,3 > t gr= 2,02 - rozdiel je štatisticky významný.

Určme rozdiel medzi skupinami ukazovateľov pomocou Fisherovho kritéria:


Podľa tabuľky v prílohe 2 je pri spoľahlivosti P = 0,95 a stupňoch voľnosti k = 22-1 = 21 hodnota F gr = 21. Keďže F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Štatistický záver. Podľa aritmetického priemeru je rozdiel medzi skupinami ukazovateľov štatisticky významný. Z hľadiska rozptylu (disperzie) je rozdiel medzi skupinami ukazovateľov štatisticky nespoľahlivý.

Pedagogický záver. Kvalifikácia futbalistu sa výrazne zlepšila, no treba dbať na stabilitu jeho svedectva.

Príprava na prácu

Pred vykonaním tejto laboratórnej práce v disciplíne „Športová metrológia“ všetci študenti v študijnej skupine musia vytvoriť pracovné tímy po 3-4 študentoch, spoločne dokončiť pracovné zadanie všetkých laboratórnych prác.

V príprave na prácu oboznámte sa s príslušnými časťami odporúčanej literatúry (pozri časť 6 týchto pokynov) a poznámkami z prednášok. Preštudujte si časti 1 a 2 pre túto laboratórnu prácu, ako aj zadanie práce k nej (časť 4).

Pripravte si formulár správy na štandardné listy písacieho papiera veľkosti A4 a naplňte ho materiálmi potrebnými na prácu.

Správa musí obsahovať :

Titulný list s uvedením odboru (UC a TR), študijnej skupiny, priezviska, mena, priezviska študenta, čísla a názvu laboratórnej práce, dátumu jej ukončenia, ako aj priezviska, akademického titulu, akademického titulu a postavenie učiteľa, ktorý prácu prijíma;

Účel práce;

Vzorce s číselnými hodnotami vysvetľujúce priebežné a konečné výsledky výpočtov;

Tabuľky nameraných a vypočítaných hodnôt;

Grafický materiál požadovaný zadaním;

Stručné závery o výsledkoch každej etapy pracovného zadania ao vykonanej práci vo všeobecnosti.

Všetky grafy a tabuľky sú starostlivo nakreslené pomocou nástrojov na kreslenie. Bežné grafické a písmenové symboly musia spĺňať normy GOST. Je povolené vypracovať správu pomocou výpočtovej techniky.

Pracovné zadanie

Pred vykonaním všetkých meraní si každý člen tímu musí preštudovať pravidlá používania športovej hry Šípky uvedené v prílohe 7, ktoré sú potrebné na vykonanie nižšie uvedených fáz výskumu.

I. etapa výskumu„Štúdia výsledkov zasiahnutia terča pri športovej hre Šípky každým členom tímu na dodržanie normálneho distribučného zákona podľa kritéria χ 2 Pearson a kritérium tri sigma"

1. merať (otestovať) svoju (osobnú) rýchlosť a koordináciu akcií, hádzaním šípok 30-40 krát na kruhový terč v športovej hre Šípky.

2. Výsledky meraní (skúšok) x i(v pohároch) naformátovaný vo forme variačného radu a zapísaný do tabuľky 4.1 (stĺpce , vykonať všetky potrebné výpočty, vyplniť potrebné tabuľky a vyvodiť príslušné závery o súlade výsledného empirického rozdelenia so zákonom normálneho rozdelenia, analógiu s podobnými výpočtami, tabuľkami a závermi z príkladu 2.12, ktoré sú uvedené v časti 2 týchto pokynov na stranách 7 – 10.

Tabuľka 4.1

Súlad rýchlosti a koordinácie konania subjektov so zákonom o bežnom rozdeľovaní

Nie zaoblené
Celkom

II – etapa výskumu

„Odhad priemerných ukazovateľov bežnej populácie zásahov do terča športovej hry Šípky všetkých študentov študijnej skupiny na základe výsledkov meraní členov jedného tímu“

Posúdiť priemerné ukazovatele rýchlosti a koordinácie akcií všetkých študentov v študijnej skupine (podľa zoznamu študijnej skupiny v triednom časopise) na základe výsledkov zasiahnutia terča Darts všetkých členov tímu, získaných na prvom stupni. výskumu tejto laboratórnej práce.

1. Zdokumentujte výsledky meraní rýchlosti a koordinácie akcií pri hádzaní šípok na kruhový terč v športovej hre Šípky všetkých členov vášho tímu (2 - 4 osoby), ktorí predstavujú vzorku výsledkov meraní z bežnej populácie (výsledky meraní všetkých študentov v študijnej skupine – napr. 15 osôb), zapíšte ich do druhého a tretieho stĺpca Tabuľka 4.2.

Tabuľka 4.2

Spracovanie ukazovateľov rýchlosti a koordinácie akcií

členovia brigády

Nie
Celkom

V tabuľke 4.2 pod treba rozumieť , zhodné priemerné skóre (pozri výsledky výpočtu v tabuľke 4.1) členovia vášho tímu ( , získané v prvej fáze výskumu. Treba poznamenať, že spravidla Tabuľka 4.2 obsahuje vypočítanú priemernú hodnotu výsledkov meraní získaných jedným členom tímu v prvej fáze výskumu , keďže pravdepodobnosť, že sa výsledky meraní rôznych členov tímu budú zhodovať, je veľmi malá. potom spravidla hodnoty v stĺpci Tabuľka 4.2 pre každý riadok – rovná sa 1, A v riadku „Celkom " stĺpce " ", je napísané počet členov vášho tímu.

2. Vykonajte všetky potrebné výpočty na vyplnenie tabuľky 4.2, ako aj ďalšie výpočty a závery podobné výpočtom a záverom z príkladu 2.13 uvedeným v 2. časti tohto metodického vývoja na stranách 13-14. Treba to mať na pamäti pri výpočte chyby reprezentatívnosti "m" je potrebné použiť vzorec 2.4 uvedený na strane 13 tohto metodického vývoja, pretože vzorka je malá (n a počet prvkov všeobecnej populácie N je známy a rovná sa počtu študentov v študijnej skupine, podľa zoznamu časopisu študijnej skupiny.

III – etapa výskumu

Hodnotenie účinnosti rozcvičky podľa ukazovateľa „Rýchlosť a koordinácia akcií“ každým členom tímu pomocou Študentovho t-testu

Na vyhodnotenie účinnosti zahrievania na hádzanie šípok na cieľ športovej hry „Šípky“, vykonanej v prvej fáze výskumu tejto laboratórnej práce, každým členom tímu podľa ukazovateľa „Rýchlosť a koordinácia akcií“, s použitím Studentovho kritéria - parametrického kritéria pre štatistickú spoľahlivosť empirického zákona o rozdelení k zákonu normálneho rozdelenia.

… Celkom

2. odchýlky a RMS , výsledky meraní ukazovateľa „Rýchlosť a koordinácia akcií“ na základe výsledkov zahrievania, uvedené v tabuľke 4.3, (pozri podobné výpočty uvedené bezprostredne za tabuľkou 2.30 príkladu 2.14 na strane 16 tohto metodického vývoja).

3. Každý člen pracovného tímu zmerajte (otestujte) svoju (osobnú) rýchlosť a koordináciu akcií po zahriatí,

… Celkom

5. Vykonajte priemerné výpočty odchýlky a RMS ,výsledky merania ukazovateľa „Rýchlosť a koordinácia akcií“ po zahriatí, uvedené v tabuľke 4.4, zapíšte si celkové výsledky merania na základe výsledkov zahrievania (pozri podobné výpočty uvedené bezprostredne za tabuľkou 2.31 príkladu 2.14 na strane 17 tohto metodického vývoja).

6. Vykonajte všetky potrebné výpočty a závery podobné výpočtom a záverom v príklade 2.14 uvedeným v 2. časti tohto metodického vývoja na stranách 16-17. Treba to mať na pamäti pri výpočte chyby reprezentatívnosti "m" je potrebné použiť vzorec 2.1 uvedený na strane 12 tohto metodického vývoja, pretože vzorka je n a počet prvkov v populácii N ( nie je známy.

IV – etapa výskumu

Posúdenie jednotnosti (stability) ukazovateľov „Rýchlosť a koordinácia akcií“ dvoch členov tímu pomocou Fisherovho kritéria

Posúdiť jednotnosť (stabilitu) ukazovateľov „Rýchlosť a koordinácia akcií“ dvoch členov tímu pomocou Fisherovho kritéria na základe výsledkov meraní získaných v tretej etape výskumu v tejto laboratórnej práci.

Ak to chcete urobiť, musíte urobiť nasledovné.

Na základe údajov z tabuliek 4.3 a 4.4 sú výsledky výpočtu rozptylov z týchto tabuliek získané v tretej etape výskumu, ako aj metodika výpočtu a aplikácie Fisherovho kritéria na hodnotenie uniformity (stability) športových ukazovateľov, uvedené v r. príklad 2.15 na stranách 18-19 tohto metodického vývoja vyvodiť príslušné štatistické a pedagogické závery.

V – etapa výskumu

Hodnotenie skupín ukazovateľov „Rýchlosť a koordinácia akcií“ jedného člena tímu pred a po rozcvičení

ŠTATISTICKÁ SPOĽAHLIVOSŤ

- angličtina dôveryhodnosť/platnosť, štatistická; nemecký Overené, štatistické. Dôslednosť, objektivita a nejednoznačnosť v štatistickom teste alebo v q.l. súbor meraní. D. s. možno testovať opakovaním rovnakého testu (alebo dotazníka) na rovnakom predmete, aby sa zistilo, či sa dosiahli rovnaké výsledky; alebo porovnaním rôznych častí testu, ktoré majú merať ten istý objekt.

antinacistický. Encyklopédia sociológie, 2009

Pozrite si, čo je „ŠTATISTICKÁ SPOĽAHLIVOSŤ“ v iných slovníkoch:

    ŠTATISTICKÁ SPOĽAHLIVOSŤ- anglicky dôveryhodnosť/platnosť, štatistická; nemecký Overené, štatistické. Dôslednosť, objektivita a nejednoznačnosť v štatistickom teste alebo v q.l. súbor meraní. D. s. možno overiť opakovaním rovnakého testu (alebo... Výkladový slovník sociológie

    V štatistike sa hodnota nazýva štatisticky významná, ak je pravdepodobnosť jej náhodného výskytu alebo dokonca extrémnejších hodnôt nízka. Extrémom tu rozumieme mieru odchýlky testovacej štatistiky od nulovej hypotézy. Rozdiel sa volá... ...Wikipedia

    Fyzikálnym javom štatistickej stability je to, že ako sa veľkosť vzorky zväčšuje, frekvencia náhodnej udalosti alebo priemerná hodnota fyzikálnej veličiny má tendenciu k nejakému pevnému číslu. Fenomén štatistiky... ... Wikipedia

    SPOĽAHLIVOSŤ ROZDIELOV (podobnosti)- analytický štatistický postup na zistenie úrovne významnosti rozdielov alebo podobností medzi vzorkami podľa študovaných ukazovateľov (premenných) ... Moderný vzdelávací proces: základné pojmy a pojmy

    VYKAZOVANIE, ŠTATISTICKÉ Veľký účtovný slovník

    VYKAZOVANIE, ŠTATISTICKÉ- forma štátneho štatistického pozorovania, pri ktorej príslušné orgány dostávajú od podnikov (organizácií a inštitúcií) informácie, ktoré potrebujú vo forme zákonom stanovených výkazov (štatistických výkazov) za... Veľký ekonomický slovník

    Veda, ktorá študuje metódy systematického pozorovania hromadných javov v spoločenskom živote človeka, zostavuje ich číselné popisy a vedecké spracovanie týchto popisov. Takže teoretická štatistika je veda...... Encyklopedický slovník F.A. Brockhaus a I.A. Efron

    Korelačný koeficient- (Korelačný koeficient) Korelačný koeficient je štatistický ukazovateľ závislosti dvoch náhodných veličín Definícia korelačného koeficientu, typy korelačných koeficientov, vlastnosti korelačného koeficientu, výpočet a aplikácia... ... Encyklopédia investorov

    Štatistiky- (Štatistika) Štatistika je všeobecná teoretická veda, ktorá študuje kvantitatívne zmeny javov a procesov. Štátna štatistika, štatistické služby, Rosstat (Goskomstat), štatistické údaje, štatistiky dotazov, štatistiky predaja,... ... Encyklopédia investorov

    Korelácia- (Korelácia) Korelácia je štatistický vzťah medzi dvoma alebo viacerými náhodnými premennými Pojem korelácie, typy korelácií, korelačný koeficient, korelačná analýza, cenová korelácia, korelácia menových párov na Forex Contents... ... Encyklopédia investorov

knihy

  • Výskum v matematike a matematike vo výskume: Metodologický zborník o študentskej výskumnej činnosti, Borzenko V.I.. Zbierka predstavuje metodologické vývojové trendy aplikovateľné pri organizovaní študentských výskumných aktivít. Prvá časť zborníka je venovaná aplikácii výskumného prístupu v...

Čím je podľa vás vaša „druhá polovička“ výnimočná a zmysluplná? Súvisí to s jej/jeho osobnosťou alebo s vašimi pocitmi, ktoré k tejto osobe chováte? Alebo možno s jednoduchým faktom, že hypotéza o náhodnosti vašich sympatií, ako ukazujú štúdie, má pravdepodobnosť menšiu ako 5%? Ak považujeme posledné tvrdenie za spoľahlivé, úspešné zoznamky by v zásade neexistovali:

Keď vykonávate rozdelené testovanie alebo akúkoľvek inú analýzu svojho webu, nepochopenie „štatistickej významnosti“ môže viesť k nesprávnej interpretácii výsledkov, a teda k nesprávnym krokom v procese optimalizácie konverzie. To platí pre tisíce ďalších štatistických testov vykonávaných každý deň v každom existujúcom odvetví.

Aby ste pochopili, čo je „štatistická významnosť“, musíte sa ponoriť do histórie tohto pojmu, naučiť sa jeho skutočný význam a pochopiť, ako vám toto „nové“ staré chápanie pomôže správne interpretovať výsledky vášho výskumu.

Trochu histórie

Hoci ľudstvo využíva štatistiku na riešenie rôznych problémov už mnoho storočí, moderné chápanie štatistickej významnosti, testovania hypotéz, randomizácie a dokonca aj dizajnu experimentov (DOE) sa začalo formovať až na začiatku 20. storočia a je neoddeliteľne spojené s tzv. meno Sir Ronald Fisher (Sir Ronald Fisher, 1890-1962):

Ronald Fisher bol evolučný biológ a štatistik, ktorý mal osobitnú vášeň pre štúdium evolúcie a prirodzeného výberu v živočíšnej a rastlinnej ríši. Počas svojej slávnej kariéry vyvinul a spopularizoval mnoho užitočných štatistických nástrojov, ktoré používame dodnes.

Fisher použil techniky, ktoré vyvinul, na vysvetlenie procesov v biológii, ako je dominancia, mutácie a genetické odchýlky. Rovnaké nástroje dnes môžeme použiť na optimalizáciu a zlepšenie obsahu webových zdrojov. Skutočnosť, že tieto analytické nástroje je možné použiť na prácu s objektmi, ktoré v čase ich vzniku ešte neexistovali, sa zdá celkom prekvapivá. Rovnako prekvapivé je, že ľudia robili zložité výpočty bez kalkulačiek alebo počítačov.

Na opísanie výsledkov štatistického experimentu ako s vysokou pravdepodobnosťou pravdivosti použil Fisher slovo „významnosť“.

Jeden z najzaujímavejších Fisherových objavov možno nazvať aj hypotézou „sexy syna“. Podľa tejto teórie ženy preferujú sexuálne promiskuitných mužov (promiskuitných), pretože to umožní synom narodeným týmto mužom mať rovnakú predispozíciu a splodiť viac potomkov (všimnite si, že je to len teória).

Ale nikto, dokonca ani brilantní vedci, nie je imúnny voči chybám. Fisherove chyby trápia špecialistov dodnes. Pamätajte však na slová Alberta Einsteina: „Kto sa nikdy nepomýlil, nikdy nevytvoril nič nové.

Predtým, ako prejdete k ďalšiemu bodu, nezabudnite: štatistická významnosť je, keď je rozdiel vo výsledkoch testu taký veľký, že rozdiel nemožno vysvetliť náhodnými faktormi.

Aká je vaša hypotéza?

Aby ste pochopili, čo znamená „štatistická významnosť“, musíte najprv pochopiť, čo je „testovanie hypotéz“, pretože tieto dva pojmy sú úzko prepojené.
Hypotéza je len teória. Akonáhle vytvoríte teóriu, budete musieť vytvoriť proces na zhromaždenie dostatočného množstva dôkazov a skutočné zhromaždenie týchto dôkazov. Existujú dva typy hypotéz.

Jablká alebo pomaranče - čo je lepšie?

Nulová hypotéza

Spravidla to je miesto, kde veľa ľudí zažíva ťažkosti. Jedna vec, ktorú treba mať na pamäti, je, že nulová hypotéza nie je niečo, čo je potrebné dokázať, ako keď dokazujete, že určitá zmena na webe povedie k zvýšeniu konverzií, ale naopak. Nulová hypotéza je teória, ktorá tvrdí, že ak na stránke urobíte nejaké zmeny, nič sa nestane. A cieľom výskumníka je túto teóriu vyvrátiť, nie dokázať.

Ak sa pozrieme na skúsenosti s objasňovaním trestných činov, kde aj vyšetrovatelia vytvárajú hypotézy o tom, kto je páchateľ, nulová hypotéza má podobu takzvanej prezumpcie neviny, teda konceptu, podľa ktorého sa obvinený považuje za nevinného, ​​kým sa mu vina nepreukáže. na súde.

Ak je nulová hypotéza, že dva objekty sú si svojimi vlastnosťami rovnaké, a vy sa snažíte dokázať, že jeden z nich je lepší (napríklad A je lepší ako B), musíte nulovú hypotézu zamietnuť v prospech alternatívy. Napríklad porovnávate jeden alebo druhý nástroj na optimalizáciu konverzie. V nulovej hypotéze majú obe rovnaký účinok (alebo žiadny účinok) na cieľ. Alternatívne je účinok jedného z nich lepší.

Vaša alternatívna hypotéza môže obsahovať číselnú hodnotu, napríklad B – A > 20 %. V tomto prípade môže mať nulová hypotéza a alternatíva nasledujúcu formu:

Iný názov pre alternatívnu hypotézu je výskumná hypotéza, pretože výskumník má vždy záujem túto konkrétnu hypotézu dokázať.

Štatistická významnosť a p hodnota

Vráťme sa opäť k Ronaldovi Fisherovi a jeho konceptu štatistickej významnosti.

Teraz, keď máte nulovú hypotézu a alternatívu, ako môžete jednu dokázať a druhú vyvrátiť?

Keďže štatistiky zo svojej podstaty zahŕňajú štúdium konkrétnej populácie (vzorky), nikdy si nemôžete byť 100% istý získanými výsledkami. Dobrý príklad: výsledky volieb sa často líšia od výsledkov predbežných prieskumov verejnej mienky a dokonca aj od výsledkov.

Dr. Fisher chcel vytvoriť deliacu čiaru, ktorá by vám dala vedieť, či bol váš experiment úspešný alebo nie. Takto sa objavil index spoľahlivosti. Dôveryhodnosť je úroveň, ktorou hovoríme, čo považujeme za „významné“ a čo nie. Ak "p", index významnosti, je 0,05 alebo menej, potom sú výsledky spoľahlivé.

Nebojte sa, v skutočnosti to nie je také mätúce, ako sa zdá.

Gaussovo rozdelenie pravdepodobnosti. Pozdĺž okrajov sú menej pravdepodobné hodnoty premennej, v strede sú najpravdepodobnejšie. P-skóre (zelená podfarbená oblasť) je pravdepodobnosť náhodného výskytu pozorovaného výsledku.

Normálne rozdelenie pravdepodobnosti (Gaussovo rozdelenie) je znázornením všetkých možných hodnôt určitej premennej na grafe (na obrázku vyššie) a ich frekvencií. Ak urobíte svoj výskum správne a potom zakreslíte všetky svoje odpovede do grafu, dostanete presne toto rozdelenie. Podľa normálneho rozdelenia dostanete veľké percento podobných odpovedí a zvyšné možnosti budú umiestnené na okrajoch grafu (takzvané „chvosty“). Toto rozloženie hodnôt sa často nachádza v prírode, a preto sa nazýva „normálne“.

Pomocou rovnice založenej na vašej vzorke a výsledkoch testu môžete vypočítať to, čo sa nazýva „štatistika testu“, ktorá bude indikovať, ako veľmi sa vaše výsledky líšia. Tiež vám povie, ako blízko ste k pravdivosti nulovej hypotézy.

Aby ste sa zorientovali, použite online kalkulačky na výpočet štatistickej významnosti:

Jeden príklad takýchto kalkulačiek

Písmeno "p" predstavuje pravdepodobnosť, že nulová hypotéza je pravdivá. Ak je číslo malé, bude to znamenať rozdiel medzi testovacími skupinami, zatiaľ čo nulová hypotéza by bola, že sú rovnaké. Graficky to bude vyzerať tak, že vaša testovacia štatistika bude bližšie k jednému z koncov vašej distribúcie v tvare zvona.

Dr. Fisher sa rozhodol stanoviť prah významnosti na p ≤ 0,05. Toto tvrdenie je však kontroverzné, pretože vedie k dvom ťažkostiam:

1. Po prvé, skutočnosť, že ste dokázali, že nulová hypotéza je nepravdivá, neznamená, že ste dokázali alternatívnu hypotézu. Celý tento význam znamená, že nemôžete dokázať ani A, ani B.

2. Po druhé, ak je p-skóre 0,049, bude to znamenať, že pravdepodobnosť nulovej hypotézy bude 4,9 %. To môže znamenať, že výsledky vášho testu môžu byť súčasne pravdivé aj nepravdivé.

Môžete alebo nemusíte použiť p-skóre, ale potom budete musieť vypočítať pravdepodobnosť nulovej hypotézy od prípadu k prípadu a rozhodnúť, či je dostatočne veľká na to, aby vám zabránila vykonať zmeny, ktoré ste plánovali a testovali. .

Najbežnejším scenárom na vykonávanie štatistického testu v súčasnosti je nastavenie prahu významnosti p ≤ 0,05 pred spustením samotného testu. Pri kontrole výsledkov sa uistite, že sa pozorne pozriete na hodnotu p.

Chyby 1 a 2

Uplynulo toľko času, že chyby, ktoré sa môžu vyskytnúť pri použití metriky štatistickej významnosti, dokonca dostali svoje vlastné mená.

Chyby typu 1

Ako je uvedené vyššie, p-hodnota 0,05 znamená, že existuje 5% šanca, že nulová hypotéza je pravdivá. Ak to neurobíte, robíte chybu číslo 1. Výsledky hovoria, že vaša nová webová lokalita zvýšila vaše miery konverzie, ale je tu 5 % šanca, že sa tak nestalo.

Chyby typu 2

Táto chyba je opakom chyby 1: akceptujete nulovú hypotézu, keď je nepravdivá. Výsledky testov vám napríklad povedia, že vykonané zmeny na stránke nepriniesli žiadne vylepšenia, hoci zmeny boli. V dôsledku toho prichádzate o príležitosť zlepšiť svoj výkon.

Táto chyba je bežná pri testoch s nedostatočnou veľkosťou vzorky, preto si pamätajte: čím väčšia vzorka, tým spoľahlivejší výsledok.

Záver

Azda žiadny termín nie je medzi výskumníkmi taký populárny ako štatistická významnosť. Keď sa výsledky testov nezistia ako štatisticky významné, dôsledky siahajú od zvýšenia miery konverzie až po krach spoločnosti.

A keďže marketéri tento výraz používajú pri optimalizácii svojich zdrojov, musíte vedieť, čo to naozaj znamená. Podmienky testu sa môžu líšiť, ale veľkosť vzorky a kritériá úspešnosti sú vždy dôležité. Toto si zapamätajte.



Tento článok je dostupný aj v nasledujúcich jazykoch: thajčina

  • Ďalej

    ĎAKUJEME za veľmi užitočné informácie v článku. Všetko je prezentované veľmi jasne. Zdá sa, že na analýze fungovania obchodu eBay sa urobilo veľa práce

    • Ďakujem vám a ostatným pravidelným čitateľom môjho blogu. Bez vás by som nebol dostatočne motivovaný venovať veľa času údržbe tejto stránky. Môj mozog je štruktúrovaný takto: rád sa hrabem do hĺbky, systematizujem roztrúsené dáta, skúšam veci, ktoré ešte nikto nerobil alebo sa na ne nepozeral z tohto uhla. Je škoda, že naši krajania nemajú čas na nákupy na eBay kvôli kríze v Rusku. Nakupujú na Aliexpress z Číny, keďže tam je tovar oveľa lacnejší (často na úkor kvality). Ale online aukcie eBay, Amazon, ETSY jednoducho poskytnú Číňanom náskok v sortimente značkových predmetov, historických predmetov, ručne vyrábaných predmetov a rôzneho etnického tovaru.

      • Ďalej

        Na vašich článkoch je cenný váš osobný postoj a rozbor témy. Nevzdávaj tento blog, chodím sem často. Takých by nás malo byť veľa. Napíšte mi Nedávno som dostal email s ponukou, že ma naučia obchodovať na Amazone a eBayi.

  • A spomenul som si na vaše podrobné články o týchto odboroch. oblasť
    Znovu som si všetko prečítal a dospel som k záveru, že kurzy sú podvod. Na eBay som ešte nič nekúpil. Nie som z Ruska, ale z Kazachstanu (Almaty). Zatiaľ však nepotrebujeme žiadne ďalšie výdavky.