Le ipotesi vengono testate utilizzando l'analisi statistica. La significatività statistica si trova utilizzando il valore P, che corrisponde alla probabilità di un dato evento assumendo che alcune affermazioni (ipotesi nulla) siano vere. Se il valore P è inferiore a un livello specificato di significatività statistica (di solito 0,05), lo sperimentatore può concludere con sicurezza che l'ipotesi nulla è falsa e procedere a considerare l'ipotesi alternativa. Utilizzando il test t di Student, puoi calcolare il valore P e determinare la significatività per due set di dati.

Passi

Parte 1

Impostazione dell'esperimento

    Definisci la tua ipotesi. Il primo passo per valutare la significatività statistica è scegliere la domanda a cui si vuole rispondere e formulare un'ipotesi. Un'ipotesi è un'affermazione sui dati sperimentali, sulla loro distribuzione e proprietà. Per ogni esperimento esiste sia un’ipotesi nulla che un’ipotesi alternativa. In generale, dovrai confrontare due insiemi di dati per determinare se sono simili o diversi.

    • L'ipotesi nulla (H 0) afferma tipicamente che non c'è differenza tra due insiemi di dati. Ad esempio: quegli studenti che leggono il materiale prima della lezione non ricevono voti più alti.
    • L'ipotesi alternativa (H a) è l'opposto dell'ipotesi nulla ed è un'affermazione che necessita di essere supportata da dati sperimentali. Ad esempio: quegli studenti che leggono il materiale prima della lezione ottengono voti più alti.
  1. Impostare il livello di significatività per determinare quanto la distribuzione dei dati deve differire dal normale prima di poter essere considerata un risultato significativo. Livello di significatività (chiamato ancheα (\displaystyle \alpha )

    • -level) è la soglia definita per la significatività statistica. Se il valore P è inferiore o uguale al livello di significatività, i dati sono considerati statisticamente significativi. Livello di significatività (chiamato anche Di norma, il livello di significatività (valore
    • ) è considerato pari a 0,05, nel qual caso la probabilità di rilevare una differenza casuale tra diversi set di dati è solo del 5%.
    • Se desideri risultati più affidabili, abbassa il valore P a 0,01. In genere, i valori P più bassi vengono utilizzati nella produzione quando è necessario identificare i difetti nei prodotti. In questo caso, è necessaria un'elevata affidabilità per essere sicuri che tutte le parti funzionino come previsto.
    • Per la maggior parte degli esperimenti di ipotesi è sufficiente un livello di significatività pari a 0,05.
  2. Decidi quale criterio utilizzerai: unilaterale o bilaterale. Una delle ipotesi del test t di Student è che i dati siano distribuiti normalmente. La distribuzione normale è una curva a campana con il numero massimo di risultati al centro della curva. Il test t di Student è un metodo matematico per testare i dati che consente di determinare se i dati non rientrano nella distribuzione normale (più, meno o nelle “code” della curva).

    • Se non sei sicuro che i dati siano superiori o inferiori ai valori del gruppo di controllo, utilizza un test a due code. Ciò ti consentirà di determinare il significato in entrambe le direzioni.
    • Se sai in quale direzione i dati potrebbero non rientrare nella distribuzione normale, utilizza un test a una coda. Nell'esempio sopra, ci aspettiamo che i voti degli studenti aumentino, quindi è possibile utilizzare un test a una coda.
  3. Determinare la dimensione del campione utilizzando la potenza statistica. Il potere statistico di uno studio è la probabilità che, data la dimensione del campione, si ottenga il risultato atteso. Una soglia di potenza comune (o β) è dell'80%. Analizzare la potenza statistica senza dati precedenti può essere difficile perché richiede alcune informazioni sulle medie attese in ciascun gruppo di dati e sulle relative deviazioni standard. Utilizza un calcolatore di analisi della potenza online per determinare la dimensione del campione ottimale per i tuoi dati.

    • In genere, i ricercatori conducono un piccolo studio pilota che fornisce dati per l’analisi statistica della potenza e determina la dimensione del campione necessaria per uno studio più ampio e completo.
    • Se non sei in grado di condurre uno studio pilota, prova a stimare le possibili medie basate sulla letteratura e sui risultati di altre persone. Ciò può aiutarti a determinare la dimensione ottimale del campione.

    Parte 2

    Calcolare la deviazione standard
    1. Scrivi la formula per la deviazione standard. La deviazione standard mostra quanta dispersione c'è nei dati. Ti consente di concludere quanto sono vicini i dati ottenuti da un determinato campione. A prima vista la formula sembra piuttosto complicata, ma le spiegazioni che seguono ti aiuteranno a capirla. La formula è la seguente: s = √∑((x i – µ) 2 /(N – 1)).

      • s - deviazione standard;
      • il segno ∑ indica che devono essere sommati tutti i dati ottenuti dal campione;
      • x i corrisponde al valore i-esimo, cioè un risultato separato ottenuto;
      • µ è il valore medio per un dato gruppo;
      • N è il numero totale di dati nel campione.
    2. Trova la media in ciascun gruppo. Per calcolare la deviazione standard, devi prima trovare la media per ciascun gruppo di studio. Il valore medio è indicato con la lettera greca µ (mu). Per trovare la media, somma semplicemente tutti i valori risultanti e dividili per la quantità di dati (dimensione del campione).

      • Ad esempio, per trovare il voto medio di un gruppo di studenti che studia prima delle lezioni, considera un piccolo set di dati. Per semplicità, utilizziamo una serie di cinque punti: 90, 91, 85, 83 e 94.
      • Sommiamo tutti i valori insieme: 90 + 91 + 85 + 83 + 94 = 443.
      • Dividiamo la somma per il numero di valori, N = 5: 443/5 = 88,6.
      • Pertanto, la media per questo gruppo è 88,6.
    3. Sottrarre ciascun valore ottenuto dalla media. Il passo successivo è calcolare la differenza (xi – µ). Per fare ciò, sottrai ciascun valore ottenuto dal valore medio trovato. Nel nostro esempio, dobbiamo trovare cinque differenze:

      • (90 – 88,6), (91 – 88,6), (85 – 88,6), (83 – 88,6) e (94 – 88,6).
      • Di conseguenza, otteniamo i seguenti valori: 1.4, 2.4, -3.6, -5.6 e 5.4.
    4. Eleva al quadrato ogni valore ottenuto e sommali tra loro. Ciascuna delle quantità appena trovate dovrebbe essere quadrata. Questo passaggio rimuoverà tutti i valori negativi. Se dopo questo passaggio hai ancora numeri negativi, hai dimenticato di elevarli al quadrato.

      • Per il nostro esempio, otteniamo 1.96, 5.76, 12.96, 31.36 e 29.16.
      • Sommiamo i valori risultanti: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Dividere per la dimensione del campione meno 1. Nella formula, la somma viene divisa per N – 1 poiché non prendiamo in considerazione la popolazione generale, ma prendiamo un campione di tutti gli studenti per la valutazione.

      • Sottrai: N – 1 = 5 – 1 = 4
      • Dividi: 81,2/4 = 20,3
    6. Prendi la radice quadrata. Dopo aver diviso la somma per la dimensione del campione meno uno, prendi la radice quadrata del valore trovato. Questo è l'ultimo passaggio nel calcolo della deviazione standard. Esistono programmi statistici che, dopo aver inserito i dati iniziali, eseguono tutti i calcoli necessari.

      • Nel nostro esempio, la deviazione standard dei voti degli studenti che hanno letto il materiale prima della lezione è s =√20,3 = 4,51.

      Parte 3

      Determinare il significato
      1. Calcolare la varianza tra i due gruppi di dati. Prima di questo passaggio, abbiamo esaminato un esempio per un solo gruppo di dati. Se vuoi confrontare due gruppi, dovresti ovviamente prendere i dati da entrambi i gruppi. Calcola la deviazione standard per il secondo gruppo di dati, quindi trova la varianza tra i due gruppi sperimentali. La varianza viene calcolata utilizzando la seguente formula: s d = √((s 1 /N 1) + (s 2 /N 2)).

L'affidabilità statistica è essenziale nella pratica di calcolo della FCC. Si è notato in precedenza che è possibile selezionare più campioni dalla stessa popolazione:

Se selezionati correttamente, i loro indicatori medi e gli indicatori della popolazione generale differiscono leggermente l'uno dall'altro nell'entità dell'errore di rappresentatività, tenendo conto dell'affidabilità accettata;

Se vengono selezionati da popolazioni diverse, la differenza tra loro risulta essere significativa. La statistica consiste nel confrontare campioni;

Se differiscono in modo insignificante, non fondamentale, insignificante, cioè appartengono effettivamente alla stessa popolazione generale, la differenza tra loro è detta statisticamente inaffidabile.

Statisticamente affidabile Una differenza campionaria è un campione che differisce in modo significativo e fondamentale, cioè appartiene a popolazioni generali diverse.

Alla FCC, valutare la significatività statistica delle differenze campionarie significa risolvere molti problemi pratici. Ad esempio, l'introduzione di nuovi metodi di insegnamento, programmi, serie di esercizi, test, esercizi di controllo è associata alla loro verifica sperimentale, che dovrebbe dimostrare che il gruppo di prova è fondamentalmente diverso dal gruppo di controllo. Pertanto, vengono utilizzati metodi statistici speciali, chiamati criteri di significatività statistica, per rilevare la presenza o l'assenza di una differenza statisticamente significativa tra i campioni.

Tutti i criteri sono divisi in due gruppi: parametrici e non parametrici. I criteri parametrici richiedono la presenza di una legge di distribuzione normale, cioè Ciò significa la determinazione obbligatoria dei principali indicatori della legge normale: la media aritmetica e la deviazione standard s. I criteri parametrici sono i più accurati e corretti. I test non parametrici si basano sulle differenze di rango (ordinali) tra gli elementi del campione.

Ecco i principali criteri di significatività statistica utilizzati nella pratica FCC: test di Student e test di Fisher.

Prova t dello studente prende il nome dallo scienziato inglese K. Gosset (Studente - pseudonimo), che ha scoperto questo metodo. Il test di Student è parametrico e viene utilizzato per confrontare i valori assoluti dei campioni. I campioni possono variare nelle dimensioni.

Prova t dello studente è definito così.

1. Trova il test t di Student utilizzando la seguente formula:


dove sono le medie aritmetiche dei campioni confrontati; t 1, t 2 - errori di rappresentatività individuati sulla base degli indicatori dei campioni confrontati.

2. La pratica presso la FCC ha dimostrato che per il lavoro sportivo è sufficiente accettare l'affidabilità del conto P = 0,95.

Per l'affidabilità del conteggio: P = 0,95 (a = 0,05), con il numero di gradi di libertà

k = n 1 + n 2 - 2 dalla tabella dell'Appendice 4 troviamo il valore del valore limite del criterio ( t gr).

3. Basandosi sulle proprietà della legge di distribuzione normale, il criterio di Student confronta t e t gr.

Traiamo conclusioni:

se t t gr, allora la differenza tra i campioni confrontati è statisticamente significativa;

se t t gr, la differenza è statisticamente insignificante.

Per i ricercatori nel campo della FCS, la valutazione della significatività statistica è il primo passo per risolvere un problema specifico: se i campioni confrontati sono fondamentalmente o non fondamentalmente diversi l'uno dall'altro. Il passo successivo è valutare questa differenza da un punto di vista pedagogico, che è determinato dalle condizioni del compito.

Consideriamo l'applicazione del test di Student utilizzando un esempio specifico.

Esempio 2.14. Un gruppo di 18 soggetti è stato valutato per la frequenza cardiaca (bpm) prima e dopo x i sì io riscaldamento.

Valutare l'efficacia del riscaldamento in base alla frequenza cardiaca. I dati iniziali e i calcoli sono presentati nella tabella. 2.30 e 2.31.

Tabella 2.30

Elaborazione degli indicatori della frequenza cardiaca prima del riscaldamento


Gli errori per entrambi i gruppi coincidevano, poiché le dimensioni del campione erano uguali (lo stesso gruppo è stato studiato in condizioni diverse) e le deviazioni standard erano s x = s y = 3 battiti/min. Passiamo alla definizione della prova dello Studente:

Impostiamo l'affidabilità del conto: P = 0,95.

Numero di gradi di libertà k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Dalla tabella dell'Appendice 4 troviamo t gr= 2,02.

Inferenza statistica. Poiché t = 11,62 e il confine t gr = 2,02, allora 11,62 > 2,02, cioè t > t gr, quindi la differenza tra i campioni è statisticamente significativa.

Conclusione pedagogica. Si è riscontrato che in termini di frequenza cardiaca la differenza tra lo stato del gruppo prima e dopo il riscaldamento è statisticamente significativa, vale a dire significativo, fondamentale. Quindi, in base all'indicatore della frequenza cardiaca, possiamo concludere che il riscaldamento è efficace.

Criterio di Fisherè parametrico. Viene utilizzato quando si confrontano i tassi di dispersione del campione. Ciò, di regola, significa un confronto in termini di stabilità del lavoro sportivo o stabilità degli indicatori funzionali e tecnici nella pratica della cultura fisica e dello sport. I campioni possono essere di dimensioni diverse.

Il criterio di Fisher è definito nella seguente sequenza.

1. Trova il criterio F di Fisher utilizzando la formula


dove , sono le varianze dei campioni confrontati.

Le condizioni del criterio di Fisher lo stabiliscono nel numeratore della formula F c'è una grande dispersione, cioè il numero F è sempre maggiore di uno.

Impostiamo l'affidabilità del conteggio: P = 0,95 - e determiniamo il numero di gradi di libertà per entrambi i campioni: k 1 = n 1 - 1, k 2 = n 2 - 1.

Utilizzando la tabella dell'Appendice 4, troviamo il valore limite del criterio F gr.

Confronto tra i criteri F e F gr ci permette di formulare delle conclusioni:

se F > F gr, allora la differenza tra i campioni è statisticamente significativa;

se F< F гр, то различие между выборками статически недо­стоверно.

Facciamo un esempio specifico.

Esempio 2.15. Analizziamo due gruppi di giocatori di pallamano: x io (n1= 16 persone) e y i (p 2 = 18 persone). Questi gruppi di atleti sono stati studiati per i tempi di decollo quando si lancia la palla in porta.

Gli indicatori di repulsione sono dello stesso tipo?

I dati iniziali e i calcoli di base sono presentati nella tabella. 2.32 e 2.33.

Tabella 2.32

Elaborazione degli indicatori di repulsione del primo gruppo di giocatori di pallamano


Definiamo il criterio di Fisher:





Secondo i dati presentati nella tabella dell'Appendice 6, troviamo Fgr: Fgr = 2,4

Prestiamo attenzione al fatto che nella tabella dell'Appendice 6 l'elenco dei numeri dei gradi di libertà sia della dispersione maggiore che di quella minore diventa più grossolano man mano che ci avviciniamo ai numeri più grandi. Pertanto, il numero di gradi di libertà della dispersione più grande segue in questo ordine: 8, 9, 10, 11, 12, 14, 16, 20, 24, ecc., E quella più piccola - 28, 29, 30, 40 , 50, ecc. d.

Ciò è spiegato dal fatto che all’aumentare della dimensione del campione, le differenze nel test F diminuiscono ed è possibile utilizzare valori tabellari vicini ai dati originali. Quindi nell'esempio 2.15 =17 è assente e il valore ad esso più vicino può essere assunto come k = 16, da cui si ottiene Fgr = 2.4.

Inferenza statistica. Poiché il test di Fisher F= 2,5 > F= 2,4, i campioni sono statisticamente distinguibili.

Conclusione pedagogica. I valori dei tempi di decollo quando si lancia la palla in porta per i giocatori di pallamano di entrambi i gruppi differiscono in modo significativo. Questi gruppi dovrebbero essere considerati diversi.

Ulteriori ricerche dovrebbero rivelare la ragione di questa differenza.

Esempio 2.20.(sull’attendibilità statistica del campione ). Le qualifiche del calciatore sono migliorate se il tempo (i) dal dare il segnale al calciare il pallone all'inizio dell'allenamento era x i e alla fine y i .

I dati iniziali e i calcoli di base sono riportati nella tabella. 2.40 e 2.41.

Tabella 2.40

Elaborazione degli indicatori temporali dal dare un segnale al colpire la palla all'inizio dell'allenamento


Determiniamo la differenza tra gruppi di indicatori utilizzando il criterio di Student:

Con affidabilità P = 0,95 e gradi di libertà k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, utilizzando la tabella dell'Appendice 4 troviamo t gr= 2,02. Poiché t = 8,3 > t gr= 2,02 - la differenza è statisticamente significativa.

Determiniamo la differenza tra gruppi di indicatori utilizzando il criterio di Fisher:


Secondo la tabella dell'Appendice 2, con affidabilità P = 0,95 e gradi di libertà k = 22-1 = 21, il valore F gr = 21. Poiché F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Inferenza statistica. Secondo la media aritmetica, la differenza tra gruppi di indicatori è statisticamente significativa. In termini di dispersione (dispersione), la differenza tra gruppi di indicatori è statisticamente inaffidabile.

Conclusione pedagogica. Le qualifiche del calciatore sono migliorate notevolmente, ma occorre prestare attenzione alla stabilità della sua testimonianza.

Preparazione per il lavoro

Prima di condurre questo lavoro di laboratorio nella disciplina "Metrologia sportiva" tutti gli studenti del gruppo di studio dovranno formare gruppi di lavoro di 3-4 studenti ciascuno, per completare congiuntamente l'incarico di lavoro di tutto il lavoro di laboratorio.

In preparazione al lavoro familiarizzare con le sezioni pertinenti della letteratura consigliata (vedere la sezione 6 di queste linee guida) e gli appunti delle lezioni. Studia le sezioni 1 e 2 di questo lavoro di laboratorio, nonché l'incarico di lavoro relativo (sezione 4).

Preparare un modulo di segnalazione su fogli standard di carta da lettere formato A4 e riempirlo con i materiali necessari per il lavoro.

La relazione deve contenere :

Frontespizio indicante il dipartimento (UC e TR), gruppo di studio, cognome, nome, patronimico dello studente, numero e titolo del lavoro di laboratorio, data del suo completamento, nonché cognome, grado accademico, titolo accademico e posizione dell'insegnante che accetta il lavoro;

Scopo del lavoro;

Formule con valori numerici che spiegano i risultati intermedi e finali dei calcoli;

Tabelle dei valori misurati e calcolati;

Materiale grafico richiesto dall'incarico;

Brevi conclusioni sui risultati di ciascuna fase dell'incarico di lavoro e sul lavoro svolto in generale.

Tutti i grafici e le tabelle sono disegnati attentamente utilizzando gli strumenti di disegno. I simboli grafici e letterali convenzionali devono essere conformi ai GOST. È consentito redigere una relazione utilizzando la tecnologia informatica.

Assegnazione di lavoro

Prima di effettuare tutte le misurazioni, ciascun membro della squadra deve studiare le regole per l'utilizzo del gioco sportivo Freccette riportate nell'Appendice 7, necessarie per lo svolgimento delle fasi successive della ricerca.

Fase I della ricerca“Studio dei risultati del centramento del bersaglio del gioco sportivo di Freccette da parte di ciascun membro della squadra per il rispetto della normale legge di distribuzione secondo il criterio χ2 Pearson e il criterio dei tre sigma"

1. misurare (testare) la tua velocità (personale) e la coordinazione delle azioni, lanciando freccette 30-40 volte su un bersaglio circolare nel gioco sportivo Darts.

2. Risultati delle misurazioni (test) x io(in bicchieri) formattato sotto forma di serie di variazioni e inserito nella tabella 4.1 (colonne , eseguire tutti i calcoli necessari, compilare le tabelle necessarie e trarre conclusioni appropriate sulla conformità della distribuzione empirica risultante con la legge di distribuzione normale, secondo analogia con calcoli, tabelle e conclusioni simili dell'esempio 2.12, riportati nella sezione 2 delle presenti linee guida alle pagine 7 - 10.

Tabella 4.1

Corrispondenza della velocità e della coordinazione delle azioni dei soggetti alla legge di distribuzione normale

NO. arrotondato
Totale

II – fase della ricerca

"Valutazione degli indicatori medi della popolazione generale dei colpi sul bersaglio del gioco sportivo di freccette di tutti gli studenti del gruppo di studio sulla base dei risultati delle misurazioni dei membri di una squadra"

Valutare gli indicatori medi di velocità e coordinazione delle azioni di tutti gli studenti del gruppo di studio (secondo l'elenco del gruppo di studio nella rivista di classe) in base ai risultati ottenuti nella prima fase nel colpire il bersaglio delle freccette di tutti i membri del team di ricerca di questo lavoro di laboratorio.

1. Documentare i risultati delle misurazioni della velocità e del coordinamento delle azioni quando si lanciano le freccette su un bersaglio circolare nel gioco sportivo Freccette di tutti i membri della squadra (2 - 4 persone), che rappresentano un campione di risultati di misurazione della popolazione generale (risultati di misurazione di tutti gli studenti in un gruppo di studio - ad esempio, 15 persone), inserendoli nella seconda e terza colonna Tabella 4.2.

Tabella 4.2

Indicatori di elaborazione di velocità e coordinamento delle azioni

membri della brigata

NO.
Totale

Nella tabella 4.2 sotto dovrebbe essere compreso , punteggio medio corrispondente (vedere i risultati del calcolo nella Tabella 4.1) membri della tua squadra ( , ottenuti nella prima fase della ricerca. Va notato che, di regola, La tabella 4.2 contiene il valore medio calcolato dei risultati delle misurazioni ottenuti da un membro del gruppo nella prima fase della ricerca , poiché la probabilità che i risultati delle misurazioni dei diversi membri del team coincidano è molto piccola. Poi, di regola, i valori nella colonna Tabella 4.2 per ogni riga - uguale a 1, UN nella riga “Totale "colonne" ", è scritto il numero di membri della tua squadra.

2. Eseguire tutti i calcoli necessari per compilare la Tabella 4.2, così come altri calcoli e conclusioni simili ai calcoli e alle conclusioni dell'esempio 2.13 forniti nella 2a sezione di questo sviluppo metodologico alle pagine 13-14. Dovrebbe essere tenuto presente quando si calcola l’errore di rappresentatività "M" è necessario utilizzare la formula 2.4 riportata a pagina 13 di questo sviluppo metodologico, poiché il campione è piccolo (n, e il numero di elementi della popolazione generale N è noto, ed è pari al numero di studenti del gruppo di studio, secondo l'elenco della rivista del gruppo di studio.

III – fase della ricerca

Valutazione dell'efficacia del riscaldamento secondo l'indicatore "Velocità e coordinazione delle azioni" da parte di ciascun membro del team utilizzando il test t di Student

Valutare l'efficacia del riscaldamento per lanciare freccette contro il bersaglio del gioco sportivo "Darts", eseguito nella prima fase di ricerca di questo lavoro di laboratorio, da ciascun membro della squadra secondo l'indicatore "Velocità e coordinamento delle azioni", utilizzando il criterio di Student - un criterio parametrico per l'affidabilità statistica della legge di distribuzione empirica rispetto alla legge di distribuzione normale.

… Totale

2. varianze e RMS , risultati delle misurazioni dell'indicatore "Velocità e coordinamento delle azioni" sulla base dei risultati del riscaldamento, riportati nella tabella 4.3, (vedi calcoli simili riportati subito dopo la tabella 2.30 dell'esempio 2.14 a pagina 16 di questo sviluppo metodologico).

3. Ogni membro del gruppo di lavoro misurare (testare) la velocità (personale) e la coordinazione delle azioni dopo il riscaldamento,

… Totale

5. Eseguire calcoli medi varianze e RMS ,risultati delle misurazioni dell'indicatore "Velocità e coordinazione delle azioni" dopo il riscaldamento, riportati nella tabella 4.4, annotare il risultato complessivo della misurazione in base ai risultati del riscaldamento (vedi calcoli simili riportati subito dopo la tabella 2.31 dell'esempio 2.14 a pagina 17 di questo sviluppo metodologico).

6. Eseguire tutti i calcoli e le conclusioni necessari simili ai calcoli e alle conclusioni dell'esempio 2.14 forniti nella 2a sezione di questo sviluppo metodologico alle pagine 16-17. Dovrebbe essere tenuto presente quando si calcola l’errore di rappresentatività "M" è necessario utilizzare la formula 2.1 riportata a pagina 12 di questo sviluppo metodologico, poiché il campione è n e il numero di elementi della popolazione N ( è sconosciuto.

IV – fase della ricerca

Valutazione dell'uniformità (stabilità) degli indicatori “Velocità e coordinamento delle azioni” di due membri del team utilizzando il criterio di Fisher

Valutare l'uniformità (stabilità) degli indicatori “Velocità e coordinazione delle azioni” di due membri del team utilizzando il criterio di Fisher, sulla base dei risultati di misurazione ottenuti nella terza fase della ricerca in questo lavoro di laboratorio.

Per fare ciò è necessario fare quanto segue.

Utilizzando i dati delle tabelle 4.3 e 4.4, i risultati del calcolo delle varianze da queste tabelle ottenuti nella terza fase della ricerca, nonché la metodologia per il calcolo e l'applicazione del criterio di Fisher per valutare l'uniformità (stabilità) degli indicatori sportivi, riportati in esempio 2.15 alle pagine 18-19 di questo sviluppo metodologico, trarre conclusioni statistiche e pedagogiche appropriate.

V – fase della ricerca

Valutazione di gruppi di indicatori “Velocità e coordinamento delle azioni” di un membro del team prima e dopo il riscaldamento

AFFIDABILITÀ STATISTICA

- Inglese credibilità/validità, statistica; tedesco Validità, statistica. Coerenza, oggettività e assenza di ambiguità in un test statistico o in un q.l. insieme di misurazioni. D.s. può essere testato ripetendo lo stesso test (o questionario) sullo stesso argomento per vedere se si ottengono gli stessi risultati; o confrontando diverse parti di un test che dovrebbero misurare lo stesso oggetto.

Antinazi. Enciclopedia della sociologia, 2009

Scopri cos'è "AFFIDABILITÀ STATISTICA" in altri dizionari:

    AFFIDABILITÀ STATISTICA- Inglese credibilità/validità, statistica; tedesco Validità, statistica. Coerenza, oggettività e assenza di ambiguità in un test statistico o in un q.l. insieme di misurazioni. D.s. può essere verificato ripetendo lo stesso test (o... Dizionario esplicativo di sociologia

    In statistica, un valore è detto statisticamente significativo se la probabilità che si verifichi per caso o anche per valori più estremi è bassa. Qui per estremo intendiamo il grado di deviazione delle statistiche del test dall'ipotesi nulla. La differenza si chiama... ...Wikipedia

    Il fenomeno fisico della stabilità statistica è che all’aumentare della dimensione del campione, la frequenza di un evento casuale o il valore medio di una quantità fisica tende ad un certo numero fisso. Il fenomeno della statistica... ... Wikipedia

    AFFIDABILITÀ DELLE DIFFERENZE (Somiglianze)- procedura statistica analitica per stabilire il livello di significatività delle differenze o somiglianze tra i campioni in base agli indicatori studiati (variabili) ... Processo educativo moderno: concetti e termini di base

    RENDICONTAZIONE, STATISTICA Ottimo dizionario contabile

    RENDICONTAZIONE, STATISTICA- una forma di osservazione statistica statale, in cui le autorità competenti ricevono dalle imprese (organizzazioni e istituzioni) le informazioni di cui hanno bisogno sotto forma di documenti di rendicontazione legalmente stabiliti (rapporti statistici) per... Ampio dizionario economico

    Una scienza che studia i metodi di osservazione sistematica dei fenomeni di massa nella vita sociale umana, compilandone descrizioni numeriche e l'elaborazione scientifica di queste descrizioni. Pertanto, la statistica teorica è una scienza... ... Dizionario Enciclopedico F.A. Brockhaus e I.A. Efron

    Coefficiente di correlazione- (Coefficiente di correlazione) Il coefficiente di correlazione è un indicatore statistico della dipendenza di due variabili casuali Definizione del coefficiente di correlazione, tipi di coefficienti di correlazione, proprietà del coefficiente di correlazione, calcolo e applicazione... ... Enciclopedia degli investitori

    Statistiche- (Statistica) La statistica è una scienza teorica generale che studia i cambiamenti quantitativi nei fenomeni e nei processi. Statistiche statali, servizi statistici, Rosstat (Goskomstat), dati statistici, statistiche di query, statistiche di vendita,... ... Enciclopedia degli investitori

    Correlazione- (Correlazione) La correlazione è una relazione statistica tra due o più variabili casuali Il concetto di correlazione, tipi di correlazione, coefficiente di correlazione, analisi di correlazione, correlazione dei prezzi, correlazione di coppie di valute sui contenuti Forex... ... Enciclopedia degli investitori

Libri

  • Ricerca in matematica e matematica nella ricerca: raccolta metodologica sulle attività di ricerca degli studenti, Borzenko V.I.. La raccolta presenta sviluppi metodologici applicabili nell'organizzazione delle attività di ricerca degli studenti. La prima parte della raccolta è dedicata all'applicazione di un approccio di ricerca in...

Cosa pensi che renda la tua “altra metà” speciale e significativa? È legato alla sua personalità o ai sentimenti che provi per questa persona? O forse con il semplice fatto che l'ipotesi sulla casualità della tua simpatia, come dimostrano gli studi, ha una probabilità inferiore al 5%? Se consideriamo attendibile l'ultima affermazione, in linea di principio non esisterebbero siti di incontri di successo:

Quando esegui split test o qualsiasi altra analisi del tuo sito, l'incomprensione del "significato statistico" può portare a un'errata interpretazione dei risultati e, quindi, ad azioni errate nel processo di ottimizzazione della conversione. Questo vale per le migliaia di altri test statistici eseguiti ogni giorno in ogni settore esistente.

Per capire cos'è il "significato statistico", devi immergerti nella storia del termine, apprenderne il vero significato e capire come questa "nuova" vecchia comprensione ti aiuterà a interpretare correttamente i risultati della tua ricerca.

Un po' di storia

Sebbene l’umanità abbia utilizzato la statistica per risolvere vari problemi per molti secoli, la moderna comprensione della significatività statistica, della verifica delle ipotesi, della randomizzazione e persino della progettazione degli esperimenti (DOE) ha cominciato a prendere forma solo all’inizio del 20° secolo ed è indissolubilmente legata con il nome di Sir Ronald Fisher (Sir Ronald Fisher, 1890-1962):

Ronald Fisher era un biologo e statistico evoluzionista che aveva una passione speciale per lo studio dell'evoluzione e della selezione naturale nei regni animale e vegetale. Nel corso della sua illustre carriera, sviluppò e rese popolare molti utili strumenti statistici che utilizziamo ancora oggi.

Fisher ha utilizzato le tecniche da lui sviluppate per spiegare processi biologici come la dominanza, le mutazioni e le deviazioni genetiche. Oggi possiamo utilizzare gli stessi strumenti per ottimizzare e migliorare il contenuto delle risorse web. Il fatto che questi strumenti di analisi possano essere utilizzati per lavorare con oggetti che non esistevano nemmeno al momento della loro creazione sembra piuttosto sorprendente. È altrettanto sorprendente che le persone eseguissero calcoli complessi senza calcolatrici o computer.

Per descrivere i risultati di un esperimento statistico come aventi un’alta probabilità di essere veri, Fisher ha usato la parola “significatività”.

Inoltre, uno degli sviluppi più interessanti di Fisher può essere definito l’ipotesi del “figlio sexy”. Secondo questa teoria, le donne preferiscono gli uomini sessualmente promiscui (promiscui) perché ciò consentirà ai figli nati da questi uomini di avere la stessa predisposizione e di produrre più prole (nota che questa è solo una teoria).

Ma nessuno, nemmeno i brillanti scienziati, è immune dal commettere errori. I difetti di Fisher affliggono ancora oggi gli specialisti. Ma ricordate le parole di Albert Einstein: “Chi non ha mai commesso un errore non ha mai creato nulla di nuovo”.

Prima di passare al punto successivo, ricorda: la significatività statistica si verifica quando la differenza nei risultati dei test è così grande che la differenza non può essere spiegata da fattori casuali.

Qual è la tua ipotesi?

Per capire cosa significa “significatività statistica”, è necessario prima capire cos’è il “test delle ipotesi”, poiché i due termini sono strettamente intrecciati.
Un'ipotesi è solo una teoria. Una volta sviluppata una teoria, dovrai stabilire un processo per raccogliere prove sufficienti e raccoglierle effettivamente. Ci sono due tipi di ipotesi.

Mele o arance: quale è meglio?

Ipotesi nulla

Di norma, è qui che molte persone incontrano difficoltà. Una cosa da tenere presente è che un'ipotesi nulla non è qualcosa che deve essere dimostrato, come, ad esempio, provare che un certo cambiamento su un sito web porterà ad un aumento delle conversioni, ma viceversa. L'ipotesi nulla è una teoria secondo la quale se si apportano modifiche al sito, non accadrà nulla. E l'obiettivo del ricercatore è confutare questa teoria, non dimostrarla.

Se guardiamo all’esperienza della risoluzione dei reati, dove gli investigatori formulano anche ipotesi su chi sia il colpevole, l’ipotesi nulla assume la forma della cosiddetta presunzione di innocenza, il concetto secondo il quale l’imputato si presuppone innocente fino a prova contraria. in un tribunale.

Se l'ipotesi nulla è che due oggetti abbiano proprietà uguali e stai cercando di dimostrare che uno di essi è migliore (ad esempio, A è migliore di B), devi rifiutare l'ipotesi nulla a favore dell'alternativa. Ad esempio, stai confrontando l'uno o l'altro strumento di ottimizzazione delle conversioni. Nell'ipotesi nulla, entrambi hanno lo stesso effetto (o nessun effetto) sul bersaglio. In alternativa, l'effetto di uno di essi è migliore.

La tua ipotesi alternativa può contenere un valore numerico, ad esempio B - A > 20%. In questo caso l’ipotesi nulla e l’alternativa possono assumere la seguente forma:

Un altro nome per un'ipotesi alternativa è un'ipotesi di ricerca perché il ricercatore è sempre interessato a dimostrare questa particolare ipotesi.

Significatività statistica e valore p

Torniamo ancora a Ronald Fisher e al suo concetto di significatività statistica.

Ora che hai un'ipotesi nulla e un'alternativa, come puoi dimostrarne una e confutare l'altra?

Poiché le statistiche, per loro stessa natura, implicano lo studio di una popolazione specifica (campione), non si può mai essere sicuri al 100% dei risultati ottenuti. Un buon esempio: i risultati elettorali spesso differiscono dai risultati dei sondaggi preliminari e persino dai risultati degli exit pool.

Il dottor Fisher voleva creare una linea di demarcazione che ti permettesse di sapere se il tuo esperimento è stato un successo o meno. Ecco come è apparso l'indice di affidabilità. La credibilità è il livello che prendiamo per dire cosa consideriamo “significativo” e cosa no. Se "p", l'indice di significatività, è pari o inferiore a 0,05, i risultati sono affidabili.

Non preoccuparti, in realtà non è così confuso come sembra.

Distribuzione di probabilità gaussiana. Lungo i bordi sono riportati i valori meno probabili della variabile, al centro quelli più probabili. Il punteggio P (area ombreggiata in verde) è la probabilità che il risultato osservato si verifichi per caso.

La distribuzione di probabilità normale (distribuzione gaussiana) è una rappresentazione di tutti i possibili valori di una determinata variabile su un grafico (nella figura sopra) e delle loro frequenze. Se esegui correttamente la tua ricerca e poi tracci tutte le tue risposte su un grafico, otterrai esattamente questa distribuzione. Secondo la distribuzione normale, riceverai un'alta percentuale di risposte simili e le restanti opzioni si troveranno ai bordi del grafico (le cosiddette "code"). Questa distribuzione di valori si trova spesso in natura, motivo per cui viene chiamata “normale”.

Utilizzando un'equazione basata sul campione e sui risultati del test, puoi calcolare quella che viene chiamata "statistica del test", che indicherà quanto deviano i risultati. Ti dirà anche quanto sei vicino alla verità dell'ipotesi nulla.

Per aiutarti a capirlo, utilizza i calcolatori online per calcolare la significatività statistica:

Un esempio di tali calcolatori

La lettera "p" rappresenta la probabilità che l'ipotesi nulla sia vera. Se il numero è piccolo, indicherà una differenza tra i gruppi di test, mentre l’ipotesi nulla sarebbe che siano uguali. Graficamente, sembrerà che la statistica del tuo test sarà più vicina a una delle code della distribuzione a campana.

Il Dr. Fisher ha deciso di fissare la soglia di significatività a p ≤ 0,05. Tuttavia, questa affermazione è controversa, poiché porta a due difficoltà:

1. Innanzitutto, il fatto che tu abbia dimostrato falsa l'ipotesi nulla non significa che tu abbia dimostrato l'ipotesi alternativa. Tutto questo significato significa semplicemente che non puoi dimostrare né A né B.

2. In secondo luogo, se il punteggio p è 0,049, ciò significherà che la probabilità dell'ipotesi nulla sarà del 4,9%. Ciò potrebbe significare che i risultati del test potrebbero essere sia veri che falsi allo stesso tempo.

Puoi utilizzare o meno il punteggio p, ma poi dovrai calcolare caso per caso la probabilità dell'ipotesi nulla e decidere se è abbastanza grande da impedirti di apportare le modifiche pianificate e testate .

Lo scenario più comune per condurre un test statistico oggi è quello di impostare una soglia di significatività di p ≤ 0,05 prima di eseguire il test stesso. Assicurati solo di guardare attentamente il valore p quando controlli i risultati.

Errori 1 e 2

È passato così tanto tempo che agli errori che possono verificarsi quando si utilizza la metrica di significatività statistica sono stati persino dati dei nomi.

Errori di tipo 1

Come accennato in precedenza, un valore p pari a 0,05 significa che esiste una probabilità del 5% che l'ipotesi nulla sia vera. Se non lo fai, commetterai l'errore numero 1. I risultati dicono che il tuo nuovo sito web ha aumentato i tassi di conversione, ma c'è una probabilità del 5% che non sia così.

Errori di tipo 2

Questo errore è l'opposto dell'errore 1: accetti l'ipotesi nulla quando è falsa. Ad esempio, i risultati dei test ti dicono che le modifiche apportate al sito non hanno portato alcun miglioramento, mentre i cambiamenti ci sono stati. Di conseguenza, perdi l’opportunità di migliorare le tue prestazioni.

Questo errore è comune nei test con una dimensione del campione insufficiente, quindi ricorda: più grande è il campione, più affidabile è il risultato.

Conclusione

Forse nessun termine è tanto popolare tra i ricercatori quanto la significatività statistica. Quando i risultati dei test non sono statisticamente significativi, le conseguenze vanno dall’aumento dei tassi di conversione al fallimento di un’azienda.

E poiché gli esperti di marketing utilizzano questo termine per ottimizzare le proprie risorse, è necessario sapere cosa significa realmente. Le condizioni del test possono variare, ma la dimensione del campione e i criteri di successo sono sempre importanti. Ricordalo.



Questo articolo è disponibile anche nelle seguenti lingue: tailandese

  • Prossimo

    GRAZIE mille per le informazioni molto utili contenute nell'articolo. Tutto è presentato in modo molto chiaro. Sembra che sia stato fatto molto lavoro per analizzare il funzionamento del negozio eBay

    • Grazie a te e agli altri lettori abituali del mio blog. Senza di te, non sarei abbastanza motivato da dedicare molto tempo al mantenimento di questo sito. Il mio cervello è strutturato in questo modo: mi piace scavare in profondità, sistematizzare dati sparsi, provare cose che nessuno ha mai fatto prima o guardato da questa angolazione. È un peccato che i nostri connazionali non abbiano tempo per fare acquisti su eBay a causa della crisi in Russia. Acquistano da Aliexpress dalla Cina, poiché le merci sono molto più economiche (spesso a scapito della qualità). Ma le aste online eBay, Amazon, ETSY daranno facilmente ai cinesi un vantaggio nella gamma di articoli di marca, articoli vintage, articoli fatti a mano e vari articoli etnici.

      • Prossimo

        Ciò che è prezioso nei tuoi articoli è il tuo atteggiamento personale e l'analisi dell'argomento. Non mollare questo blog, ci vengo spesso. Dovrebbero essere in molti così. Inviami un'e-mail Recentemente ho ricevuto un'e-mail con un'offerta che mi avrebbero insegnato come fare trading su Amazon ed eBay.

  • E mi sono ricordato dei tuoi articoli dettagliati su questi mestieri. zona Ho riletto tutto di nuovo e ho concluso che i corsi sono una truffa. Non ho ancora comprato nulla su eBay. Non vengo dalla Russia, ma dal Kazakistan (Almaty). Ma non abbiamo ancora bisogno di spese aggiuntive.
    https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png