Questa pagina descrive un esempio standard di ricerca della varianza; puoi anche esaminare altri problemi per trovarla

Esempio 1. Determinazione del gruppo, della media del gruppo, dell'intergruppo e della varianza totale

Esempio 2. Trovare la varianza e il coefficiente di variazione in una tabella di raggruppamento

Esempio 3. Trovare la varianza in una serie discreta

Esempio 4. I seguenti dati sono disponibili per un gruppo di 20 studenti per corrispondenza. È necessario costruire una serie di intervalli della distribuzione della caratteristica, calcolare il valore medio della caratteristica e studiarne la dispersione

Costruiamo un raggruppamento di intervalli. Determiniamo l'intervallo dell'intervallo utilizzando la formula:

dove X max è il valore massimo della caratteristica di raggruppamento;
X min – valore minimo della caratteristica di raggruppamento;
n – numero di intervalli:

Accettiamo n=5. Il passo è: h = (192 - 159)/ 5 = 6,6

Creiamo un raggruppamento di intervalli

Per ulteriori calcoli, costruiremo una tabella ausiliaria:

X"i – la metà dell'intervallo. (ad esempio, la metà dell'intervallo 159 – 165,6 = 162,3)

Determiniamo l'altezza media degli studenti utilizzando la formula della media aritmetica ponderata:

Determiniamo la varianza utilizzando la formula:

La formula può essere trasformata in questo modo:

Da questa formula ne consegue che la varianza è uguale a la differenza tra la media dei quadrati delle opzioni e il quadrato e la media.

Dispersione in serie di variazioni con intervalli uguali utilizzando il metodo dei momenti può essere calcolato nel modo seguente utilizzando la seconda proprietà della dispersione (dividendo tutte le opzioni per il valore dell'intervallo). Determinazione della varianza, calcolato con il metodo dei momenti, utilizzando la seguente formula risulta meno laborioso:

dove i è il valore dell'intervallo;
A è uno zero convenzionale, per il quale conviene utilizzare la metà dell'intervallo con la frequenza più alta;
m1 è il quadrato del momento del primo ordine;
m2 - momento del secondo ordine

Varianza dei tratti alternativi (se in una popolazione statistica una caratteristica cambia in modo tale che ci sono solo due opzioni mutuamente esclusive, allora tale variabilità è detta alternativa) può essere calcolata utilizzando la formula:

Sostituendo q = 1- p in questa formula di dispersione, otteniamo:

Tipi di varianza

Varianza totale misura la variazione di una caratteristica nell'intera popolazione sotto l'influenza di tutti i fattori che causano questa variazione. È pari alla media quadratica degli scostamenti dei singoli valori di una caratteristica x dal valore medio complessivo di x e può essere definita varianza semplice o varianza ponderata.

Varianza all'interno del gruppo caratterizza la variazione casuale, cioè parte della variazione che è dovuta all'influenza di fattori non contabilizzati e non dipende dal fattore-attributo che costituisce la base del gruppo. Tale dispersione è pari alla media quadratica degli scostamenti dei singoli valori dell'attributo all'interno del gruppo X dalla media aritmetica del gruppo e può essere calcolata come dispersione semplice o come dispersione ponderata.



Così, misure della varianza all’interno del gruppo variazione di un tratto all'interno di un gruppo ed è determinata dalla formula:

dove xi è la media del gruppo;
ni è il numero di unità nel gruppo.

Ad esempio, le variazioni intragruppo che devono essere determinate nel compito di studiare l'influenza delle qualifiche dei lavoratori sul livello di produttività del lavoro in un'officina mostrano variazioni nella produzione in ciascun gruppo causate da tutti i possibili fattori (condizioni tecniche delle attrezzature, disponibilità di strumenti e materiali, età dei lavoratori, intensità di lavoro, ecc.), fatta eccezione per le differenze nella categoria di qualifica (all'interno di un gruppo tutti i lavoratori hanno le stesse qualifiche).

La teoria della probabilità è una branca speciale della matematica che viene studiata solo dagli studenti degli istituti di istruzione superiore. Ti piacciono i calcoli e le formule? Hai paura della prospettiva di conoscere la distribuzione normale, l'entropia dell'insieme, l'aspettativa matematica e la dispersione di una variabile casuale discreta? Allora questo argomento sarà molto interessante per te. Facciamo conoscenza con alcuni dei concetti di base più importanti di questo ramo della scienza.

Ricordiamo le basi

Anche se ricordi i concetti più semplici della teoria della probabilità, non trascurare i primi paragrafi dell'articolo. Il punto è che senza una chiara comprensione delle basi, non sarai in grado di lavorare con le formule discusse di seguito.

Quindi si verifica qualche evento casuale, qualche esperimento. Come risultato delle azioni che intraprendiamo, possiamo ottenere diversi risultati: alcuni si verificano più spesso, altri meno spesso. La probabilità di un evento è il rapporto tra il numero di risultati effettivamente ottenuti di un tipo e il numero totale di quelli possibili. Solo conoscendo la definizione classica di questo concetto puoi iniziare a studiare l'aspettativa matematica e la dispersione delle variabili casuali continue.

Media aritmetica

Ai tempi della scuola, durante le lezioni di matematica, hai iniziato a lavorare con la media aritmetica. Questo concetto è ampiamente utilizzato nella teoria della probabilità e quindi non può essere ignorato. La cosa principale per noi in questo momento è che lo incontreremo nelle formule per l'aspettativa matematica e la dispersione di una variabile casuale.

Abbiamo una sequenza di numeri e vogliamo trovare la media aritmetica. Tutto ciò che ci viene richiesto è sommare tutto ciò che è disponibile e dividerlo per il numero di elementi nella sequenza. Prendiamo i numeri da 1 a 9. La somma degli elementi sarà uguale a 45 e divideremo questo valore per 9. Risposta: - 5.

Dispersione

In termini scientifici la dispersione è il quadrato medio degli scostamenti dei valori ottenuti di una caratteristica dalla media aritmetica. È designato con una lettera latina maiuscola D. Cosa è necessario per calcolarlo? Per ogni elemento della sequenza, calcoliamo la differenza tra il numero esistente e la media aritmetica e la eleviamo al quadrato. Ci saranno esattamente tanti valori quanti possono essere i risultati per l’evento che stiamo considerando. Successivamente, riassumiamo tutto ciò che abbiamo ricevuto e lo dividiamo per il numero di elementi nella sequenza. Se abbiamo cinque possibili risultati, dividi per cinque.

La dispersione ha anche proprietà che devono essere ricordate per essere utilizzate nella risoluzione dei problemi. Ad esempio, quando si aumenta una variabile casuale di X volte, la varianza aumenta di X volte al quadrato (cioè X*X). Non è mai inferiore a zero e non dipende dallo spostamento dei valori verso l'alto o verso il basso di pari quantità. Inoltre, per prove indipendenti, la varianza della somma è uguale alla somma delle varianze.

Ora dobbiamo assolutamente considerare esempi di varianza di una variabile casuale discreta e di aspettativa matematica.

Diciamo che abbiamo eseguito 21 esperimenti e ottenuto 7 risultati diversi. Li abbiamo osservati rispettivamente 1, 2, 2, 3, 4, 4 e 5 volte. A quanto sarà uguale la varianza?

Per prima cosa calcoliamo la media aritmetica: la somma degli elementi, ovviamente, è 21. Dividila per 7, ottenendo 3. Ora sottrai 3 da ciascun numero nella sequenza originale, eleva ogni valore al quadrato e somma i risultati. Il risultato è 12. Ora non resta che dividere il numero per il numero degli elementi e, a quanto pare, è tutto. Ma c'è un problema! Discutiamone.

Dipendenza dal numero di esperimenti

Si scopre che quando si calcola la varianza, il denominatore può contenere uno dei due numeri: N o N-1. Qui N è il numero di esperimenti eseguiti o il numero di elementi nella sequenza (che è essenzialmente la stessa cosa). Da cosa dipende questo?

Se il numero di test è misurato in centinaia, allora dobbiamo mettere N al denominatore. Se in unità, allora N-1. Gli scienziati hanno deciso di tracciare il confine in modo abbastanza simbolico: oggi passa attraverso il numero 30. Se abbiamo condotto meno di 30 esperimenti, divideremo l'importo per N-1 e, se di più, per N.

Compito

Torniamo al nostro esempio di risoluzione del problema della varianza e delle aspettative matematiche. Abbiamo ottenuto un numero intermedio 12, che doveva essere diviso per N o N-1. Dato che abbiamo condotto 21 esperimenti, ovvero meno di 30, sceglieremo la seconda opzione. Quindi la risposta è: la varianza è 12/2 = 2.

Aspettativa

Passiamo al secondo concetto, che dobbiamo considerare in questo articolo. L'aspettativa matematica è il risultato della somma di tutti i possibili risultati moltiplicati per le probabilità corrispondenti. È importante comprendere che il valore ottenuto, così come il risultato del calcolo della varianza, viene ottenuto solo una volta per l'intero problema, indipendentemente dal numero di risultati in esso considerati.

La formula per l'aspettativa matematica è abbastanza semplice: prendiamo il risultato, moltiplichiamo per la sua probabilità, aggiungiamo lo stesso per il secondo, terzo risultato, ecc. Tutto ciò che riguarda questo concetto non è difficile da calcolare. Ad esempio, la somma dei valori attesi è uguale al valore atteso della somma. Lo stesso vale per il lavoro. Non tutte le quantità nella teoria della probabilità consentono di eseguire operazioni così semplici. Prendiamo il problema e calcoliamo il significato di due concetti che abbiamo studiato contemporaneamente. Inoltre, siamo stati distratti dalla teoria: è ora di praticare.

Un altro esempio

Abbiamo eseguito 50 prove e ottenuto 10 tipi di risultati - numeri da 0 a 9 - che apparivano in percentuali diverse. Questi sono rispettivamente: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Ricordiamo che per ottenere le probabilità è necessario dividere i valori percentuali per 100. Otteniamo quindi 0,02; 0,1, ecc. Presentiamo un esempio di risoluzione del problema relativo alla varianza di una variabile casuale e all'aspettativa matematica.

Calcoliamo la media aritmetica utilizzando la formula che ricordiamo dalle elementari: 50/10 = 5.

Ora convertiamo le probabilità nel numero di risultati “in pezzi” per facilitare il conteggio. Otteniamo 1, 5, 2, 7, 1, 9, 3, 8, 5 e 9. Da ogni valore ottenuto sottraiamo la media aritmetica, dopodiché eleviamo al quadrato ciascuno dei risultati ottenuti. Scopri come farlo utilizzando il primo elemento come esempio: 1 - 5 = (-4). Successivamente: (-4) * (-4) = 16. Per altri valori, esegui queste operazioni da solo. Se hai fatto tutto correttamente, dopo averli sommati otterrai 90.

Continuiamo a calcolare la varianza e il valore atteso dividendo 90 per N. Perché scegliamo N anziché N-1? Esatto, perché il numero di esperimenti eseguiti supera 30. Quindi: 90/10 = 9. Abbiamo ottenuto la varianza. Se ricevi un numero diverso, non disperare. Molto probabilmente hai commesso un semplice errore nei calcoli. Ricontrolla ciò che hai scritto e probabilmente tutto andrà a posto.

Infine, ricorda la formula per l'aspettativa matematica. Non forniremo tutti i calcoli, scriveremo solo una risposta che potrai verificare dopo aver completato tutte le procedure richieste. Il valore previsto sarà 5,48. Ricordiamo solo come eseguire le operazioni, prendendo come esempio i primi elementi: 0*0.02 + 1*0.1... e così via. Come puoi vedere, moltiplichiamo semplicemente il valore del risultato per la sua probabilità.

Deviazione

Un altro concetto strettamente correlato alla dispersione e alle aspettative matematiche è la deviazione standard. Si denota sia con la lettera latina sd, sia con la minuscola greca “sigma”. Questo concetto mostra quanto in media i valori si discostano dalla caratteristica centrale. Per trovare il suo valore, è necessario calcolare la radice quadrata della varianza.

Se si traccia un grafico di distribuzione normale e si desidera vedere la deviazione quadrata direttamente su di esso, è possibile farlo in più fasi. Prendi metà dell'immagine a sinistra o a destra della modalità (valore centrale), disegna una perpendicolare all'asse orizzontale in modo che le aree delle figure risultanti siano uguali. La dimensione del segmento tra il centro della distribuzione e la proiezione risultante sull'asse orizzontale rappresenterà la deviazione standard.

Software

Come si può vedere dalle descrizioni delle formule e dagli esempi presentati, il calcolo della varianza e dell'aspettativa matematica non è la procedura più semplice dal punto di vista aritmetico. Per non perdere tempo, ha senso utilizzare il programma utilizzato negli istituti di istruzione superiore: si chiama "R". Dispone di funzioni che consentono di calcolare valori per molti concetti della statistica e della teoria della probabilità.

Ad esempio, specifichi un vettore di valori. Questo viene fatto come segue: vettore<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Insomma

La dispersione e l'aspettativa matematica sono elementi senza i quali è difficile calcolare qualcosa in futuro. Nel corso principale delle lezioni universitarie, vengono discussi già nei primi mesi di studio della materia. È proprio a causa della mancata comprensione di questi semplici concetti e dell'incapacità di calcolarli che molti studenti iniziano immediatamente a rimanere indietro nel programma e alla fine ricevono brutti voti, il che li priva delle borse di studio.

Esercitati per almeno una settimana, mezz'ora al giorno, risolvendo compiti simili a quelli presentati in questo articolo. Quindi, in qualsiasi test di teoria della probabilità, sarai in grado di affrontare gli esempi senza suggerimenti e trucchi estranei.

Spesso nelle statistiche, quando si analizza un fenomeno o un processo, è necessario tenere conto non solo delle informazioni sui livelli medi degli indicatori studiati, ma anche dispersione o variazione dei valori delle singole unità , che è una caratteristica importante della popolazione studiata.

I più soggetti a variazione sono i prezzi delle azioni, la domanda e l’offerta e i tassi di interesse in periodi di tempo diversi e in luoghi diversi.

I principali indicatori che caratterizzano la variazione , sono intervallo, dispersione, deviazione standard e coefficiente di variazione.

Gamma di variazione rappresenta la differenza tra i valori massimo e minimo della caratteristica: R = Xmax – Xmin. Lo svantaggio di questo indicatore è che valuta solo i limiti di variazione di un tratto e non riflette la sua variabilità entro questi confini.

Dispersione manca questa mancanza. Si calcola come il quadrato medio degli scostamenti dei valori caratteristici dal loro valore medio:

Un modo semplificato per calcolare la varianza effettuata utilizzando le seguenti formule (semplici e ponderate):

Esempi di applicazione di queste formule sono presentati nelle attività 1 e 2.

Un indicatore ampiamente utilizzato nella pratica è deviazione standard :

La deviazione standard è definita come la radice quadrata della varianza e ha la stessa dimensione della caratteristica studiata.

Gli indicatori considerati ci permettono di ottenere il valore assoluto della variazione, ovvero valutarlo in unità di misura della caratteristica oggetto di studio. A differenza di loro, coefficiente di variazione misura la variabilità in termini relativi, rispetto al livello medio, che in molti casi è preferibile.

Formula per il calcolo del coefficiente di variazione.

Esempi di risoluzione di problemi sull'argomento "Indicatori di variazione nelle statistiche"

Problema 1 . Nello studio dell'influenza della pubblicità sull'entità del deposito mensile medio nelle banche della regione, sono state esaminate 2 banche. Sono stati ottenuti i seguenti risultati:

Definire:
1) per ciascuna banca: a) deposito medio mensile; b) dispersione contributiva;
2) il deposito medio mensile di due banche insieme;
3) Variazione dei depositi per 2 banche, a seconda della pubblicità;
4) Variazione dei depositi per 2 banche, dipendente da tutti i fattori tranne la pubblicità;
5) Varianza totale utilizzando la regola dell'addizione;
6) Coefficiente di determinazione;
7) Rapporto di correlazione.

Soluzione

1) Creiamo una tabella di calcolo per una banca con pubblicità . Per determinare il deposito mensile medio, troveremo i punti medi degli intervalli. In questo caso il valore dell'intervallo aperto (il primo) è condizionalmente equiparato al valore dell'intervallo ad esso adiacente (il secondo).

Troveremo la dimensione media del deposito utilizzando la formula della media aritmetica ponderata:

29.000/50 = 580 rubli.

Troviamo la varianza del contributo utilizzando la formula:

23 400/50 = 468

Eseguiremo azioni simili per una banca senza pubblicità :

2) Troviamo insieme la dimensione media del deposito per le due banche. Хср =(580×50+542,8×50)/100 = 561,4 rub.

3) Troveremo la varianza del deposito per due banche, a seconda della pubblicità, utilizzando la formula: σ 2 =pq (formula per la varianza di un attributo alternativo). Qui p=0,5 è la proporzione dei fattori dipendenti dalla pubblicità; q=1-0,5, allora σ2 =0,5*0,5=0,25.

4) Poiché la quota degli altri fattori è 0,5, anche la varianza del deposito per due banche, che dipende da tutti i fattori tranne la pubblicità, è 0,25.

5) Determinare la varianza totale utilizzando la regola dell'addizione.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 fatto + σ 2 resto = 552,08+345,96 = 898,04

6) Coefficiente di determinazione η 2 = σ 2 fatto / σ 2 = 345,96/898,04 = 0,39 = 39% - l'entità del contributo dipende per il 39% dalla pubblicità.

7) Rapporto di correlazione empirica η = √η 2 = √0,39 = 0,62 – la relazione è abbastanza stretta.

Problema 2 . Esiste un raggruppamento di imprese in base alla dimensione dei prodotti commerciabili:

Determinare: 1) la dispersione del valore dei prodotti commerciabili; 2) deviazione standard; 3) coefficiente di variazione.

Soluzione

1) Per condizione, viene presentata una serie di distribuzioni di intervalli. Deve essere espresso in modo discreto, cioè trovare il centro dell'intervallo (x"). Nei gruppi di intervalli chiusi, troviamo il centro utilizzando una semplice media aritmetica. Nei gruppi con un limite superiore - come la differenza tra questo limite superiore e metà della dimensione dell'intervallo successivo (200-(400 -200):2=100).

Nei gruppi con un limite inferiore: la somma di questo limite inferiore e metà della dimensione dell'intervallo precedente (800+(800-600):2=900).

Calcoliamo il valore medio dei prodotti commerciabili utilizzando la formula:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Qui a=500 è la dimensione dell'opzione alla frequenza più alta, k=600-400=200 è la dimensione dimensione dell'intervallo alla frequenza più alta Inseriamo il risultato nella tabella:

Pertanto, il valore medio della produzione commerciale per il periodo in esame è generalmente pari a Хср = (-5:37)×200+500=472,97 mila rubli.

2) Troviamo la varianza utilizzando la seguente formula:

σ2 = (33/37)*2002-(472,97-500)2 = 35.675,67-730,62 = 34.945,05

3) deviazione standard: σ = ±√σ 2 = ±√34.945,05 ≈ ±186,94 mila rubli.

4) coefficiente di variazione: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

.

Viceversa, se è un non negativo a.e. funzionare in modo tale , allora esiste una misura di probabilità assolutamente continua su tale che sia la sua densità.

    Sostituendo la misura nell'integrale di Lebesgue:

,

dove è qualsiasi funzione di Borel integrabile rispetto alla misura di probabilità.

Dispersione, tipi e proprietà della dispersione Il concetto di dispersione

Dispersione nelle statistiche si trova come deviazione standard dei singoli valori della caratteristica al quadrato dalla media aritmetica. A seconda dei dati iniziali, viene determinato utilizzando le formule di varianza semplice e ponderata:

1. Varianza semplice(per dati non raggruppati) viene calcolato utilizzando la formula:

2. Varianza ponderata (per le serie di variazioni):

dove n è la frequenza (ripetibilità del fattore X)

Un esempio di ricerca della varianza

Questa pagina descrive un esempio standard di ricerca della varianza; puoi anche esaminare altri problemi per trovarla

Esempio 1. Determinazione del gruppo, della media del gruppo, dell'intergruppo e della varianza totale

Esempio 2. Trovare la varianza e il coefficiente di variazione in una tabella di raggruppamento

Esempio 3. Trovare la varianza in una serie discreta

Esempio 4. I seguenti dati sono disponibili per un gruppo di 20 studenti per corrispondenza. È necessario costruire una serie di intervalli della distribuzione della caratteristica, calcolare il valore medio della caratteristica e studiarne la dispersione

Costruiamo un raggruppamento di intervalli. Determiniamo l'intervallo dell'intervallo utilizzando la formula:

dove X max è il valore massimo della caratteristica di raggruppamento; X min – valore minimo della caratteristica di raggruppamento; n – numero di intervalli:

Accettiamo n=5. Il passo è: h = (192 - 159)/ 5 = 6,6

Creiamo un raggruppamento di intervalli

Per ulteriori calcoli, costruiremo una tabella ausiliaria:

X"i – la metà dell'intervallo. (ad esempio, la metà dell'intervallo 159 – 165,6 = 162,3)

Determiniamo l'altezza media degli studenti utilizzando la formula della media aritmetica ponderata:

Determiniamo la varianza utilizzando la formula:

La formula può essere trasformata in questo modo:

Da questa formula ne consegue che la varianza è uguale a la differenza tra la media dei quadrati delle opzioni e il quadrato e la media.

Dispersione in serie di variazioni con intervalli uguali utilizzando il metodo dei momenti può essere calcolato nel modo seguente utilizzando la seconda proprietà della dispersione (dividendo tutte le opzioni per il valore dell'intervallo). Determinazione della varianza, calcolato con il metodo dei momenti, utilizzando la seguente formula risulta meno laborioso:

dove i è il valore dell'intervallo; A è uno zero convenzionale, per il quale conviene utilizzare la metà dell'intervallo con la frequenza più alta; m1 è il quadrato del momento del primo ordine; m2 - momento del secondo ordine

Varianza dei tratti alternativi (se in una popolazione statistica una caratteristica cambia in modo tale che ci sono solo due opzioni mutuamente esclusive, allora tale variabilità è detta alternativa) può essere calcolata utilizzando la formula:

Sostituendo q = 1- p in questa formula di dispersione, otteniamo:

Tipi di varianza

Varianza totale misura la variazione di una caratteristica nell'intera popolazione sotto l'influenza di tutti i fattori che causano questa variazione. È pari alla media quadratica degli scostamenti dei singoli valori di una caratteristica x dal valore medio complessivo di x e può essere definita varianza semplice o varianza ponderata.

Varianza all'interno del gruppo caratterizza la variazione casuale, cioè parte della variazione che è dovuta all'influenza di fattori non contabilizzati e non dipende dal fattore-attributo che costituisce la base del gruppo. Tale dispersione è pari alla media quadratica degli scostamenti dei singoli valori dell'attributo all'interno del gruppo X dalla media aritmetica del gruppo e può essere calcolata come dispersione semplice o come dispersione ponderata.

Così, misure della varianza all’interno del gruppo variazione di un tratto all'interno di un gruppo ed è determinata dalla formula:

dove xi è la media del gruppo; ni è il numero di unità nel gruppo.

Ad esempio, le variazioni intragruppo che devono essere determinate nel compito di studiare l'influenza delle qualifiche dei lavoratori sul livello di produttività del lavoro in un'officina mostrano variazioni nella produzione in ciascun gruppo causate da tutti i possibili fattori (condizioni tecniche delle attrezzature, disponibilità di strumenti e materiali, età dei lavoratori, intensità di lavoro, ecc.), fatta eccezione per le differenze nella categoria di qualifica (all'interno di un gruppo tutti i lavoratori hanno le stesse qualifiche).

La media delle varianze all'interno del gruppo riflette la variazione casuale, cioè quella parte della variazione che si è verificata sotto l'influenza di tutti gli altri fattori, ad eccezione del fattore di raggruppamento. Si calcola utilizzando la formula:

Varianza intergruppo caratterizza la variazione sistematica della caratteristica risultante, che è dovuta all'influenza del fattore-attributo che costituisce la base del gruppo. È uguale al quadrato medio delle deviazioni delle medie del gruppo dalla media complessiva. La varianza intergruppo viene calcolata utilizzando la formula:

La dispersione è una misura di dispersione che descrive la deviazione comparativa tra i valori dei dati e la media. È la misura di dispersione più utilizzata nelle statistiche, calcolata sommando ed elevando al quadrato la deviazione di ciascun valore dei dati dalla media. La formula per il calcolo della varianza è riportata di seguito:

s 2 – varianza del campione;

x av: media campionaria;

N dimensione del campione (numero di valori di dati),

(x i – x avg) è la deviazione dal valore medio per ciascun valore del set di dati.

Per comprendere meglio la formula, facciamo un esempio. Non mi piace molto cucinare, quindi lo faccio raramente. Tuttavia, per non morire di fame, di tanto in tanto devo mettermi ai fornelli per attuare il piano di saturare il mio corpo con proteine, grassi e carboidrati. Il set di dati di seguito mostra quante volte Renat cucina ogni mese:

Il primo passo nel calcolo della varianza è determinare la media campionaria, che nel nostro esempio è 7,8 volte al mese. Il resto dei calcoli può essere semplificato utilizzando la tabella seguente.

La fase finale del calcolo della varianza è simile alla seguente:

Per coloro a cui piace fare tutti i calcoli in una volta sola, l'equazione sarebbe simile a questa:

Utilizzando il metodo del conteggio crudo (esempio di cottura)

Esiste un modo più efficiente per calcolare la varianza, noto come metodo del conteggio grezzo. Anche se a prima vista l’equazione può sembrare complicata, in realtà non è poi così spaventosa. Puoi assicurartene e poi decidere quale metodo ti piace di più.

è la somma di ciascun valore di dati dopo il quadrato,

è il quadrato della somma di tutti i valori dei dati.

Non perdere la testa adesso. Mettiamo tutto in una tabella e vedrai che sono necessari meno calcoli rispetto all'esempio precedente.

Come puoi vedere, il risultato è stato lo stesso di quando si utilizzava il metodo precedente. I vantaggi di questo metodo diventano evidenti all’aumentare della dimensione del campione (n).

Calcolo della varianza in Excel

Come probabilmente hai già intuito, Excel ha una formula che ti consente di calcolare la varianza. Inoltre, a partire da Excel 2010, puoi trovare 4 tipi di formule di varianza:

1) VARIANCE.V – Restituisce la varianza del campione. I valori booleani e il testo vengono ignorati.

2) DISP.G - Restituisce la varianza della popolazione. I valori booleani e il testo vengono ignorati.

3) VARIANZA - Restituisce la varianza del campione, tenendo conto dei valori booleani e di testo.

4) VARIANZA - Restituisce la varianza della popolazione, tenendo conto dei valori logici e di testo.

Innanzitutto, capiamo la differenza tra un campione e una popolazione. Lo scopo delle statistiche descrittive è quello di riassumere o visualizzare i dati in modo da ottenere rapidamente un quadro generale, una panoramica per così dire. L'inferenza statistica consente di fare inferenze su una popolazione sulla base di un campione di dati di quella popolazione. La popolazione rappresenta tutti i possibili risultati o misurazioni che ci interessano. Un campione è un sottoinsieme di una popolazione.

Ad esempio, siamo interessati a un gruppo di studenti di una delle università russe e dobbiamo determinare il punteggio medio del gruppo. Possiamo calcolare il rendimento medio degli studenti, e poi la cifra risultante sarà un parametro, poiché l'intera popolazione sarà coinvolta nei nostri calcoli. Tuttavia, se vogliamo calcolare il GPA di tutti gli studenti del nostro paese, allora questo gruppo sarà il nostro campione.

La differenza nella formula per calcolare la varianza tra un campione e una popolazione è il denominatore. Dove per il campione sarà pari a (n-1), e per la popolazione generale solo a n.

Ora diamo un'occhiata alle funzioni per calcolare la varianza con i finali UN, la cui descrizione afferma che nel calcolo vengono presi in considerazione testo e valori logici. In questo caso, quando si calcola la varianza di un particolare set di dati in cui si verificano valori non numerici, Excel interpreterà il testo e i falsi valori booleani come uguali a 0 e i veri valori booleani come uguali a 1.

Pertanto, se disponi di un array di dati, calcolarne la varianza non sarà difficile utilizzando una delle funzioni di Excel elencate sopra.



Questo articolo è disponibile anche nelle seguenti lingue: tailandese

  • Prossimo

    GRAZIE mille per le informazioni molto utili contenute nell'articolo. Tutto è presentato in modo molto chiaro. Sembra che sia stato fatto molto lavoro per analizzare il funzionamento del negozio eBay

    • Grazie a te e agli altri lettori abituali del mio blog. Senza di te, non sarei abbastanza motivato da dedicare molto tempo al mantenimento di questo sito. Il mio cervello è strutturato in questo modo: mi piace scavare in profondità, sistematizzare dati sparsi, provare cose che nessuno ha mai fatto prima o guardato da questa angolazione. È un peccato che i nostri connazionali non abbiano tempo per fare acquisti su eBay a causa della crisi in Russia. Acquistano da Aliexpress dalla Cina, poiché le merci sono molto più economiche (spesso a scapito della qualità). Ma le aste online eBay, Amazon, ETSY daranno facilmente ai cinesi un vantaggio nella gamma di articoli di marca, articoli vintage, articoli fatti a mano e vari articoli etnici.

      • Prossimo

        Ciò che è prezioso nei tuoi articoli è il tuo atteggiamento personale e l'analisi dell'argomento. Non mollare questo blog, ci vengo spesso. Dovrebbero essere in molti così. Inviami un'e-mail Recentemente ho ricevuto un'e-mail con un'offerta che mi avrebbero insegnato come fare trading su Amazon ed eBay.

  • È anche bello che i tentativi di eBay di russificare l'interfaccia per gli utenti provenienti dalla Russia e dai paesi della CSI abbiano iniziato a dare i loro frutti. Dopotutto, la stragrande maggioranza dei cittadini dei paesi dell'ex Unione Sovietica non ha una conoscenza approfondita delle lingue straniere. Non più del 5% della popolazione parla inglese. Ce ne sono di più tra i giovani. Pertanto, almeno l'interfaccia è in russo: questo è di grande aiuto per gli acquisti online su questa piattaforma di trading. eBay non ha seguito il percorso della sua controparte cinese Aliexpress, dove viene eseguita una traduzione automatica (molto goffa e incomprensibile, a volte provocante risate) delle descrizioni dei prodotti. Spero che in una fase più avanzata di sviluppo dell'intelligenza artificiale, la traduzione automatica di alta qualità da qualsiasi lingua a qualsiasi altra in pochi secondi diventi realtà. Finora abbiamo questo (il profilo di uno dei venditori su eBay con un'interfaccia russa, ma una descrizione in inglese):
    Ti auguro buona fortuna e resta al sicuro in Asia.