- Esempi di quasi varianza
- Perché dividere per n-1?
- Modo alternativo per calcolare la quasivarianza
- Il punteggio standard
- Esercizio risolto
- Soluzione a
- Soluzione b
- Riferimenti
La quasivarianza , quasi varianza o varianza non distorta è una misura statistica della dispersione dei dati del campione rispetto alla media. Il campione, a sua volta, è costituito da una serie di dati presi da un universo più ampio, chiamato popolazione.
È indicato in diversi modi, qui è stato scelto c 2 e per calcolarlo viene utilizzata la seguente formula:

Figura 1. La definizione di quasi varianza. Fonte: F. Zapata.
Dove:
La quasi varianza è simile alla varianza s 2 , con l'unica differenza che il denominatore della varianza è n-1, mentre la varianza è divisa solo per n. È evidente che quando n è molto grande, i valori di entrambi tendono ad essere gli stessi.
Quando conosci il valore della quasi varianza, puoi immediatamente conoscere il valore della varianza.
Esempi di quasi varianza
Spesso si vogliono conoscere le caratteristiche di qualsiasi popolazione: persone, animali, piante e in generale qualsiasi tipo di oggetto. Ma analizzare l'intera popolazione potrebbe non essere un compito facile, soprattutto se il numero di elementi è molto elevato.
Vengono quindi prelevati dei campioni, nella speranza che il loro comportamento rispecchi quello della popolazione e quindi sia possibile trarne delle inferenze, grazie alle quali si ottimizzano le risorse. Questo è noto come inferenza statistica.
Di seguito sono riportati alcuni esempi in cui la quasi varianza e la deviazione quasi standard associata fungono da indicatore statistico indicando quanto sono lontani i risultati ottenuti dalla media.
1.- Il direttore marketing di un'azienda che produce batterie per autoveicoli deve stimare, in mesi, la durata media di una batteria.
Per fare ciò, seleziona a caso un campione di 100 batterie acquistate di quella marca. L'azienda tiene un registro dei dettagli degli acquirenti e può intervistarli per scoprire quanto durano le batterie.

Figura 2. La quasi-varianza è utile per fare inferenze e controllare la qualità. Fonte: Pixabay.
2.- La direzione accademica di un istituto universitario deve stimare l'iscrizione dell'anno successivo, analizzando il numero di studenti che si prevede supereranno le materie che stanno attualmente studiando.
Ad esempio, da ciascuna delle sezioni attualmente impegnate in Fisica I, la direzione può selezionare un campione di studenti e analizzare le loro prestazioni in quella sedia. In questo modo puoi dedurre quanti studenti prenderanno Fisica II nel prossimo periodo.
3.- Un gruppo di astronomi concentra la propria attenzione su una parte del cielo, dove si osserva un certo numero di stelle con determinate caratteristiche: dimensione, massa e temperatura per esempio.
Ci si chiede se le stelle di un'altra regione simile avranno le stesse caratteristiche, anche le stelle di altre galassie, come le vicine Nubi di Magellano o Andromeda.
Perché dividere per n-1?
Nella quasivarianza, è diviso per n-1 anziché per n ed è perché la quasivarianza è uno stimatore imparziale, come si è detto all'inizio.
Succede che dalla stessa popolazione sia possibile estrarre molti campioni. La varianza di ciascuno di questi campioni può anche essere mediata, ma la media di queste varianze non risulta essere uguale alla varianza della popolazione.
In effetti, la media delle varianze campionarie tende a sottostimare la varianza della popolazione, a meno che n-1 non venga utilizzato al denominatore. Si può verificare che il valore atteso della quasi varianza E (s c 2 ) è precisamente s 2 .
Per questo motivo, si dice che la quasivariata è imparziale ed è uno stimatore migliore della varianza della popolazione s 2 .
Modo alternativo per calcolare la quasivarianza
È facilmente dimostrato che la quasivarianza può essere calcolata anche come segue:
s c 2 = -
Il punteggio standard
Avendo la deviazione campionaria, possiamo dire quante deviazioni standard ha un particolare valore x, sopra o sotto la media.
Per questo, viene utilizzata la seguente espressione adimensionale:
Punteggio standard = (x - X) / s c
Esercizio risolto
863903 957 1041 1138 1204 1354 1624 1698 1745 1802 1883
a) Usa la definizione di quasivarianza data all'inizio e controlla anche il risultato usando la forma alternativa data nella sezione precedente.
b) Calcola il punteggio standard del secondo dato, leggendolo dall'alto verso il basso.
Soluzione a
Il problema può essere risolto a mano con l'ausilio di un semplice calcolatore o scientifico, per il quale è necessario procedere con ordine. E per questo, niente di meglio che organizzare i dati in una tabella come quella mostrata di seguito:

Grazie alla tabella, le informazioni sono organizzate e le quantità che saranno necessarie nelle formule sono alla fine delle rispettive colonne, subito pronte per l'uso. Le somme sono indicate in grassetto.
La colonna della media viene sempre ripetuta, ma ne vale la pena perché è conveniente avere il valore in vista, per riempire ogni riga della tabella.
Infine si applica l'equazione per la quasivariata data all'inizio, vengono sostituiti solo i valori e per quanto riguarda la somma l'abbiamo già calcolata:
s c 2 = 1.593.770 / (12-1) = 1.593.770 / 11 = 144.888,2
Questo è il valore del quasivariato e le sue unità sono "dollari al quadrato", il che non ha molto senso pratico, quindi viene calcolata la deviazione quasi standard del campione, che non è altro che la radice quadrata del quasivariato:
s c = (√ 144.888,2) $ = $ 380,64
Viene subito confermato che questo valore si ottiene anche con la forma alternativa di quasi varianza. La somma necessaria è alla fine dell'ultima colonna a sinistra:
s c 2 = - = -
= 2.136.016,55 - 1.991.128,36 = $ 144.888 al quadrato
È lo stesso valore ottenuto con la formula data all'inizio.
Soluzione b
Il secondo valore dall'alto verso il basso è 903, il suo punteggio standard è
Punteggio standard di 903 = (x - X) / s c = (903 - 1351) /380,64 = -1,177
Riferimenti
- Canavos, G. 1988. Probabilità e statistica: applicazioni e metodi. McGraw Hill.
- Devore, J. 2012. Probabilità e statistica per l'ingegneria e la scienza. 8 °. Edizione. Cengage.
- Levin, R. 1988. Statistics for Administrators. 2 °. Edizione. Prentice Hall.
- Misure di dispersione. Estratto da: thales.cica.es.
- Walpole, R. 2007. Probabilità e statistica per l'ingegneria e le scienze. Pearson.
