- Tipi di gradi di libertà
- In una custodia meccanica
- In un insieme di valori casuali
- Esempi
- Varianza e gradi di libertà
- Nella distribuzione del Chi quadrato
- Nel test di ipotesi (con esempio risolto)
- Riferimenti
I gradi di libertà nelle statistiche sono il numero di componenti indipendenti di un vettore casuale. Se il vettore ha n componenti e ci sono p equazioni lineari relative ai suoi componenti, il grado di libertà è np.
Il concetto di gradi di libertà appare anche nella meccanica teorica, dove sono approssimativamente equivalenti alla dimensione dello spazio in cui si muove la particella, meno il numero di legami.

Figura 1. Un pendolo si muove in due dimensioni, ma ha un solo grado di libertà perché è costretto a muoversi in un arco di raggio L. Fonte: F. Zapata.
Questo articolo discuterà il concetto di gradi di libertà applicato alla statistica, ma un esempio meccanico è più facile da visualizzare in forma geometrica.
Tipi di gradi di libertà
A seconda del contesto in cui viene applicato, il modo di calcolare il numero di gradi di libertà può variare, ma l'idea di fondo è sempre la stessa: dimensioni totali meno numero di restrizioni.
In una custodia meccanica
Consideriamo una particella oscillante legata ad una corda (un pendolo) che si muove nel piano verticale xy (2 dimensioni). Tuttavia, la particella è costretta a muoversi sulla circonferenza di raggio pari alla lunghezza della corda.
Poiché la particella può muoversi solo su quella curva, il numero di gradi di libertà è 1. Questo può essere visto nella figura 1.
Il modo per calcolare il numero di gradi di libertà è prendere la differenza del numero di dimensioni meno il numero di vincoli:
gradi di libertà: = 2 (dimensioni) - 1 (legatura) = 1
Un'altra spiegazione che ci permette di arrivare al risultato è la seguente:
-Sappiamo che la posizione in due dimensioni è rappresentata da un punto di coordinate (x, y).
-Ma poiché il punto deve rispettare l'equazione della circonferenza (x 2 + y 2 = L 2 ) per un dato valore della variabile x, la variabile y è determinata da detta equazione o restrizione.
In questo modo, solo una delle variabili è indipendente e il sistema ha un (1) grado di libertà.
In un insieme di valori casuali
Per illustrare il significato del concetto, supponiamo il vettore
x = (x 1 , x 2 ,…, x n )
Rappresenta il campione di n valori casuali distribuiti normalmente. In questo caso il vettore casuale x ha n componenti indipendenti e quindi si dice che x ha n gradi di libertà.
Costruiamo ora il vettore r dei residui
r = (x 1 -
Dove
Quindi la somma
(x 1 -
È un'equazione che rappresenta una restrizione (o legame) negli elementi del vettore r dei residui, poiché se sono noti n-1 componenti del vettore r , l'equazione di restrizione determina la componente sconosciuta.
Pertanto il vettore r di dimensione n con la restrizione:
∑ (x i -
Ha (n - 1) gradi di libertà.
Anche in questo caso si applica che il calcolo del numero di gradi di libertà è:
gradi di libertà: = n (dimensioni) - 1 (vincoli) = n-1
Esempi
Varianza e gradi di libertà
La varianza s 2 è definita come la media del quadrato delle deviazioni (o residui) del campione di n dati:
s 2 = ( r • r ) / (n-1)
dove r è il vettore dei residui r = (x1 -
s 2 = ∑ (x io -
In ogni caso, va notato che nel calcolare la media del quadrato dei residui, viene divisa per (n-1) e non per n, poiché come discusso nella sezione precedente, il numero di gradi di libertà del vettore r è ( n-1).
Se per il calcolo della varianza fosse diviso per n invece di (n-1), il risultato avrebbe un bias molto significativo per valori n inferiori a 50.
In letteratura, la formula della varianza appare anche con il divisore n invece di (n-1), quando si tratta della varianza di una popolazione.
Ma l'insieme della variabile casuale dei residui, rappresentato dal vettore r , sebbene abbia dimensione n, ha solo (n-1) gradi di libertà. Tuttavia, se il numero di dati è sufficientemente grande (n> 500), entrambe le formule convergono allo stesso risultato.
Calcolatrici e fogli di calcolo forniscono entrambe le versioni della varianza e della deviazione standard (che è la radice quadrata della varianza).
La nostra raccomandazione, in vista dell'analisi qui presentata, è di scegliere sempre la versione con (n-1) ogni volta che è necessario calcolare la varianza o la deviazione standard, per evitare risultati distorti.
Nella distribuzione del Chi quadrato
Alcune distribuzioni di probabilità in variabile casuale continua dipendono da un parametro chiamato grado di libertà, questo è il caso della distribuzione Chi quadrato (χ 2 ).
Il nome di questo parametro deriva proprio dai gradi di libertà del sottostante vettore casuale a cui si applica questa distribuzione.
Supponiamo di avere g popolazioni, da cui vengono prelevati campioni di dimensione n:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 ,… ..xg n )
Una popolazione j che ha media
La variabile standardizzata o normalizzata zj i è definita come:
zj i = (xj io -
E il vettore Zj è definito così:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) e segue la distribuzione normale standardizzata N (0,1).
Quindi la variabile:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
segue la distribuzione χ 2 (g) chiamata distribuzione chi quadrato con grado di libertà g.
Nel test di ipotesi (con esempio risolto)
Quando vuoi testare ipotesi basate su un certo insieme di dati casuali, devi conoscere il numero di gradi di libertà g per applicare il test del Chi-quadrato.

Figura 2. Esiste una relazione tra la preferenza del GUSTO di gelato e il GENERE del cliente? Fonte: F. Zapata.
A titolo di esempio, verranno analizzati i dati raccolti sulle preferenze del gelato al cioccolato o alla fragola tra uomini e donne in una determinata gelateria. La frequenza con cui uomini e donne scelgono la fragola o il cioccolato è riassunta nella Figura 2.
Innanzitutto, viene calcolata la tabella delle frequenze previste, che viene preparata moltiplicando il totale delle righe per il totale delle colonne, diviso per i dati totali. Il risultato è mostrato nella figura seguente:

Figura 3. Calcolo delle frequenze attese in base alle frequenze osservate (valori in blu nella figura 2). Fonte: F. Zapata.
Quindi il Chi quadrato viene calcolato (dai dati) utilizzando la seguente formula:
χ 2 = ∑ (F o - F e ) 2 / F e
Dove F o sono le frequenze osservate (Figura 2) e F e sono le frequenze attese (Figura 3). La somma copre tutte le righe e le colonne, che nel nostro esempio danno quattro termini.
Dopo aver eseguito le operazioni ottieni:
χ 2 = 0,2043.
Ora è necessario fare un confronto con il Chi quadrato teorico, che dipende dal numero di gradi di libertà g.
Nel nostro caso, questo numero è determinato come segue:
g = (# righe - 1) (#colonne - 1) = (2-1) (2-1) = 1 * 1 = 1.
Risulta che il numero di gradi di libertà g in questo esempio è 1.
Se si vuole verificare o rifiutare l'ipotesi nulla (H0: non c'è correlazione tra GUSTO e GENERE) con un livello di significatività dell'1%, il valore Chi-quadrato teorico viene calcolato con grado di libertà g = 1.
Si cerca il valore che rende la frequenza accumulata (1 - 0,01) = 0,99, cioè 99%. Questo valore (che può essere ottenuto dalle tabelle) è 6,636.
Poiché la Chi teorica supera quella calcolata, viene verificata l'ipotesi nulla.
In altre parole, con i dati raccolti, non si osserva alcuna relazione tra le variabili GUSTO e GENERE.
Riferimenti
- Minitab. Quali sono i gradi di libertà? Recupero da: support.minitab.com.
- Moore, David. (2009) Statistiche applicate di base. Editore di Antoni Bosch.
- Leigh, Jennifer. Come calcolare i gradi di libertà nei modelli statistici. Estratto da: geniolandia.com
- Wikipedia. Grado di libertà (statistica). Estratto da: es.wikipedia.com
- Wikipedia. Grado di libertà (fisico). Estratto da: es.wikipedia.com
