- Formula
- Caratteristiche della distribuzione normale
- Intervalli di confidenza
- Applicazioni della distribuzione normale
- Esempio
- Esercizio risolto
- Riferimenti
La distribuzione normale o distribuzione gaussiana è la distribuzione di probabilità in una variabile continua, in cui la funzione di densità di probabilità è descritta da una funzione esponenziale di argomento quadratico e negativo, che dà origine a una forma a campana.
Il nome di distribuzione normale deriva dal fatto che questa distribuzione è quella che si applica al maggior numero di situazioni in cui qualche variabile casuale continua è coinvolta in un dato gruppo o popolazione.
Figura 1. Distribuzione normale N (x; μ, σ) e sua densità di probabilità f (s; μ, σ). (Elaborazione propria)
Esempi in cui viene applicata la distribuzione normale sono: l'altezza di uomini o donne, variazioni nella misura di una certa grandezza fisica o in tratti psicologici o sociologici misurabili come il quoziente intellettuale o le abitudini di consumo di un determinato prodotto.
D'altra parte, è chiamata distribuzione gaussiana o campana gaussiana, perché è questo genio matematico tedesco che è accreditato della sua scoperta per l'uso che ne fece per descrivere l'errore statistico delle misurazioni astronomiche nell'anno 1800.
Tuttavia, si afferma che questa distribuzione statistica era stata precedentemente pubblicata da un altro grande matematico di origine francese, come Abraham de Moivre, nel 1733.
Formula
La funzione di distribuzione normale nella variabile continua x, con parametri μ e σ, è indicata da:
N (x; μ, σ)
ed è scritto esplicitamente così:
N (x; μ, σ) = ∫ -∞ x f (s; μ, σ) ds
dove f (u; μ, σ) è la funzione di densità di probabilità:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2 ))
La costante che moltiplica la funzione esponenziale nella funzione di densità di probabilità è chiamata costante di normalizzazione ed è stata scelta in modo tale che:
N (+ ∞, μ, σ) = 1
L'espressione precedente garantisce che la probabilità che la variabile casuale x sia compresa tra -∞ e + ∞ sia 1, ovvero 100% di probabilità.
Il parametro μ è la media aritmetica della variabile casuale continua x e σ la deviazione standard o radice quadrata della varianza della stessa variabile. Nel caso in cui μ = 0 e σ = 1 allora abbiamo la distribuzione normale standard o distribuzione normale tipica:
N (x; μ = 0, σ = 1)
Caratteristiche della distribuzione normale
1- Se una variabile statistica casuale segue una distribuzione normale della densità di probabilità f (s; μ, σ), la maggior parte dei dati sono raggruppati attorno al valore medio μ e sono sparsi attorno ad esso in modo tale che poco più di ⅔ dei dati sono compresi tra μ - σ e μ + σ.
2- La deviazione standard σ è sempre positiva.
3- La forma della funzione di densità f è simile a quella di una campana, motivo per cui questa funzione è spesso chiamata campana gaussiana o funzione gaussiana.
4- In una distribuzione gaussiana la media, la mediana e il modo coincidono.
5- I punti di flesso della funzione di densità di probabilità sono precisamente a μ - σ e μ + σ.
6- La funzione f è simmetrica rispetto ad un asse che passa per il suo valore medio μ e ha asintoticamente zero per x ⟶ + ∞ e x ⟶ -∞.
7- Maggiore è il valore di σ, maggiore è la dispersione, il rumore o la distanza dei dati attorno al valore medio. In altre parole, maggiore è σ la forma della campana è più aperta. D'altra parte, σ piccolo indica che i dadi sono vicini alla media e la forma della campana è più chiusa o appuntita.
8- La funzione di distribuzione N (x; μ, σ) indica la probabilità che la variabile casuale sia minore o uguale a x. Ad esempio, nella Figura 1 (sopra) la probabilità P che la variabile x sia minore o uguale a 1,5 è dell'84% e corrisponde all'area sotto la funzione di densità di probabilità f (x; μ, σ) da -∞ a x.
Intervalli di confidenza
9- Se i dati seguono una distribuzione normale, il 68,26% di questi è compreso tra μ - σ e μ + σ.
Il 10-95,44% dei dati che seguono una distribuzione normale sono compresi tra μ - 2σ e μ + 2σ.
L'11- 99,74% dei dati che seguono una distribuzione normale sono compresi tra μ - 3σ e μ + 3σ.
12- Se una variabile casuale x segue una distribuzione N (x; μ, σ), allora la variabile
z = (x - μ) / σ segue la distribuzione normale standard N (z; 0,1).
La modifica della variabile da x a z è chiamata standardizzazione o tipizzazione ed è molto utile quando si applicano le tabelle della distribuzione standard ai dati che seguono una distribuzione normale non standard.
Applicazioni della distribuzione normale
Per applicare la distribuzione normale è necessario passare attraverso il calcolo dell'integrale della densità di probabilità, che dal punto di vista analitico non è semplice e non sempre esiste un programma per computer che ne consenta il calcolo numerico. A tale scopo vengono utilizzate tabelle di valori normalizzati o standardizzati, che non è altro che la distribuzione normale nel caso μ = 0 e σ = 1.
Tabella di distribuzione normale standardizzata (parte 1/2)
Tabella di distribuzione normale standardizzata (parte 2/2)
Va notato che queste tabelle non includono valori negativi. Tuttavia, utilizzando le proprietà di simmetria della funzione di densità di probabilità gaussiana è possibile ottenere i valori corrispondenti. L'esercizio risolto mostrato di seguito indica l'utilizzo della tabella in questi casi.
Esempio
Supponiamo di avere un insieme di dati casuali x che seguono una distribuzione normale di media 10 e deviazione standard 2. Ti viene chiesto di trovare la probabilità che:
a) La variabile casuale x è minore o uguale a 8.
b) È minore o uguale a 10.
c) Che la variabile x sia inferiore a 12.
d) La probabilità che un valore x sia compreso tra 8 e 12.
Soluzione:
a) Per rispondere alla prima domanda devi semplicemente calcolare:
N (x; μ, σ)
Con x = 8, μ = 10 e σ = 2. Ci rendiamo conto che è un integrale che non ha una soluzione analitica in funzioni elementari, ma la soluzione è espressa in funzione della funzione di errore erf (x).
D'altra parte, c'è la possibilità di risolvere l'integrale in forma numerica, che è ciò che fanno molte calcolatrici, fogli di calcolo e programmi per computer come GeoGebra. La figura seguente mostra la soluzione numerica corrispondente al primo caso:
Figura 2. Densità di probabilità f (x; μ, σ). L'area ombreggiata rappresenta P (x ≤ 8). (Elaborazione propria)
e la risposta è che la probabilità che x sia inferiore a 8 è:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
b) In questo caso, proviamo a trovare la probabilità che la variabile casuale x sia inferiore alla media, che in questo caso vale 10. La risposta non richiede alcun calcolo, poiché sappiamo che metà dei dati sono inferiori nella media e l'altra metà sopra la media. Pertanto, la risposta è:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5
c) Per rispondere a questa domanda, dobbiamo calcolare N (x = 12; μ = 10, σ = 2), che può essere fatto con una calcolatrice che ha funzioni statistiche o tramite software come GeoGebra:
Figura 3. Densità di probabilità f (x; μ, σ). L'area ombreggiata rappresenta P (x ≤ 12). (Elaborazione propria)
La risposta alla parte c può essere vista nella figura 3 ed è:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.
d) Per trovare la probabilità che la variabile casuale x sia compresa tra 8 e 12 possiamo usare i risultati delle parti a e c come segue:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.
Esercizio risolto
Il prezzo medio delle azioni di una società è di $ 25 con una deviazione standard di $ 4. Determina la probabilità che:
a) Un'azione ha un costo inferiore a $ 20.
b) Ha un costo superiore a $ 30.
c) Il prezzo è compreso tra $ 20 e $ 30.
Utilizzare le tabelle di distribuzione normale standard per trovare le risposte.
Soluzione:
Per poter utilizzare le tabelle è necessario passare alla variabile z normalizzata o tipizzata:
$ 20 nella variabile normalizzata è uguale a z = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 e
$ 30 nella variabile normalizzata è uguale a z = ($ 30 - $ 25) / $ 4 = +5/4 = +1,25.
a) $ 20 è uguale a -1,25 nella variabile normalizzata, ma la tabella non ha valori negativi, quindi individuiamo il valore +1,25 che restituisce il valore di 0,8944.
Se 0,5 viene sottratto da questo valore, il risultato sarà l'area tra 0 e 1,25 che, tra l'altro, è identica (per simmetria) all'area tra -1,25 e 0. Il risultato della sottrazione è 0,8944 - 0,5 = 0,3944 che è l'area tra -1,25 e 0.
Ma l'area da -∞ a -1,25 è di interesse, che sarà 0,5 - 0,3944 = 0,1056. Si conclude quindi che la probabilità che un'azione sia inferiore a $ 20 è del 10,56%.
b) $ 30 nella variabile tipizzata z è 1,25. Per questo valore, la tabella mostra il numero 0,8944, che corrisponde all'area da -∞ a +1,25. L'area tra +1,25 e + ∞ è (1 - 0,8944) = 0,1056. In altre parole, la probabilità che una quota costi più di $ 30 è del 10,56%.
c) La probabilità che un'azione abbia un costo compreso tra $ 20 e $ 30 sarà calcolata come segue:
100% -10,56% - 10,56% = 78,88%
Riferimenti
- Statistica e probabilità. Distribuzione normale. Estratto da: projectdescartes.org
- Geogebra. Geogebra classica, calcolo delle probabilità. Recuperato da geogebra.org
- MathWorks. Distribuzione gaussiana. Estratto da: es.mathworks.com
- Mendenhall, W. 1981. Statistics for Management and Economics. 3 °. edizione. Grupo Editorial Iberoamérica.
- Stat Trek. Insegna a te stesso le statistiche. Distribuzione di Poisson. Estratto da: stattrek.com,
- Triola, M. 2012. Statistica elementare. 11 °. Ed. Pearson Education.
- Università di Vigo. Principali distribuzioni continue. Estratto da: anapg.webs.uvigo.es
- Wikipedia. Distribuzione normale. Estratto da: es.wikipedia.org