- Dati raggruppati
- Esempio
- Le 3 principali misure di tendenza centrale
- 1- Media aritmetica
- 2- Medio
- 3- Moda
- Riferimenti
Le misure della tendenza centrale dei dati raggruppati vengono utilizzate nelle statistiche per descrivere alcuni comportamenti di un gruppo di dati forniti, come ad esempio il valore a cui si avvicinano, la media dei dati raccolti, tra gli altri.
Quando si prendono una grande quantità di dati, è utile raggrupparli per averne un ordine migliore e quindi essere in grado di calcolare alcune misure di tendenza centrale.

Tra le misure di tendenza centrale più utilizzate vi sono la media aritmetica, la mediana e il modo. Questi numeri raccontano alcune qualità dei dati raccolti in un certo esperimento.
Per utilizzare queste misure, devi prima sapere come raggruppare un set di dati.
Dati raggruppati
Per raggruppare i dati, è necessario prima calcolare l'intervallo dei dati, che si ottiene sottraendo il valore più alto meno il valore più basso dei dati.
Quindi viene scelto un numero "k", che è il numero di classi in cui vogliamo raggruppare i dati.
L'intervallo è diviso per "k" per ottenere l'ampiezza delle classi da raggruppare. Questo numero è C = R / k.
Infine, inizia il raggruppamento, per il quale viene scelto un numero inferiore al valore più basso dei dati ottenuti.
Questo numero sarà il limite inferiore della prima classe. A questo si aggiunge C. Il valore ottenuto sarà il limite superiore della prima classe.
Quindi, C viene aggiunto a questo valore e si ottiene il limite superiore della seconda classe. In questo modo si procede ad ottenere il limite superiore dell'ultima classe.
Dopo che i dati sono stati raggruppati, è possibile calcolare la media, la mediana e la modalità.
Per illustrare come vengono calcolate la media aritmetica, la mediana e il modo, procederemo con un esempio.
Esempio

Pertanto, raggruppando i dati, si otterrà una tabella come la seguente:

Le 3 principali misure di tendenza centrale
Procediamo ora a calcolare la media aritmetica, la mediana e il modo. L'esempio sopra verrà utilizzato per illustrare questa procedura.
1- Media aritmetica
La media aritmetica consiste nel moltiplicare ciascuna frequenza per la media dell'intervallo. Quindi tutti questi risultati vengono aggiunti e alla fine viene diviso per i dati totali.
Utilizzando l'esempio precedente, si otterrebbe che la media aritmetica è uguale a:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
Ciò indica che il valore medio dei dati nella tabella è 5.11111.
2- Medio
Per calcolare la mediana di un set di dati, prima ordiniamo tutti i dati dal minimo al maggiore. Possono verificarsi due casi:
- Se il numero di dati è dispari, la mediana è il dato che si trova proprio al centro.
- Se il numero di dati è pari, la mediana è la media dei due dati che si trovano al centro.
Quando si tratta di dati raggruppati, il calcolo della mediana viene eseguito come segue:
- Viene calcolato N / 2, dove N è il dato totale.
- Viene cercato il primo intervallo in cui la frequenza accumulata (la somma delle frequenze) è maggiore di N / 2 e viene selezionato il limite inferiore di questo intervallo, chiamato Li.
La mediana è data dalla seguente formula:
Me = Li + (Ls-Li) * (N / 2 - Frequenza accumulata prima di Li) / frequenza di [Li, Ls)
Ls è il limite superiore dell'intervallo menzionato sopra.
Se viene utilizzata la tabella dati precedente, N / 2 = 18/2 = 9. Le frequenze accumulate sono 4, 8, 14 e 18 (una per ogni riga della tabella).
Pertanto, è necessario selezionare il terzo intervallo, poiché la frequenza cumulativa è maggiore di N / 2 = 9.
Quindi Li = 5 e Ls = 7. Applicando la formula sopra descritta devi:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Moda
La modalità è il valore che ha la frequenza più alta tra tutti i dati raggruppati; ovvero, è il valore che viene ripetuto più volte nel set di dati iniziale.
Quando si dispone di una grande quantità di dati, la seguente formula viene utilizzata per calcolare la modalità dei dati raggruppati:
Mo = Li + (Ls-Li) * (frequenza di Li - Frequenza di L (i-1)) / ((frequenza di Li - Frequenza di L (i-1)) + (frequenza di Li - Frequenza di L ( i + 1)))
L'intervallo [Li, Ls) è l'intervallo in cui si trova la frequenza più alta. Per l'esempio fatto in questo articolo, la modalità è data da:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Un'altra formula che viene utilizzata per ottenere un valore approssimativo alla modalità è la seguente:
Mo = Li + (Ls-Li) * (frequenza L (i + 1)) / (frequenza L (i-1) + frequenza L (i + 1)).
Con questa formula i conti sono i seguenti:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Riferimenti
- Bellhouse, DR (2011). Abraham De Moivre: preparare il terreno per la probabilità classica e le sue applicazioni. CRC Press.
- Cifuentes, JF (2002). Introduzione alla teoria della probabilità. Università Nazionale della Colombia.
- Daston, L. (1995). Probabilità classica nell'Illuminismo. Princeton University Press.
- Larson, HJ (1978). Introduzione alla teoria della probabilità e inferenza statistica. Editoriale Limusa.
- Martel, PJ e Vegas, FJ (1996). Probabilità e statistica matematica: applicazioni nella pratica clinica e nella gestione della salute. Edizioni Díaz de Santos.
- Vázquez, AL e Ortiz, FJ (2005). Metodi statistici per misurare, descrivere e controllare la variabilità. Ed. Università della Cantabria.
- Vázquez, SG (2009). Manuale di Matematica per l'accesso all'Università. Editoriale Centro de Estudios Ramon Areces SA.
