- Vantaggi e svantaggi
- Svantaggi della portata come misura della dispersione
- Gamma interquartile, quartili ed esempio lavorato
- - Calcolo dei quartili
- Primo quartile
- Secondo quartile o mediana
- Terzo quartile
- Esempio funzionante
- Soluzione a
- Soluzione b
- Soluzione c
- Riferimenti
L' intervallo , intervallo o ampiezza, nelle statistiche, è la differenza (sottrazione) tra il valore massimo e il valore minimo di un insieme di dati da un campione o da una popolazione. Se l'intervallo è rappresentato dalla lettera R ei dati sono rappresentati da x, la formula dell'intervallo è semplicemente:
R = x max - x min
Dove x max è il valore massimo dei dati e x min è il minimo.

Figura 1. Gamma di dati corrispondenti alla popolazione di Cadice negli ultimi due secoli. Fonte: Wikimedia Commons.
Il concetto è molto utile come semplice misura della dispersione per apprezzare rapidamente la variabilità dei dati, poiché indica l'estensione o la lunghezza dell'intervallo in cui questi si trovano.
Ad esempio, si supponga di misurare l'altezza di un gruppo di 25 studenti maschi del primo anno di ingegneria in un'università. Lo studente più alto del gruppo è 1,93 me il più corto 1,67 m. Questi sono i valori estremi dei dati del campione, quindi il loro percorso è:
R = 1,93 - 1,67 m = 0,26 mo 26 cm.
L'altezza degli studenti in questo gruppo è distribuita lungo questo intervallo.
Vantaggi e svantaggi
L'intervallo è, come abbiamo detto prima, una misura di quanto siano distribuiti i dati. Un intervallo piccolo indica che i dati sono più o meno vicini e lo spread è basso. D'altra parte, un intervallo più ampio indica che i dati sono più dispersi.
I vantaggi del calcolo della portata sono evidenti: è molto facile e veloce da trovare, in quanto è una semplice differenza.
Ha anche le stesse unità dei dati con cui funziona e il concetto è molto facile da interpretare per qualsiasi osservatore.
Nell'esempio dell'altezza degli studenti di ingegneria, se la distanza fosse stata di 5 cm, diremmo che gli studenti hanno approssimativamente la stessa taglia. Ma con un raggio di 26 cm, assumiamo immediatamente che ci siano studenti di tutte le altezze intermedie nel campione. Questa ipotesi è sempre corretta?
Svantaggi della portata come misura della dispersione
Se guardiamo attentamente, può essere che nel nostro campione di 25 studenti di ingegneria, solo uno di loro misura 1,93 e i restanti 24 hanno altezze vicine a 1,67 m.
Eppure la portata rimane la stessa, anche se il contrario è perfettamente possibile: che l'altezza della maggioranza è di circa 1,90 me solo uno è di 1,67 m.
In entrambi i casi, la distribuzione dei dati è abbastanza diversa.
Gli svantaggi dell'intervallo come misura della dispersione sono perché utilizza solo valori estremi e ignora tutti gli altri. Poiché la maggior parte delle informazioni viene persa, non hai idea di come vengono distribuiti i dati di esempio.
Un'altra caratteristica importante è che la gamma del campione non diminuisce mai. Se aggiungiamo più informazioni, cioè consideriamo più dati, l'intervallo aumenta o rimane lo stesso.
E in ogni caso, è utile solo quando si lavora con piccoli campioni, il suo unico utilizzo come misura della dispersione in campioni di grandi dimensioni è sconsigliato.
Quello che si deve fare è completarlo con il calcolo di altre misure di dispersione che tengano conto delle informazioni fornite dai dati totali: range interquartile, varianza, deviazione standard e coefficiente di variazione.
Gamma interquartile, quartili ed esempio lavorato
Ci siamo resi conto che la debolezza dell'intervallo come misura della dispersione è che utilizza solo i valori estremi della distribuzione dei dati, omettendo gli altri.
Per evitare questo inconveniente, vengono utilizzati i quartili: tre valori noti come misure di posizione.
Distribuiscono i dati non raggruppati in quattro parti (altre misure di posizione ampiamente utilizzate sono decili e percentili). Queste sono le sue caratteristiche:
-Il primo quartile Q 1 è il valore dei dati tale che il 25% di tutti è inferiore a Q 1 .
-Il secondo quartile Q 2 è la mediana della distribuzione, il che significa che metà (50%) dei dati è inferiore a questo valore.
-Infine, il terzo quartile Q 3 indica che il 75% dei dati è inferiore a Q 3 .
Quindi, l'intervallo interquartile o intervallo interquartile è definito come la differenza tra il terzo quartile Q 3 e il primo quartile Q 1 dei dati:
Intervallo interquartile = R Q = Q 3 - Q 1
In questo modo, il valore del range R Q non è così influenzato da valori estremi. Per questo motivo, è consigliabile utilizzarlo quando si tratta di distribuzioni distorte, come quelle di studenti molto alti o molto bassi descritti sopra.
- Calcolo dei quartili
Esistono diversi modi per calcolarli, qui ne proponiamo uno, ma in ogni caso è necessario conoscere il numero d'ordine "N o ", che è il posto che occupa il rispettivo quartile nella distribuzione.
Cioè se ad esempio il termine che corrisponde a Q 1 è il secondo, il terzo o il quarto e così via della distribuzione.
Primo quartile
N o (Q 1 ) = (N + 1) / 4
Secondo quartile o mediana
N o (Q 2 ) = (N + 1) / 2
Terzo quartile
N o (Q 3 ) = 3 (N + 1) / 4
Dove N è il numero di dati.
La mediana è il valore che si trova proprio al centro della distribuzione. Se il numero di dati è dispari non c'è problema a trovarlo, ma se è pari, viene calcolata la media dei due valori centrali per diventare uno.
Una volta calcolato il numero d'ordine, viene seguita una di queste tre regole:
-Se non ci sono decimali, viene cercato il dato indicato nella distribuzione e questo sarà il quartile cercato.
-Quando il numero d'ordine è a metà tra due, i dati indicati dalla parte intera vengono mediati con i seguenti dati e il risultato è il quartile corrispondente.
-In ogni altro caso, viene arrotondato al numero intero più vicino e quella sarà la posizione del quartile.
Esempio funzionante
Su una scala da 0 a 20, un gruppo di 16 studenti di matematica I ha ottenuto i seguenti voti (punti) in un esame intermedio:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Trova:
a) L'intervallo o l'intervallo dei dati.
b) I valori dei quartili Q 1 e Q 3
c) La gamma interquartile.

Figura 2. I punteggi di questo test di matematica hanno tanta variabilità? Fonte: Pixabay.
Soluzione a
La prima cosa da fare per trovare il percorso è ordinare i dati in ordine crescente o decrescente. Ad esempio in ordine crescente hai:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Usando la formula data all'inizio: R = x max - x min
R = 20-1 punti = 19 punti.
Secondo il risultato, queste valutazioni hanno una grande dispersione.
Soluzione b
N = 16
N o (Q 1 ) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
È un numero con decimali, la cui parte intera è 4. Quindi andiamo alla distribuzione, cerchiamo il dato che occupa la quarta posizione e il suo valore è mediato con quello della quinta posizione. Dato che sono entrambi 9, anche la media è 9 e quindi:
Q 1 = 9
Ora ripetiamo la procedura per trovare Q 3 :
N o (Q 3 ) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75
Anche in questo caso è un decimale, ma poiché non è a metà, viene arrotondato a 13. Il quartile cercato occupa la tredicesima posizione ed è:
Q 3 = 16
Soluzione c
R Q = Q 3 - Q 1 = 16 - 9 = 7 punti.
Che, come possiamo vedere, è molto più piccolo dell'intervallo di dati calcolato nella sezione a), perché il punteggio minimo era di 1 punto, un valore molto più lontano dal resto.
Riferimenti
- Berenson, M. 1985. Statistiche per la gestione e l'economia. Interamericana SA
- Canavos, G. 1988. Probabilità e statistica: applicazioni e metodi. McGraw Hill.
- Devore, J. 2012. Probabilità e statistica per l'ingegneria e la scienza. 8 °. Edizione. Cengage.
- Esempi di quartili. Estratto da: matematicas10.net.
- Levin, R. 1988. Statistics for Administrators. 2 °. Edizione. Prentice Hall.
- Walpole, R. 2007. Probabilità e statistica per l'ingegneria e le scienze. Pearson.
