- Passaggi per campionare in base alle quote
- Passo 1
- Passo 2
- Passaggio 3
- Passaggio 4
- Passaggio 5
- Caso pratico
- Quota per strato
- Applicabilità, vantaggi e svantaggi
- Vantaggio
- svantaggi
- Semplice esempio di applicazione
- Determinazione delle quote per età
- Determinazione delle quote per età e sesso
- Applicazione di indagini e studio dei risultati
- Differenza con il campionamento casuale stratificato
- Esercizio proposto
- Riferimenti
Il campionamento delle quote è un modo non probabilistico per prendere i dati da uno strato campione che assegna le quote. Le quote devono essere proporzionali alla frazione che questo strato rappresenta rispetto alla popolazione totale e la somma delle quote deve essere uguale alla dimensione del campione.
Il ricercatore è colui che decide quali gruppi o strati saranno, ad esempio, può dividere una popolazione in uomini e donne. Un altro esempio di strati sono le fasce di età, ad esempio da 18 a 25, da 26 a 40 e da 40 in poi, che possono essere etichettate in questo modo: giovani, vecchi e vecchi.

Figura 1. Le quote di campionamento sono segmentate in base alle differenze nella popolazione totale. Fonte: Pixabay.
È molto conveniente sapere in anticipo quale percentuale della popolazione totale rappresenta ogni strato. Quindi viene scelta una dimensione del campione statisticamente significativa e vengono assegnate quote proporzionali alla percentuale di ogni strato rispetto alla popolazione totale. La somma delle quote per strato deve essere uguale alla dimensione totale del campione.
Infine si prendono i dati delle quote assegnate a ciascuna falda, scegliendo i primi elementi che completano la quota.
È proprio a causa di questo modo non casuale di scegliere gli elementi che questo metodo di campionamento è considerato non probabilistico.
Passaggi per campionare in base alle quote
Passo 1
Segmenta la popolazione totale in strati o gruppi con alcune caratteristiche comuni. Questa caratteristica sarà decisa in precedenza dal ricercatore statistico che conduce lo studio.
Passo 2
Determina quale percentuale della popolazione totale rappresenta ciascuno degli strati o gruppi scelti nel passaggio precedente.
Passaggio 3
Stimare una dimensione del campione statisticamente significativa, secondo i criteri e le metodologie della scienza statistica.
Passaggio 4
Calcola il numero di elementi o quote per ogni strato, in modo che siano proporzionali alla percentuale che ciascuno rappresenta rispetto alla popolazione totale e alla dimensione totale del campione.
Passaggio 5
Prendi i dati degli elementi in ogni strato fino a completare la quota corrispondente a ciascuno strato.
Caso pratico
Supponi di voler conoscere il livello di soddisfazione con il servizio di metropolitana in una città. Precedenti studi su una popolazione di 2000 persone hanno stabilito che il 50% degli utenti sono giovani tra i 16 ei 21 anni, il 40% sono adulti tra i 21 ei 55 anni e solo il 10% degli utenti ha più di 55 anni.
Sfruttando i risultati di questo studio, viene segmentato o stratificato in base all'età degli utenti:
-Giovani: 50%
-Adulti: 40%
-Anziani: 10%
Poiché il budget è limitato, lo studio deve essere applicato a un campione piccolo ma statisticamente significativo. Viene scelto un campione di 200 persone, ovvero l'indagine sul livello di soddisfazione verrà applicata a 200 persone in totale.
Resta ora da determinare la quota o il numero di indagini per ogni segmento o strato, che deve essere proporzionale alla dimensione del campione e alla percentuale per strato.
Quota per strato
La quota per il numero di indagini per strato è la seguente:
Giovani: 200 * 50% = 200 * (50/100) = 100 sondaggi
Adulti: 200 * 40% = 200 * (40/100) = 80 sondaggi
Anziani: 200 * 10% = 200 * (10/100) = 20 sondaggi

Figura 2. Quote in un campione di 200 individui in base allo strato di età. Fonte: F. Zapata.
Si noti che la somma delle commissioni deve essere uguale alla dimensione del campione, cioè uguale al numero totale di sondaggi che verranno applicati. Quindi le indagini vengono superate fino al raggiungimento delle quote per ogni strato.
È importante notare che questo metodo è molto meglio che prendere tutti i sondaggi e trasmetterli alle prime 200 persone che appaiono, perché secondo i dati precedenti, è molto probabile che lo strato di minoranza verrà escluso dallo studio.
Applicabilità, vantaggi e svantaggi
Affinché il metodo sia applicabile, è necessario un criterio per la formazione degli strati, che dipende dall'obiettivo dello studio.
Il campionamento delle quote è adatto quando si desidera conoscere le preferenze, le differenze o le caratteristiche per settori per indirizzare campagne specifiche in base allo strato o al segmento.
Il suo utilizzo è utile anche quando per qualche motivo è di interesse conoscere le caratteristiche o gli interessi di settori minoritari, o quando non si vogliono escludere dallo studio.
Per essere applicabile, il peso o il significato di ogni strato deve essere noto rispetto alla popolazione totale. È molto importante che questa conoscenza sia affidabile, altrimenti si otterranno risultati errati.
Vantaggio
-Ridurre i tempi di studio, perché le tasse per strato sono generalmente piccole
-Semplifica l'analisi dei dati.
-Minimizza i costi perché lo studio è applicato a campioni piccoli ma ben rappresentativi della popolazione totale.
svantaggi
-Poiché gli strati sono definiti a priori, è possibile che alcuni settori della popolazione siano esclusi dallo studio.
-Stabilendo un numero limitato di strati, è possibile che i dettagli vengano persi nello studio.
-Ovviando o incorporando uno strato come parte di un altro, è possibile trarre conclusioni errate dallo studio.
-Rende impossibile stimare l'errore massimo di campionamento.
Semplice esempio di applicazione
Vogliamo fare uno studio statistico sul livello di ansia in una popolazione di 2000 persone.
Il ricercatore che dirige la ricerca intuisce che le differenze nei risultati devono essere trovate a seconda dell'età e del sesso. Per questo motivo decide di formare tre strati di età indicati come segue: First_Age, Second_Age e Third_Age. Per quanto riguarda il segmento del sesso, vengono definite le due tipologie usuali: Maschio e Femmina.
Si definisce First_Age, quella tra i 18 ei 25 anni, Second_Age quella tra i 26 ei 50 anni ed infine Third_Age quella tra i 50 e gli 80 anni.
Analizzando i dati della popolazione totale è necessario:
Il 45% della popolazione appartiene alla First_Age.
Il 40% è nella Second_Age.
Infine, solo il 15% della popolazione in studio appartiene alla Terza Età.
Utilizzando una metodologia appropriata, che non è dettagliata qui, si determina che un campione di 300 persone è statisticamente significativo.
Determinazione delle quote per età
Il passaggio successivo sarà quindi trovare le quote corrispondenti per il segmento Età, che viene eseguito come segue:
Prima_età: 300 * 45% = 300 * 45/100 = 135
Seconda_età: 300 * 40% = 300 * 40/100 = 120
Terza_età: 300 * 15% = 300 * 15/100 = 45
Si è verificato che la somma delle quote dà la dimensione totale del campione.
Determinazione delle quote per età e sesso
Finora non è stato preso in considerazione il segmento di sesso della popolazione, per questo segmento sono già stati definiti due strati: femminile e maschile. Ancora una volta dobbiamo analizzare i dati della popolazione totale, che forniscono le seguenti informazioni:
-60% della popolazione totale sono donne.
-Nel frattempo, il 40% della popolazione da studiare appartiene al sesso maschile.
È importante notare che le precedenti percentuali relative alla distribuzione della popolazione in base al sesso non tengono conto dell'età.
Dato che non sono disponibili ulteriori informazioni, si supporrà che queste proporzioni tra i sessi siano equamente distribuite nelle 3 classi di età che sono state definite per questo studio. Con queste considerazioni, procediamo ora a stabilire le quote per Età e Sesso, il che significa che ora ci saranno 6 sottostrati:
S1 = First_Age and Female: 135 * 60% = 135 * 60/100 = 81
S2 = First_Age e Male: 135 * 40% = 135 * 40/100 = 54
S3 = Second_Age e Femmina: 120 * 60% = 120 * 60/100 = 72
S4 = Second_Age e Male: 120 * 40% = 120 * 40/100 = 48
S5 = Third_Age and Female: 45 * 60% = 45 * 60/100 = 27
S6 = Third_Age e Male: 45 * 40% = 45 * 40/100 = 18
Applicazione di indagini e studio dei risultati
Una volta stabiliti i sei (6) segmenti e le quote corrispondenti, vengono predisposte 300 indagini da applicare secondo le quote già calcolate.
Le indagini saranno applicate come segue, verranno effettuate 81 indagini e intervistate le prime 81 persone che si trovano nel segmento S1. Quindi è fatto allo stesso modo con i restanti cinque segmenti.
La sequenza dello studio è la seguente:
-Analizza i risultati del sondaggio, che vengono poi discussi, analizzando i risultati per segmento.
-Effettuare confronti tra i risultati per segmento.
-Infine sviluppare ipotesi che spieghino le cause di questi risultati.
Differenza con il campionamento casuale stratificato
Nel nostro esempio in cui applichiamo il campionamento delle quote, la prima cosa da fare è stabilire le quote e poi eseguire lo studio. Naturalmente, queste quote non sono affatto stravaganti, perché sono state basate su precedenti informazioni statistiche sulla popolazione totale.
Se non si dispone di informazioni preliminari sulla popolazione oggetto di studio, è preferibile invertire la procedura, ovvero definire prima la dimensione del campione e una volta stabilita la dimensione del campione, procedere con l'applicazione dell'indagine in a caso.
Un modo per garantire la casualità sarebbe utilizzare un generatore di numeri casuali e sondare i dipendenti il cui numero di dipendenti corrisponde a quello del generatore casuale.
Una volta che i dati sono disponibili e poiché l'obiettivo dello studio è quello di vedere i livelli di ansia in base agli strati di età e sesso, i dati vengono separati secondo le sei categorie che avevamo definito in precedenza. Ma senza stabilire alcuna tariffa preventiva.
È per questo motivo che il metodo di campionamento casuale stratificato è considerato un metodo probabilistico. Mentre il campionamento in base a quote stabilite in precedenza non lo fa.
Tuttavia, se le quote sono stabilite con informazioni basate sulle statistiche della popolazione, il metodo di campionamento delle quote può essere considerato approssimativamente probabilistico.
Esercizio proposto
Viene proposto il seguente esercizio:
In una scuola secondaria vuoi fare un sondaggio sulla preferenza tra lo studio delle scienze o quello delle discipline umanistiche.
Supponiamo che la scuola abbia un totale di 1000 studenti raggruppati in cinque livelli in base all'anno di studio. Si sa che ci sono 350 studenti nel primo anno, 300 nel secondo, 200 nel terzo, 100 nel quarto e infine 50 nel quinto. È anche noto che il 55% degli studenti della scuola sono maschi e il 45% femmine.
Determinare gli strati e le quote per strato, al fine di conoscere il numero di indagini da applicare in base all'anno di studio e ai segmenti di sesso. Supponiamo inoltre che il campione sia il 10% della popolazione studentesca totale.
Riferimenti
- Berenson, M. 1985. Statistics for Management and Economics, Concepts and Applications. Editoriale Interamericana.
- Statistiche. Campionamento delle quote. Estratto da: enciclopediaeconomica.com.
- Statistiche. Campionamento. Recupero da: Estadistica.mat.uson.mx.
- Esplorabile. Campionamento delle quote. Estratto da: explorable.com.
- Moore, D. 2005. Statistica di base applicata. 2 °. Edizione.
- Netquest. Campionamento di probabilità: campionamento stratificato. Estratto da: netquest.com.
- Wikipedia. Campionamento statistico. Estratto da: en.wikipedia.org
