Campionamento con CloudResearch

Il processo di raccolta dati del nostro software, Cloudresearch, è stato pensato per garantire la convergenza dei tassi di copertura della distribuzione campionaria basata sulle variabili di stratificazione ex-ante (ad es. geo-localizzazione) con la distribuzione campionaria delle variabili ex-post di interesse (genere, classe d'età, titolo di studio, ecc...).

Al momento della definizione del progetto vengono dettagliate le distribuzioni campionarie delle variabili di interesse. Per ogni area territoriale viene inizialmente estratta una lista di contatti di numerosità pari a quella dell’universo (supponiamo siano 2.000), provenienti da uno o più frame (solo CATI oppure CAWI/CAMI/CATI, a seconda dell’impostazione data all’ndagine) secondo la distribuzione territoriale già inserita a sistema.
Durante il processo di raccolta dei dati sia i supervisori che gli intervistatori vengono aggiornati in tempo reale sulla distribuzione delle variabili ex-post in modo da evitare di intervistare unità statistiche in quote genere/età/titolo di studio già completate.
Una volta terminati i primi 2.000 nominativi, supponendo un tasso di risposta a livello generale pari al 20%, avremo un tasso di completamentodell’interaindagine (TC) del 20%. Aquesto punto il software estrarrà casualmente dai frame previsti, per ognuno degli strati campionari territoriali, altri nominativi fresh. Ovviamente il tasso di completamento per ognuno dei singoli strati non sarà pari al 20%. Ci saranno alcuni strati per cui la propensione alla risposta sarà più alto e altri per cui sarà più basso. Potremmo quindi avere degli strati in cui il Response Rate sarà pari al 30% ed altri in cui sarà pari al 10%. CloudResearch userà questa informazione per l’estrazione dei nuovi nominativi, e quindi estrarrà per ogni strato un numero di contatti pari al numero di interviste obiettivo (n_i_theo) meno il numero di interviste effettivamente raccolte (n_i_real), la formula usata sarà:

(n_i_theo - n_i_real) * (TC/TC_i)

dove TC è il tasso di completamento dell’intera indagine al momento dell'estrazione ed TC_i è il tasso di completamento relativo allo strato i-esimo. Quindi, supponendo un TC pari al 20%, una numerosità teorica per lo strato i-esimo pari a 50 e un numero di interviste raccolte al momento dell'estrazione pari a 5 (TC_i = 10%), invece di estrarre 45 nominativi estrarremmo:

(50-5)*(20%/10%)=45*2=90

Questo algoritmo di estrazione, assieme al fatto che per ogni progetto vengono eseguite estrazioni di ricalibrazione anche prima che i nominativi provenienti dalle estrazioni precedenti siano esauriti, garantisce che i tassi di copertura per ogni singolo strato si discostino il meno possibile dal tasso di copertura medio per tutta la durata del field. Per ogni estrazione tutti i richiami fissati per strati territoriali completati vengono eliminati. Questo permette una distribuzione territorialmente omogenea e non distorta delle quote ex-post più difficili (ad es. uomini dai 18-45, cioè quelle che si concentrano alla fine del field).
Se, a questo punto, supponiamo di essere arrivati ad un tasso di completamento dell'indagine pari al 95%, la nostra organizzazione di field ci permetterà di avere tutti i TC_i compresi in un intorno pari a TC +/- 2%. Tutte le interviste rimanenti nelle quote ex-post ancora aperte saranno distribuite fra tutti gli strati campionari garantendo una distribuzione omogenea a livello territoriale.

Realizziamo campioni statistici, calcoliamo la numerosità del campione statistico.
Leggi anche Campionamenti, Progettazione e numerosità campionaria.

Tags: Campione statistico, Cloudresearch

Vuoi saperne di più? Non temere di chiederci informazioni.

CONTATTACI

I cookies ci aiutano a offrirti un servizio migliore. Utilizzando il nostro sito accetti l'uso dei cookies.