Possiamo allora dire che la statistica descrittiva ha lo scopo di raccogliere e di elaborare
i dati per descrivere i fenomeni collettivi mentre la statistica inferenziale (o induttiva) si
occupa dei metodi che permettono di stimare le caratteristiche di un fenomeno collettivo
partendo dall’analisi degli elementi distintivi di un suo sottoinsieme, ossia un campione.
2
Classificazione dei metodi di campionamento
2.1 Campionamento probabilistico e non probabilistico
Nella scelta delle
n
unità della popolazione che devono entrare a fare parte del cam-
pione, si possono seguire diverse strade, ma tutte le tecniche attualmente note possono
essere raggruppate in due grandi categorie. Se l’operazione di scelta delle unità è casuale
allora il campione che ne deriva si chiama
probabilistico
, mentre se la scelta prescinde
da criteri di casualità il campione si dice
non probabilistico
. Di conseguenza, nella
disciplina statistica si parla di
tecniche di campionamento probabilistico
e
tecniche
di campionamento non probabilistico
.
2.2 Il caso come fenomeno scientifico
Attenzione però al termine
casuale
che, in statistica, assume un significato molto preciso
e non va confuso con l’uso comune che si fa di questa parola. Nel linguaggio comune
scegliere un individuo a caso fra una moltitudine significa scegliere senza pensarci troppo,
cioè a casaccio e senza una procedura particolare. In statistica, al contrario, una scelta
casuale segue regole molto precise e il caso, inteso come probabilità del verificarsi di un
evento, ha delle leggi matematiche ben precise. Così, in ambito scientifico, il
caso
è un
fenomeno perfettamente rappresentabile con espressioni matematiche che rispondono
alle regole del calcolo delle probabilità e non ha nulla a che vedere con una scelta “a
casaccio”. Più avanti faremo alcuni semplici esempi di calcolo delle probabilità.
Il
campionamento casuale
è assimilabile alla scelta di un certo numero di palline da
Tecnica di campionamento
ste, cioè un campione molto grande, e
questo fa sì che la maggior parte degli
americani ritenga quelle previsioni mol-
to attendibili.
La
Digest
, tuttavia, dà con certezza Alf
Landon vincente, assegnando a Franklin
Roosevelt una percentuale del 41%, men-
tre in realtà questi ottiene il 61% dei voti.
I risultati giusti vengono invece previsti
da altri istituti di sondaggio, che si sono
basati su campioni molto più piccoli ma
selezionati in modo diverso.
Gli statistici della
Digest
sono incappati,
infatti, in un grave errore metodologico:
per scegliere le unità statistiche hanno
utilizzato registri automobilistici ed elen-
In un’indagine campionaria non è tanto
importante la grandezza del campione,
quanto la
tecnica di campionamento
,
ovvero il modo in cui sono selezionate le
unità statistiche che devono fare parte
del campione.
A questo proposito, c’è un episodio mol-
to interessante che viene sempre citato,
perché segna definitivamente l’afferma-
zione del campionamento probabilisti-
co. Nel 1936 la rivista americana
Literary
Digest
ricorre a un sondaggio d’opinione
per prevedere l’esito delle elezioni presi-
denziali, e invia a 10 milioni di cittadini
un documento simile alla scheda elet-
torale. Ottiene ben 2 milioni di rispo-
chi telefonici. Ma negli anni della grande
depressione i possessori di auto e telefoni
sono i più abbienti, che tendono a votare
il partito repubblicano, per cui nel cam-
pione è rappresentato un numero insuf-
ficiente di democratici. Inoltre, i 2 milioni
che rispondono al sondaggio sono in
gran parte lettori della rivista, una fetta
molto particolare di americani, e questo
contribuisce a far fallire l’indagine.
Gli altri sondaggi vengono fatti con cam-
pioni maggiormente rappresentativi della
popolazione dei votanti, perché composti
da persone di diversa estrazione sociale,
selezionate tra l’intera popolazione con
criteri di casualità.
Le parole
della ricerca sociale
075-200_Statistica_Modulo_3.indd 114
31/01/