S come Statistica

S come Statistica

Ogni tanto è utile tornare alle basi perché dalla loro solidità dipende la stabilità dell’intera costruzione. Eccoci quindi alla parola Statistica, che il Treccani descrive come la:

Scienza che ha per oggetto lo studio dei fenomeni collettivi suscettibili di misurazione e di descrizione quantitativa.

Chiariamo subito che l’oggetto dell’applicazione della Statistica (e dei suoi metodi di indagine) deve essere misurabile e quantificabile. Se non posso misurarlo, allora quanto ottengo non è statistica ma una rappresentazione di una idea basata su alcune ipotesi.

Ad esempio, esiste una misura diretta della felicità? No!

man carrying daughter in black sleeveless top

Esistono dei parametri misurabili che si suppone ci rendano più o meno felici? Secondo L’ISTAT e i suoi consulenti, sì. Ci sono dodici dimensioni da considerare (salute, istruzione e formazione, lavoro e conciliazione tempi di vita, benessere economico, relazioni sociali, politica e istituzioni, sicurezza, benessere soggettivo, paesaggio e patrimonio culturale, ambiente, ricerca e innovazione, qualità dei servizi) attraverso le quali è possibile misurare la felicità intesa come benessere. Altri studiosi usano differenti parametri, a seconda delle teorie adottate.

green and white street sign

Un altro punto importante da considerare è che la statistica tratta di fenomeni collettivi, ossia quelle realtà in cui non sia possibile seguire o analizzare ogni singolo individuo. Attraverso la raccolta di un elevato numero di dati, applicando metodi matematici, si ottengono delle leggi (dette statistiche) che rappresentano “a grandi linee” il fenomeno originario e ne consentono lo studio o il governo altrimenti impossibile se basato sui singoli casi. Non deve stupirci, infatti, che la statistica sia nata nell’antichità in seno alle amministrazioni statali, fornendo ai governanti le informazioni necessarie per esercitare l’azione politica.

Dove mancano i “grandi numeri” non ha senso parlare di statistica e applicare i suoi strumenti. Diffidiamo quindi di quei genitori che stabiliscono regole generali per crescere la prole in base alla loro esperienza.

man carrying to girls on field of red petaled flower

OK, ma quindi se è misurabile e posso collezionare tanti dati va tutto bene?

Purtroppo, no!

La complessità del fenomeno in analisi ci costringe a scegliere quali dati utilizzare e come raccoglierli. Tranne che in rare occasioni, non è possibile o conveniente misurare ogni aspetto del caso in ambito e dovremmo selezionarne a priori un sottoinsieme (di soggetti, di parametri, di condizioni) su cui lavorare stando attenti a mantenere la rappresentatività del fenomeno completo..

Questa selezione del campione è molto critica e un errore, più o meno volontario, può portare a risultati errati e ingannevoli.

Un esempio molto conosciuto di tale difficoltà risale alla Seconda Guerra Mondiale.

Lo Statistical Research Group (SRG) della Columbia University venne incaricato di studiare come minimizzare le perdite di bombardieri sotto il fuoco nemico. Come dati a disposizione, oltre all’inventario degli aeromobili utilizzati, vennero raccolti anche i danni riscontrati sugli aerei. In forma grafica, tramite una rielaborazione moderna, ecco i dati raccolti sulle parti danneggiate.

L’ipotesi immediata fu di proporre il rinforzo delle parti più colpite (dove abbiamo tanti puntini rossi). La logica è semplice, devo difendermi dove vengo più danneggiato.

Fortunatamente, lo statistico Abraham Wald, tenne in considerazioni che la figura di cui sopra non è rappresentativa di tutti gli aerei mandati in missione. Non è infatti possibile raccogliere gli stessi dati sui velivoli abbattuti.

Tenendo conto di questo effetto (conosciuto come pregiudizio di sopravvivenza – survivor bias), consigliò di proteggere le parti che mostravano meno danni, in piena contraddizione con l’ipotesi iniziale. Le parti colpite degli aerei sopravvissuti dimostravano infatti una maggior resistenza agli attacchi nemici e un loro danneggiamento non aveva impedito il rientro del velivolo.

Avevate notato la mancanza di pallini rossi sui motori e sulla cabina?

Un altro errore tipico è prendere un campione non significativo. Un po’ come quando alle elezioni si presenta metà della popolazione e si dice che il risultato rappresenta il volere del popolo intero, senza tener conto di chi non ha diritto a votare e di chi ha scelto – per varie ragioni – di non fornire una propria scelta. Se a questo si aggiunge la legge elettorale applicata (maggioritario, proporzionale, un misto fritto) e come vengono raggruppati i voti, capite come sia ben difficile che il risultato sia una fotografia precisa del pensiero dell’intera popolazione.

Ecco che, senza una corretta applicazione dei metodi Statistici, la possibilità di prendere fischi per fiaschi diventa quasi certezza.

A questo rischio si aggiunge poi la malafede e l’ignoranza di chi cita statistiche (corrette o sbagliate) a sproposito.

La Statistica è uno strumento essenziale e costituisce la base per prendere decisioni informate evitando privilegi e teorie senza alcun fondamento.

Per concludere questa voce, vi rimando al ritratto di Hans Rosling, un uomo che si è distinto per la capacità di dare vita alle statistiche mostrandoci in modo efficace quello che i dati dimostrano e smontando vecchie credenze e pregiudizi.

“Gli esperti non possono risolvere le sfide principali se non sono sorretti dai fatti. Ma prima devono estirpare i preconcetti, e questa è la parte difficile” – Hans Rosling

“Ci stiamo perdendo nei dettagli. Per me è come una guerra: tutto quello che serve sapere è se il numero dei casi cresce, diminuisce o rimane stabile.” – Hans Rosling

Riprenderemo il tema con un’altra parola strettamente legata alla Statistica. Riuscite ad indovinarla?

 

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.