La disuguaglianza. Tema caldo. Quanta ce ne sia, come stia cambiando durante la crisi, quali siano le sue determinanti sono temi oggetto di continuo dibattito. Stranamente, però, è più facile farne oggetto di conversazioni da salotto che studiarla approfonditamente. Perché? Perché per farlo è necessario avere a disposizione dati individuali, cioè dati relativi ai salari di ciascun individuo, o almeno di un campione. Dati, che tema da nerds, si dirà. Lo è. Quindi, i tipi cool smettano di leggere, per favore.
Per i 25 lettori che hanno proseguito (magari!), si diceva che non bastano le statistiche aggregate, le medie nazionali (o regionali) fornite dall’ISTAT, per parlare di disuguaglianza. È necessario analizzare l’intera distribuzione dei salari o dei redditi. Basterà chiedere all’ISTAT, si dirà, che dopo averli opportunamente resi anonimi per proteggere la privacy individuale, metterà sicuramente i dati a disposizione di chi li voglia usare per motivi di ricerca, proprio come avviene nei paesi normali. Come per esempio nel Regno Unito, dove è sufficiente inoltrare una semplice richiesta al UK Data Archive e firmare una dichiarazione nella quale ci si impegna a non utilizzare i dati in modo fraudolento per poter scaricare dati individuali anonimizzati direttamente sul proprio pc.
Una cosa da paesi anglosassoni? Non proprio. In Francia è addirittura possibile avere accesso a dati coperti dalla privacy. La procedura per ottenerli dall’INSEE (l’ISTAT francese) è un po’ più complessa rispetto a quella britannica, ma è chiara e trasparente. È necessario compilare un modulo nel quale si illustra il progetto di ricerca per il quale si rende necessaria la disponibilità dei dati, si indicano le basi di dati richieste e ci si impegna a mantenere il segreto statistico. La domanda viene valutata dal Comité du Secret Statistique che si riunisce tre volte all’anno secondo un calendario prefissato. In caso di risposta positiva, l’INSEE fornisce l’accesso remoto ai dati per un periodo di due o tre anni attraverso un device chiamato SD-BOX (Security-Data Box) che può essere utilizzato solo attraverso una tastiera speciale che si attiva grazie al riconoscimento dell’impronta digitale della persona autorizzata. Il ricercatore, pertanto, pur non avendo i dati a disposizione sul proprio pc, non ha bisogno di recarsi a Parigi presso l’INSEE per ogni singola elaborazione. Può effettuarla dal proprio ufficio. Si tratta di un dettaglio fondamentale visto che un’analisi empirica comme il faut può richiedere mesi – e più spesso anni – di lavoro.
E da noi? Da noi l’ISTAT mette a completa disposizione dei ricercatori, previa autorizzazione del suo Presidente, solo un numero limitato di indagini (file per la ricerca) e spesso con forti limitazioni: per esempio i microdati relativi alla rilevazione delle forze lavoro sono disponibili solo a partire dal 2009 (nel Regno Unito sono disponibili dal 1975). Oltre a questo, la maggior parte dei dati elementari (elencati qui e qui) è sì messa a disposizione, ma solo attraverso le postazioni informatiche installate presso l’ISTAT (Laboratorio ADELE) a Roma in Piazza dell’Indipendenza 4 o presso le sedi regionali, come spiegato nella guida all’utenza. Questo limita moltissimo la possibilità di condurre analisi approfondite e rende di fatto inutilizzabili i dati per chi non possa lasciare il proprio luogo di lavoro per periodi lunghi. La differenza con il Regno Unito e la Francia, che permettono di utilizzare dati di elevata qualità dal proprio ufficio, è lampante. Risultato: i microdati di provenienza ISTAT accessibili attraverso il Laboratorio ADELE non sono quasi mai utilizzati per scopi di ricerca: una ricerca su Google Scholar genera solo 43 risultati.
Alternative? Solo due. La prima è costituita dai microdati forniti meritoriamente dall’INPS attraverso il LABORatorio Revelli (161 risultati su Google Scholar) e – da qualche anno – attraverso la Fondazione Rodolfo Debenedetti (26 risultati su Google Scholar). Purtroppo, però, l’INPS non rilascia più aggiornamenti dal 2004, il che lascia scoperta l’ultima decade. Perché, cara INPS, interrompere l’erogazione di un servizio così importante, per di più in un momento nel quale le informazioni che si potrebbero ricavare sarebbero di grande utilità?
La seconda è la preziosa Indagine sui redditi e la ricchezza delle famiglie italiane, condotta dalla Banca d’Italia, che conta ben 728 lavori basati sui suoi risultati. Come mai così tanti? Perché si tratta di dati di indiscussa qualità scaricabili dal sito della Banca d’Italia. Gratis. Da chiunque. Nessun modulo da compilare.
Viene allora spontaneo chiedere al Presidente dell’ISTAT Enrico Giovannini, che sembra peraltro concordare con l’esigenza di basarsi su dati affidabili per leggere il paese e discutere in maniera seria di politiche economiche e sociali: se la Banca d’Italia permette di scaricare liberamente i dati individuali anonimizzati che raccoglie, perché l’ISTAT, istituzione finanziata dal contribuente proprio con lo scopo di raccogliere e fornire dati alla collettività, non mette a disposizione della comunità le proprie serie complete (non solo dal 2009, please) e i propri microdati?
==================================
La replica dell’Istat
L’Istat, alla stregua della maggioranza degli istituti nazionali di statistica europei, distingue l’accesso ai propri microdati in due fattispecie: generale – ovvero di microdati disponibili a chiunque e trattati con metodi che limitano il rischio di violazione della riservatezza – e per motivi di ricerca. In Istat i primi sono chiamati File standard e i secondi MFR, in UK abbiamo gli End User Licence file e gli Special Licence file, e così via. Esiste poi l’accesso tramite laboratori ai dati validati delle indagini, nell’articolo definiti come “addirittura coperti dalla privacy”, che in Italia avviene tramite il Laboratorio ADELE. Nel complesso i file di microdati forniti dall’Istat nel 2012 sono stati ben 3500, con un incremento per i soli file per la ricerca (MFR), la tipologia che per il livello di dettaglio costituisce la maggiormente utilizzata dal mondo accademico, del +300 %.
L’autore scrive che in Gran Bretagna basta “una semplice richiesta al UK Data Archive e firmare una dichiarazione nella quale ci si impegna a non utilizzare i dati in modo fraudolento per poter scaricare dati individuali anonimizzati direttamente sul proprio pc”. Questo è vero per i dati disponibili per chiunque, sulla falsariga dei File standard prodotti dall’Istat. Per questo tipo di file anche in Italia è sufficiente riempire un modulo di richiesta e successivamente il file viene fornito attraverso un invio elettronico. Queste limitazioni saranno presto superate con la generazione di file ad uso pubblico, mIcro.STAT, che l’Istat metterà a disposizione dell’utenza a breve sul proprio sito, al pari di quanto avviene per l’Indagine sui redditi e la ricchezza delle famiglie italiane della Banca d’Italia. Al riguardo, sembra opportuno precisare che tale indagine è condotta su un insieme limitato di famiglie (circa 8000) e diffusa con un livello di dettaglio geografico regionale: il file ad uso pubblico previsto dall’Istat sull’analoga rilevazione si avvarrà di un campione più grande (circa 22000 famiglie) e sarà diffuso con un dettaglio geografico maggiore.
Diversa è la situazione dei microdati per la ricerca. In Gran Bretagna, come d’altronde in tutti i paesi europei ed in modo armonizzato, per questo tipo di dati occorre presentare un progetto di ricerca che viene valutato. In UK si parla di una special licence la quale prevede, oltre alla presentazione di un progetto di ricerca, altre limitazioni come la necessità di specificare la lista delle variabili ed il relativo dettaglio, ma soprattutto esclude la possibilità di fruizione a ricercatori che non siano affiliati ad Università UK. In Francia, occorre fare richiesta, presentare un progetto di ricerca, andare a Parigi per discuterlo davanti al Comité du secret statistique e dopo circa nove mesi dall’avvio della richiesta, si ha eventualmente l’autorizzazione all’accesso ai dati elementari.
Quindi, per ottenere l’accesso a dati per la ricerca, può variare il destinatario (Presidente dell’Istat piuttosto che il Comité du secret statistique o UK Data archive) ma è necessaria la presentazione di un progetto con la motivazione per la richiesta dei dati. Le modalità di fruizione sono differenti a causa di differenze nella legislazione che governa le organizzazioni. Nella legislazione italiana attuale non è possibile implementare un accesso remoto presso l’istituzione del richiedente (come in Francia) ma solo presso luoghi sotto il diretto controllo dell’Istat. Sia Insee che ONS (Istat UK) hanno avuto una revisione delle leggi statistiche in anni recenti. La normativa italiana in materia è datata 1989; l’Istat si è impegnata per modificarla al fine di adeguarla alla legislazione europea, e poter quindi estendere l’accesso remoto anche al di fuori delle sedi Istat.
Per quanto riguarda le annualità fruibili è vero che per le forze di lavoro il file per la ricerca è disponibile dal 2009 ma, contrariamente a quanto affermato nell’articolo, non presenta “forti limitazioni” alle analisi in quanto sulla maggior parte delle variabili di interesse è presente il massimo dettaglio. Forse l’autore fa riferimento ai File standard, che comunque sono disponibili dal 1992 in poi (http://www.istat.it/it/archivio/3873, http://www.istat.it/it/archivio/3901).
In conclusione, l’Istat confida che a breve, con la nuova normativa, “le difficoltà del ricercatore in Italia” saranno superate.
Un saluto Patrizia Cacioli
Direttore della Comunicazione Istat
==================================
La Risposta dell’Autore
Ringrazio moltissimo la Dott.ssa Patrizia Cacioli per la risposta. Non me l’aspettavo. Pensavo che le domande sarebbero rimbalzate contro il classico muro di gomma. Non è stato così e ne sono davvero contento. È un ottimo segnale. E sono ancora più contento di sapere che l’Istat si muove nella direzione auspicata nell’articolo. Aspetto quindi con ansia di sapere quando sarà attivo micro.STAT, nella speranza che le annualità fruibili siano più di quattro. Un numero ristretto di anni è infatti di per sé una forte limitazione per i ricercatori. Per evitare questo tipo di incomprensioni potrebbe essere utile per tutti che l’Istat crei dei canali di comunicazione con chi lavora sui dati per raccogliere problemi e richieste e migliorare la qualità e la fruibilità dei dati stessi.
Per quanto riguarda invece il tema dell’accesso remoto ai cosiddetti “microdati per la ricerca” sarei grato alla Dott.ssa Cacioli se potesse indicare esplicitamente la normativa che obbliga l’ISTAT a concedere l’accesso ai dati “solo presso luoghi sotto il diretto controllo dell’Istat” e se potesse chiarire a che punto dell’iter legislativo si trova la nuova normativa a cui fa riferimento che permetterebbe di superare il problema.
Cordiali saluti
Giovanni Pica
Universita’ di Salerno
Aggiornamento
Sui microdati, qualcosa si muove: l’Istat il 17 aprile ha pubblicato un comunicato annunciando l’apertura di Micro.stat, un database che – l’Istat promette – si arricchirà nel tempo, dal quale si possono già scaricare i primi microdati.