Appesi ai numeriData Journalism: ecco gli strumenti informatici al servizio della notizia

Il dato più interessante spesso è nascosto, e non arriva nelle redazioni di agenzie e giornali sotto forma di comunicato stampa. Tra le pieghe di un database o tra le tabelle pubblicate su una una ...

Il dato più interessante spesso è nascosto, e non arriva nelle redazioni di agenzie e giornali sotto forma di comunicato stampa.
Tra le pieghe di un database o tra le tabelle pubblicate su una una ricerca può nascondersi una notizia che è sotto gli occhi di tutti, ma non è ancora stata notata. Le curiosità si trovano leggendo con attenzione. Ma ci sono degli strumenti informatici che possono semplificare la vita dei giornalisti, o addirittura che permettono di scoprire cose invisibili ad occhio nudo.

«Costruire storie dai dati». Con: Caelainn Barr, Liliana Bounegru, Lucy Chambers, Steve Doig. Festival Internazionale del Giornalismo, 2012

Grandi quotidiani anglosassoni come il Guardian ed il New York Times hanno unità di lavoro specializzate in Data Journalism. Non traducono statistiche in infografiche. Non solo. Fanno giornalismo investigativo andando a caccia di enormi raccolte di dati, da studiare e analizzare in cerca di scoop.

Tra gli attrezzi fondamentali di questo mestiere ci sono i fogli di calcolo – come Excel, il popolare programma di Windows Office, oppure ancora Calc, il suo rivale gratuito del pacchetto OpenOffice.
Con questi software è possibile creare database, ordinare le informazioni in base a criteri prestabiliti, compiere operazioni matematiche e ripeterle per lunghe serie di dati, e creare grafici.

Per chi parte da zero, non tutte le loro funzioni sono immediate da capire. Ma la rete è piena di risorse. Lo stesso sito di OpenOffice mette a disposizione dei manuali. Basta una ricerca su Google – possibilmente in inglese – per trovare risposte agli infiniti dubbi che possono sorgere in corso d’opera. Si trovano anche dei corsi video on-line, gratuiti e non.

Se i database Istat, Eurostat ed Ocse possono essere direttamente scaricati in formati compatibili con Excel e Calc, lo stesso non si può dire per le innumerevoli tabelle che troviamo sulla maggior parte dei siti web e dei documenti in formato PDF che ci capitano sottomano.

In tal caso bisogna utilizzare strumenti che ci permettano di fare uno scraping. Virtualmente, raschiare via i dati dalla rete o dai documenti, per poi trasferirli su un foglio di calcolo. Il DeWitt Wallace Center for Media and Democracy della Duke University pubblica una lista di programmi semplici e spesso gratuiti. Basta accedere al loro Reporters Lab e cercare «scrapers» e «PDF» nella sezione «Find a tool». È anche possibile installare uno scraper nel browser Google Chrome.
Si tenga conto che un software efficace su certe pagine può non funzionare con altre. Per chi è disposto a mettersi il cappello del programmatore e studiare, ci sono strumenti molto più potenti a disposizione, come YahooPipes e ScraperWiki.

Non c’è bisogno di una laurea in informatica per utilizzarli. Esistono delle guide (tutorial), che insegnano a compiere le operazioni elementari necessarie allo scraping. Se questo non bastasse, esistono blog e comunità on-line in cui cercare risposte alle proprie domande.
Sicuramente servono tempo e studio. E per essere infallibili guardare tutorial, copiare codici e consultare forum di discussione può non bastare. Bisogna addentrarsi nella selva delle «espressioni regolari», una branca del mondo della programmazione, e capirne i segreti.

twitter@pfrediani

Entra nel club, sostieni Linkiesta!

X

Linkiesta senza pubblicità, 25 euro/anno invece di 60 euro.

Iscriviti a Linkiesta Club