Open data, Milano pubblica i dati ma taglia fuori i cit

Open data, Milano pubblica i dati ma taglia fuori i cit

Dai primi giorni di Ottobre il Comune di Milano, in ottemperanza alla delibera 1919/2012, ha dato il via ad un progetto per la pubblicazione e la diffusione dei dati della pubblica amministrazione attraverso il portale dati.comune.milano.it. Scopo del sito è mettere a disposizione della collettività il maggior numero possibile di informazioni gestite o prodotte dalla pubblica amministrazione, digitalizzate e in formato open. Il lavoro di pubblicazione è in corso d’opera e un account twitter tiene aggiornati gli utenti sulle nuove release disponibili. Al momento sono circa 90 i dataset presenti nel sistema; il loro contenuto spazia dal censimento delle edicole alla mappatura delle reti wifi.

Apparentemente completo ed esaustivo, il portale milanese è anche in linea con quanto suggerito dal Vademecum sugli open data. Le richieste di natura tecnologica, come i formati utilizzati, o di natura legale come quelle inerenti a copyright e licenze, sono stati soddisfatti in maniera puntuale. Tutti i dataset vengono distribuiti seguendo la licenza I.O.D.L. ( Italian Open Data License) o compatibili, e i formati in cui sono esibiti i dati sono nella grande maggioranza dei casi aperti e facilmente scaricabili.

Da questo punto di vista il lavoro del comune di Milano è perfettamente in linea con il più vasto dati.gov.it, nato sia con lo scopo di pubblicare gli open data degli enti pubblici nazionali, sia soprattutto per costituire una grande repository dei rilasci locali: in questo momento all’interno del portale sono presenti 50 amministrazioni, con un totale di 886 dataset. Uno dei problemi maggiori della raccolta è dovuto dall’eccessiva eterogeneità del catalogo. I rilasci prodotti dalle varie pubbliche amministrazioni ricorrono a formati diversi (21 quelli catalogati dal sistema) e contengono informazioni che possono essere lette e utilizzate da diversi software.

Anche la stessa tipologia di dati è esibita con un livello di dettaglio diverso: il comune di Milano e quello di Torino non hanno ancora reso pubblici i bilancio; il comune di Bologna e quello di Firenze si sono impegnati in questa direzione, ma con un livello di profondità e di interazione non omogenei tra loro. Questa disparità rende impossibili analisi comparate; al contempo preclude, assieme ai vincoli tecnologici, l’evoluzione degli open data verso i linked open data, ovvero la possibilità di mettere in relazione più dataset e di costruire tra loro reti di relazioni semantiche.

Il lavoro del comune di Milano mostra una sintesi dei problemi che infestano il portale nazionale. I pacchetti hanno origini e formati dissimili, non sono relazionabili e non viene applicato il sistema di valutazione standard. Secondo il Vademecum è necessario poter attribuire un grado di apertura ai dataset così da poter di valutare l’efficacia del servizio; per raggiungere questo scopo è stato definito un ranking con una valutazione da 1 a 5: da raw (dati grezzi ) ai linked open data (open e interoperabili).

Il Comune di Milano fornisce solo dati strutturati e open, ma in nessun caso si arriva al livello 5 del ranking: questo significa che si possono esportare e riutilizzare singoli set, ma che questi non possono comunicare tra loro rendendo impossibile una ricerca più performante.

Il secondo requisito presente nel Vademecum è la valutazione circa il livello di interesse dei dati esposti. A oggi il comune di Milano non fornisce quelli considerati più significativi, come i bilanci del comune e gli atti amministrativi. Per quanto riguarda invece alcuni settori strategici, commercio e l’industria, vengono proposti archivi di minore rilevanza, come il censimento di alcune attività produttive: non vengono però divulgate le informazioni sui comparti produttivi e sulla reale situazione economica dall’area metropolitana.

I dataset messi a disposizione sono (per ora) 89; la promessa è che si eseguano nuovi rilasci ogni mese, superando quota 100 entro la fine del 2012. Le famiglie di dati più ampie sono quelle collegate da un lato a popolazione e anagrafe, dall’altro lato a formazione e cultura. In entrambi i casi si tratta di circa una ventina di contributi: per un versante riguardano i residenti, le nascite, i flussi migratori e le proiezioni sulle fluttuazioni future negli abitanti dei quartieri urbani; per l’altro versante i temi trattati sono focalizzati sugli edifici scolastici, sulle sedi museali e sui teatri, nonché sui fruitori dei servizi formativi presenti nella città. In terza battuta la famiglia più rappresentata è quella relativa alle infrastrutture di trasporto, con indicazioni su Area C, piste ciclabili, linee degli autotrasporti pubblici. 

La scelta compiuta dall’amministrazione sembra essere quella di pubblicare i dati man mano che le varie direzioni centrali li rendono disponibili; potrebbe essere anche una tattica condivisibile, se i nuovi rilasci seguissero una pianificazione tesa a favorire l’usabilità del portale e a permettere una lettura/ricerca intelligente da parte dell’utente. Ogni nuovo pacchetto invece viene inserito allo stesso livello degli altri, rendendo la navigazione esclusivamente orizzontale; tutti i dataset hanno uguale importanza, e in assenza di una catalogazione dei dataset per categorie, l’utente deve farsi carico di vocazione missionaria per: a) immaginare che ne esista uno corrispondente ai suoi interessi; b) scorrerli tutti cercando di rintracciare quello giusto.

La presenza di un così vasto repertorio sembra essere un ostacolo più che un valore, senza una guida alla lettura che indichi quali sono le informazioni indispensabili per comprendere la realtà sociale ed economica governata dalla pubblica amministrazione. Risulta proibitivo rintracciare i dati sul consumo del territorio attraverso il motore di ricerca se non si è nati con una conoscenza a priori dei nomi dei dataset in questione (p.e. verde agricolo, parchi e giardini, aree adibite a orti comunali e didattici); e in ogni caso appare difficile individuarli consultando gli indici, se i file sono “annegati” tra le liste dei parchi per i cani e quelle degli orti pubblici.

La mancanza di informazioni strutturate e necessarie per la comprensione del territorio potrebbe essere una delle cause dell’apparente disinteresse manifestato dai cittadini per l’iniziativa. A oggi il portale è sottoutilizzato: i dieci dataset più scaricati, dal giorno della messa online, hanno prodotto complessivamente 5288 download; anche attribuendo ciascun download a un singolo ente/individuo, il numero degli utenti attivi è molto modesto rispetto a quello potenziale della popolazione milanese e delle imprese attive nell’area metropolitana.

Forse il pubblico non trova interessante un servizio tanto innovativo perché il progetto non è stato pensato davvero per lui. Stando a quanto dichiarato nell’omonima sezione, i principi chiave che animano l’iniziativa sono l’utilizzo di formati open, l’utilizzo di licenze CC e la gratuità: tutti requisiti soddisfatti. Nella stessa sezione vengono enumerati anche gli obiettivi del piano: favorire la democrazia partecipativa, agevolare la ricerca e sostenere lo sviluppo di imprese specializzate. Si vorrebbe dialogare: a) con i privati cittadini, nel tentativo di fornire loro un utile strumento formativo; b) con gli enti di ricerca, per favorire lo sviluppo di progetti di studio; e c) con l’impresa privata, per aprire prospettive di business.

Più sinteticamente nelle Faq ci viene spiegato che il portale si rivolge a tutti gli operatori pubblici, privati o commerciali. Una terza interpretazione è quella presente nella delibera regionale del Gennaio 2012 dove viene sancito il principio della trasparenza per cui la mera esibizione del dato deve essere intesa di per sé un valore. Vengono di nuovo ricordati i vantaggi economici derivati dalla possibilità di enti, istituti e aziende di accedere alle informazioni e si dichiara che il beneficio che il cittadino trae da iniziative del genere ha un effettiva ricaduta positiva sulla qualità della vita.

Le tre formulazioni sono collegate da una perfetta uniformità di intenti: i dati sono rivolti al maggior numero di soggetti al fine di accrescere le possibilità di ognuno. Appare chiaro come le aziende, le altre pubbliche amministrazioni e gli istituti di ricerca pubblici e privati possano beneficiare di un patrimonio informativo così ricco; le domande che questi soggetti formulano sono precise e si assume che essi dispongano della capacità di manipolare la tecnologia che veicola le risposte. Non è per nulla chiaro invece come la semplice pubblicazione di questi dati possa immediatamente concorrere a “rendere i cittadini maggiormente consapevoli” o ad aiutarli a “effettuare scelte che soddisfino i loro bisogni in modo adeguato”.

Anche se il comune di Milano decidesse di rendere pubblici tutti i dati più interessanti (come quelli di bilancio, di consumo del territorio e quelli relativi agli appalti pubblici) e fossero superate le piccole contraddizioni del sistema, sarebbe impossibile convincersi che queste “verità svelate” possano generare da sole un aumento della coscienza collettiva e della qualità della vita dei cittadini. Leggi che promuovono la libera consultazione degli atti pubblici sono state promulgate già nel 1781 dal Gran Ducato di Venezia, ed è dalla legge n°241 del 1990 che esiste il diritto di accesso agli atti amministrativi. L’obbligo della digitalizzazione, della messa on line delle informazioni, e successivamente il concetto di open e linked open data, rappresentano l’evoluzione tecnologica con cui viene assolto lo stesso compito: la messa a disposizione dei dati e la creazione di repository più o meno interattive. I dati ci sono e sono consultabili. Da prima che diventassero open.

La responsabilità di una mancata partecipazione al pubblico dibattito è bidirezionale. Manca, dal basso, il bisogno di interagire con le amministrazioni e di svolgere quell’azione di controllo sul loro operato che dovrebbe essere la chiave centrale dell’esercizio della democrazia. Manca dall’alto la capacità e forse la volontà di non fornire solo l’accesso agli schedari, ma anche di formare l’intelligenza per interpretarne il contenuto.

Il livello di repository è fondamentale per rendere possibile il compito di ricerca e di estrazione da parte di chi sa cosa sta cercando. Ma sarebbe necessaria la pianificazione di un secondo livello di accesso che disegni configurazioni intelligenti dei dati, e che fornisca una chiave interpretativa della realtà – un dispositivo di rappresentazione che suggerisca domande e che non permetta solo la ricerca delle risposte. L’unica possibilità per il portale del comune di Milano di migliorare la qualità della vita dei cittadini è impegnarsi a fare in modo che i dati pubblici dismettano completamente lo statuto informatico di file, e che la loro rappresentazione sappia convertirli in informazioni per cittadini pronti a studiarli.

Le newsletter de Linkiesta

X

Un altro formidabile modo di approfondire l’attualità politica, economica, culturale italiana e internazionale.

Iscriviti alle newsletter