Il comportamento umano è fortemente legato allo stato sociale ed economico. Il modo in cui le persone si spostano all’interno di una città, ad esempio, è influenzato dal loro lavoro, dal loro reddito e dal loro stile di vita. Non è quindi una sorpresa che lo stato economico si possa riflettere anche nelle tendenze comportamentali all’interno dei social media. Questo è esattamente quanto sostenuto da Alejandro Llorente e alcuni suoi colleghi della Universidad Autónoma de Madrid. Questi ricercatori hanno mostrato come le costanti generiche nei tweet che vengono pubblicati nelle città e nei paesi della Spagna rivelino sorprendenti dettagli sul tasso di disoccupazione in ciascuna regione del Paese.
Il team è partito da un database di 19.6 milioni di tweet geolocalizzati in Spagna che sono stati pubblicati fra il novembre 2012 e il giugno 2013. Llorente e soci volevano correlare questi tweet con le regioni economicamente attive, un’operazione abbastanza complessa da realizzare. Queste regioni, infatti, non corrispondono necessariamente con i confini amministrativi della Spagna, ed è più semplice identificare confini politici e storici piuttosto che confini economici.
Il gruppo ha quindi analizzato il tasso di condivisione dei tweet fra le regioni utilizzando un semplice algoritmo di rilevamento delle comunità. Questo processo ha permesso loro di identificare 340 aree indipendenti di attività economica, che coincidono fortemente con altre misure di distribuzione geografica e politica. «Il risultato mostra che la mobilità rilevata dai tweet geolocalizzati, e le comunità così identificate, offrono una buona descrizione delle regioni economiche», dicono.
Per finire, il team ha osservato il tasso di disoccupazione in ciascuna di queste regioni e setacciato il database in cerca di correlazioni con le attività su twitter. I risultati mostrano chiare differenze fra le regioni con bassa o elevata disoccupazione. Il tasso di pubblicazione di tweet fra le 9 del mattino e mezzogiorno nelle giornate infrasettimanali, ad esempio, è notevolmente più alto nelle regioni con un elevato tasso di disoccupazione. Questi tweet hanno maggiori probabilità di contenere le parole “lavoro” o “disoccupazione” e i messaggi interi hanno maggiori probabilità di contenere errori grammaticali, il che potrebbe indicare un livello di educazione inferiore fra le persone disoccupate.
«Abbiamo dimostrato che le caratteristiche comportamentali associate alla disoccupazione possono essere individuate tramite la raccolta degli sfoghi sulla rete di microblogging di Twitter», spiegano Llorente e co. Questo è un risultato importante perché evidenzia la rapidità e la relativa semplicità con cui possono essere effettuate simili analisi rispetto a tradizionali metodi di raccolta dei dati, quali i sondaggi. Questi metodi sono talmente cari che alcuni paesi hanno considerato l’ipotesi di farne a meno in tempi di crisi al fine di risparmiare denaro.
La possibilità che i dati resi disponibili da Twitter possano fornire una rapida ed economica visione del tasso di disoccupazione risulta pertanto un’alternativa allettante. Oltretutto, questo approccio permette a governi e regolatori di monitorare quasi in tempo reale i cambiamenti nella popolazione. «L’immediatezza dei social media potrebbe persino permettere ai governi di valutare e comprendere meglio gli effetti delle leggi, dei cambiamenti sociali, dei disastri economici che possono colpire città e regioni», dicono i ricercatori, aggiungendo che la loro tecnica potrebbe essere applicata ovunque nel mondo. Ricerche simili mostrano quanto la natura del reperimento di dati si stia trasformando. Sarà interessante vedere quanto impiegheranno governi ed altre organizzazioni ad adattarsi.