Nel 2011, un team della Texas A&M University ha condotto un’operazione informatica per catturare gli utenti non umani di Twitter che stavano intasando la “Twittersfera” di spam. Il loro approccio consisteva nel predisporre dei profili trappola che pubblicassero contenuti privi di senso ai quali nessun utente umano avrebbe prestato attenzione. Tutti i profili che ripubblicavano il contenuto o che stringevano un’amicizia con il falso profilo sarebbero stati sicuramente degli utenti non umani, conosciui come social bot.
Il team ha creato 60 profili e raccolto intorno a 3,600 potenziali account di social bot. Il risultato ha sorpreso diversi osservatori per la quantità esorbitante di profili non umani attivi. Questi bot erano generalmente grezzi e si limitavano a ripubblicare pressoché qualunque contenuto incontravano. Da allora, i social bot si sono evoluti parecchio, e oggi ricercano le reti social per scovare le persone più popolari e influenti al fine di seguirle e attirare la loro attenzione inviando loro messaggi. Questi bot sono in grado di identificare parole chiave e trovare contenuti analoghi. Alcuni possono addirittura rispondere a delle domande utilizzando algoritmi per la formulazione di periodi naturali.
Tutto questo non fa che rendere ancora più arduo lo smascheramento di social bot. Oggi, Emilio Ferrara e alcuni colleghi dell’Indiana University di Bloomington sostengono di aver sviluppato un sistema per identificare sofisticati bot sociali e distinguerli dai normali utenti umani. La tecnica è relativamente diretta. Il team ha cominciato col raccogliere un insieme di social bot dal gruppo identificato originariamente nel 2011. Una volta selezionati, 15mila di questi bot, hanno raccolto gli ultimi 200 tweet e i 100 tweet che li menzionavano. Questa selezione ha dato loro un dataset di circa 2,6 milioni di tweet. Il team ha quindi raccolto un dataset simile per 16mila utenti umani e oltre 3 milioni di tweet.
Per finire, i ricercatori hanno creato un algoritmo di nome “Bot or Not?” per esaminare questi dati in cerca di differenze fondamentali nelle proprietà degli utenti umani e dei social bot. L’algoritmo ha esaminato oltre mille caratteristiche associate a questi profili, quali il numero di tweet e re-tweet pubblicato da ciascun utente, il numero di risposte, menzioni e re-tweet ricevuto da ciascuno, la lunghezza dello username e persino l’età dell’account.
Ne è emerso che esiste una fondamentale differenza tra gli account di esseri umani e social bot. I bot tendono a ripubblicare post molto più di frequente rispetto agli esseri umani, e hanno username e account più recenti. D’altra parte, i profili di persone reali ricevono più risposte, menzioni e re-tweet. Messi assieme, questi fattori creano una sorta di impronta digitale che può essere utilizzata per smascherare i bot. «Il “Bot or Not?” ha una precisione di rilevamento alquanto promettente», dicono Ferrara e colleghi.
Esistono dei limiti, però. Anzitutto, il team ha utilizzato i sociali bot risalenti all’analisi del 2011, per cui è possibile che oggi siano in circolazione bot più avanzati e difficili da individuare. Esistono poi casi remoti in cui sono presenti sia post di esseri umani che di social bot, come quando gli utenti umani lasciano gestire il proprio profilo a bot o quando i profili vengono violati da «Per adesso, il rilevamento di queste anomalie è impossibile», hanno ammesso Ferrara e co.
Ciononostante, questo è un inizio promettente nel processo di identificazione dei social bot. Si tratta però di un compito che diventerà sempre più arduo con il passare del tempo. Con appena 140 caratteri, Twitter impone dei limiti severi sul genere di comunicazioni possibili. Pertanto, per un computer è molto più facile ricreare il comportamento limitato degli esseri umani in questo spazio.
Per chi fosse interessato, Ferrara e colleghi hanno reso il proprio algoritmo “Bot or Not?” disponibile presso il loro sito web. Basta inserire il nome del profilo Twitter per avviare l’analisi delle sue caratteristiche e dei suoi ultimi post e determinare le probabilità che si tratti di un social bot.