Studiare la droga tra i giovani con i Big data

Studiare la droga tra i giovani con i Big data

Si dice che William Shakespeare usasse uno dei più ampi e variegati vocabolari della storia della letteratura, oltre ad aver inventato non pochi neologismi. Ma oggi c’è chi lo supera. Sono gli artisti dell’Hip Hop. Che giocano con le parole come fossero palle da basket creando significati e significanti ben più musicali della migliore letteratura vittoriana. Matt Daniels è un designer, programmatore e data analyst nella società specializzata in ricerche digitali Undercurrent di New York. In passato ha studiato l’etimologia di parole come shorty, traducendo i risultati in tabelle ed infografiche che hanno fatto sobbalzare sulla sedia non pochi semiotici e studiosi del linguaggio. Questa volta, nel mese di maggio, ha paragonato i testi delle canzoni degli artisti hip hop della scena newyorkese ai sonetti shakespeariani scoprendo che la varietà di parole usate dai rapper MC (Master of Ceremonies) superano di molto quelle del poeta del XVI secolo.

Daniels ha analizzato le prime 5mila parole di sette opere shakespeariane, tra cui Amleto, Romeo e Giulietta, Otello, Macbeth, Come vi piace, Racconto d’inverno, e Troilo e Cressida. Ha poi selezionato le prime 35mila parole usate da Melville nel suo romanzo Moby Dick del 1851. Ed ha infine paragonato le prime 35mila parole di entrambi gli scrittori ai primi 35 termini delle canzoni dei MC. Risultato: Il drammaturgo inglese, con appena 5.170 vocaboli nuovi, si pone tra i Beastie Boys e gli Outkast, mentre l’autore di Moby Dick, Herman Melville, con 6,022 lemmi, a metà tra Kool Keith, GZA e Aesop Rock, primo in classifica. Proprio quest’ultimo, il 37enne beatmaker californiano, in arte Ian Matthias Bavits, svetta nella hit parade per aver usato ben 7.392 fonemi diversi nelle sue prime 35mila battute. Mentre il rapper DMX (Dark Man X), the Divine Master of the Unknown, pseudonimo di Earl Simmons arriva ultimo. Le sue canzoni sono piuttosto “povere” di contenuti, contengono appena 3.214 diversi lemmi.

Clicca qui per vedere l’immagine ingrandita

Clicca qui per vedere l’immagine ingrandita

«Con l’aiuto del rap genius, ho utilizzato una metodologia di ricerca che si chiama token analysis» racconta il giovane programmatore. In pratica il software, una volta trascinato il testo nel programma, è in grado di conteggiare le parole usate secondo determinati parametri. Ogni temine viene selezionato una sola volta e, per evitare di incorrere in incomprensioni lì dove ci sono apostrofi (ad esempio pimpin’ contro pimpin), la punteggiatura viene rimossa dal database. L’Hip hop è ovviamente pieno di slang di difficile comprensione (ad esempio Shorty vs Shawty), e metafore (ad esempio king shit), con melodie, coretti e refrain che si ripetono all’infinito. Ma la ricerca intelligente sui Big data della musica, curata sempre da rap genius, ha rivelato molto altro. Ad esempio quante volte la parola marijuana, cocaina ed un’altra vasta tipologia di droghe note e meno note, vengono citate nelle lyrics rap nel corso degli ultimi 15 anni. Dalla ricerca Drug Slang in Hip Hop project si è riscontrato che se la parola cocaina è da sempre presente nella musica rap, i termini legati all’alcol sono in declino, mentre quelli riferiti a farmaci e droghe sintetiche registrano un drammatico aumento negli ultimi anni. I Big data diventano così un semplice sentiment della rete o una tendenza reale in atto? Si chiama nowcasting. È la rilevazione del presente, ma anche la previsione del futuro.

Le newsletter de Linkiesta

X

Un altro formidabile modo di approfondire l’attualità politica, economica, culturale italiana e internazionale.

Iscriviti alle newsletter