Pubblicato originariamente sullo European data journalism network
«Abbiamo chiesto alla Commissione di considerare la graduale eliminazione della pubblicità mirata, se non un divieto totale in tutta l’Unione europea». Queste le parole di Alex Agius Saliba, eurodeputato maltese, all’inizio di ottobre. La stessa richiesta si ritrova in un rapporto sostenuto dai più importanti forze politiche e scritto dall’eurodeputato tedesco Tiemo Wölken. Qual è il problema dell’Europa con la pubblicità online e perché dovrebbe interessarci?
La pubblicità mirata è quella in cui il centro dell’attenzione per gli inserzionisti sono gli utenti di Internet e i dati collegati al loro profilo. Fino ai primi anni 2000 la pubblicità online era basata sul contesto. Gli algoritmi analizzavano il contenuto delle pagine visitate e poi decidevano quali annunci dovessero essere visualizzati in spazi specifici. Il contenuto dell’annuncio era basato sulla natura dello spazio web, non sui visitatori. Facciamo un esempio: leggendo un articolo sulla stagione sciistica, si visualizzano annunci di località di montagna o marchi di abbigliamento invernale.
La pubblicità mirata, invece, è un sistema più complesso, e punta a mostrare gli annunci più pertinenti in base al profilo dell’utente che sta visualizzando la pagina. Attualmente il sistema più sofisticato e diffuso è quello delle offerte automatiche. Durante il caricamento della pagina, un identificatore che collega l’utente alla sua attività online (e a volte anche offline) viene inviato a una serie di agenzie che competono per l’attenzione dell’utente in un mercato automatizzato. Tutto questo avviene in frazioni di secondo, senza che l’utente se ne accorga. La svolta che ha portato alla diffusa adozione di questo sistema può essere fatta risalire al 2007, quando Google ha acquisito DoubleClick, una società il cui successo è stato costruito proprio su questo sistema e su una vasta rete di inserzionisti, editori e agenzie pubblicitarie.
Secondo un rapporto pubblicato nel 2018 da Johnny Ryan, che lavorava all’epoca per il browser Brave, l’offerta in tempo reale (RTB) consente, tra le altre cose, di condividere quanto segue: ciò che l’utente sta guardando o leggendo, la sua posizione geografica, Indirizzo IP, descrizione dell’applicazione. A seconda del sistema RTB utilizzato, è possibile recuperare altri dati identificativi, come fascia di reddito, età, sesso, orientamento sessuale, etnia, religione, opinioni politiche, influenza sui social media, ecc.
Dal punto di vista delle aziende che utilizzano le offerte in tempo reale, incluso Google, quello della pubblicità mirata è un servizio che garantisce la massima efficienza sia per l’inserzionista che per l’utente: il primo è certo che il proprio annuncio verrà visto dagli utenti interessati; e questi ultimi vedranno annunci più pertinenti alle loro esigenze e abitudini di spesa. La promessa agli editori è un importante miglioramento del loro spazio pubblicitario. Gli annunci mirati dovrebbero aumentare i clic e persino alcune “conversioni”, ovvero l’installazione di un’app. Più un annuncio è pertinente, più utenti faranno clic, il che aumenta il valore dello spazio pubblicitario.
Eccessiva concentrazione del mercato
Gli annunci mirati si fondano su due elementi: lo sviluppo di piattaforme con capacità di profilazione e gestione delle offerte sempre più sofisticate e la raccolta dei dati degli utenti. Il primo favorisce la concentrazione del mercato perché, come troppo spesso accade nel settore dell’alta tecnologia, sono le aziende più potenti con le risorse per sviluppare le piattaforme. E quando non sono i primi, possono facilmente acquisire qualsiasi azienda particolarmente innovativa.
Secondo un rapporto dell’agenzia indipendente PLUM riguardante il Regno Unito, «Google e Facebook e, in misura minore, Amazon (GFA) hanno una portata e un’ampiezza uniche di attività nel mercato della pubblicità online, integrate da attività nei mercati adiacenti. In particolare, GFA si distingue per un ampio inventario pubblicitario di proprietà, piattaforme tecnologiche pubblicitarie ben sviluppate (in particolare Google), tecnologie nei mercati adiacenti (come Google Chrome e Android) e ampi dati proprietari. Gestiscono i dati come un giardino recintato: raccolgono dati degli utenti da varie fonti ma condividono con i partner solo i dati aggregati con i partner.
Secondo lo stesso rapporto, Google è leader nel Regno Unito, in questa fase intermedia di sviluppo, rappresentando il 30-50 per cento dell’offerta e il 22-35 della domanda, mentre l’80-90 per cento di editori e inserzionisti utilizza i suoi servizi. Percorrendo praticamente tutta la filiera, sono emersi conflitti di interesse e, secondo le informazioni raccolte da PLUM, le pubblicità gestite da Google sono state in passato privilegiate nelle offerte automatizzate, a svantaggio di altri inserzionisti. Sembrerebbe che tali pratiche ora siano cessate.
Il 28 ottobre l’Autorità garante della concorrenza e del mercato in Italia ha espresso le sue preoccupazioni: «Nel mercato cruciale della pubblicità online, che Google controlla grazie alla sua posizione dominante in gran parte del settore digitale, l’Autorità vorrebbe contestare il loro uso scorretto dell’enorme quantità di dati raccolti dalle proprie applicazioni, impedendo agli inserzionisti online concorrenti di competere efficacemente».
Il problema con la privacy e la protezione dei dati
Al momento, almeno 22 organizzazioni per i diritti digitali hanno presentato casi a una serie di autorità europee per la protezione dei dati. I primi a sollevare pubblicamente la questione, nel 2018, sono stati Johnny Ryan e Open Rights Group. All’inizio del 2019, l’organizzazione polacca Panoptykon ha presentato un caso simile all’autorità di Varsavia contro Google e Interactive Advertising Bureau Europe (IAB), sostenendo che i loro protocolli, che determinano le categorie utilizzate nella raccolta dei dati, violano una serie di principi contenuti in Regolamento generale sulla protezione dei dati dell’UE (GDPR). IAB Europe ha risposto alle accuse sostenendo che, se il loro protocollo consente effettivamente loro di raccogliere tali dati, le aziende che utilizzano questo protocollo sono ancora tenute a rispettare le leggi sulla protezione dei dati – ed è questo, piuttosto che il protocollo, che necessita di indagini.
Verso la fine di settembre 2020, il Consiglio irlandese per le libertà civili (ICCL), con cui Johnny Ryan sta ora collaborando, ha pubblicato ulteriori dettagli sui rischi e le conseguenze della continua e massiccia raccolta di dati personali. La profilazione degli utenti può essere utilizzata anche per operazioni che vanno oltre la pubblicità, oppure cercano di raggiungere gli utenti sfruttando categorie sensibili. Ad esempio, il broker di dati OnAudience, con sede in Polonia, ha utilizzato i dati del profilo di 1,4 milioni di persone, raccolti attraverso piattaforme pubblicitarie mirate, per diffondere un messaggio politico alle persone aperte alle questioni LGBTQ +.
Anche gli utenti apparentemente anonimi sono collegati a un codice identificativo univoco. Questo e altri moduli pubblicitari creati da OnAudience sono disponibili tramite piattaforme di offerte automatiche di proprietà di Google e altri e lo stesso database di profili può essere utilizzato per visualizzare altri tipi di annunci. L’ICCL ha dimostrato che attraverso il protocollo di Google 1200 persone in Irlanda sono state classificate in categorie come “abuso di sostanze”, “diabetico”, “dolore cronico” e “disturbi del sonno”. Con il protocollo IAB, sempre in Irlanda, un data broker è stato in grado di profilare 1300 persone come “AIDS e HIV”, “supporta l’incesto e lo stupro”, “tumore al cervello”, “incontinenza” e “depressione”.
Mobilewalla ha rivendicato numeri molto maggiori. Nella sola Europa apparentemente hanno raccolto dati sulla geolocalizzazione di 117 milioni di dispositivi, su un totale di 61 miliardi di osservazioni al mese. Secondo il fondatore e CEO Anindya Datta, un archivio di due anni di dati di geolocalizzazione è sufficiente per mappare i modelli comportamentali individuali. Ad esempio, potresti stabilire chi visita regolarmente la chiesa e raggiungerlo con un annuncio quando arriva lì.
Recentemente un’indagine dell’autorità belga per la protezione dei dati ha concluso che il Transparency and Consent Framework pubblicato da IAB (e uno standard nel settore) viola numerosi principi GDPR, tra cui trasparenza, accuratezza, responsabilità e legalità della trasmissione dei dati. Secondo l’ICCL, l’articolo 5 (f) sulla sicurezza dei dati gioca un ruolo importante, poiché è impossibile sapere dove andranno a finire i dati una volta raccolti. L’ultimo sviluppo giuridico riguarda l’Open Rights Group, che ha citato in giudizio il Garante per la protezione dei dati personali inglese dopo che quest’ultimo ha deciso di chiudere la sua indagine sulla pubblicità digitale lo scorso settembre, nonostante le proprie raccomandazioni non fossero state adattate dagli operatori del settore, e dopo aver già stabilito nel 2019 che la pubblicità mirata opera in violazione del GDPR.
Ci siamo rivolti a Paul De Hert, uno dei massimi esperti europei sul rapporto tra privacy e tecnologia, e Alessandro Ortalda, ricercatore presso l’Università di Bruxelles. Entrambi confermano l’eterna battaglia tra pubblicità online e protezione dei dati, soprattutto quando si parla di trasparenza. Ciò significa sia i dati forniti che il modo in cui vengono visualizzati. «Nel contesto della navigazione online, in cui gli utenti passano rapidamente dal contenuto al contenuto, è complesso per i responsabili del trattamento elaborare politiche sulla privacy e moduli di raccolta del consenso che attirino l’attenzione degli interessati, che di solito sono disposti ad accettare frettolosamente tutto ciò che viene visualizzato sullo schermo e per passare direttamente al contenuto che stanno cercando. Ciò compromette gravemente l’efficacia della condivisione delle informazioni e potrebbe invalidare il consenso fornito dagli interessati, in quanto potrebbe non raggiungere la soglia del “consenso informato”.
I dubbi sulla reale efficacia del sistema
Nel gennaio 2020 l’emittente televisiva pubblica olandese NPO ha affermato di aver rimosso ogni sistema in grado di tracciare gli utenti dalle proprie pagine web, scegliendo di vendere il proprio spazio pubblicitario solo su base contestuale. Secondo i dati condivisi da NPO e pubblicati da Brave, i ricavi pubblicitari della rete sono aumentati rispettivamente del 62 e del 79% nei primi due mesi dell’anno. Da marzo la pandemia ha decisamente rallentato il ritmo, ma il trend non si è invertito. C’è da chiedersi se la pubblicità basata sulle offerte automatiche offra davvero vantaggi agli attori del mercato, ad eccezione di coloro che gestiscono la piattaforma.
Secondo il ricercatore statunitense Tim Hwang, si sta formando una grande bolla nel settore della pubblicità online. Attualmente c’è ancora una convinzione diffusa nel fatto che «qualcosa di così complesso non può funzionare», ma presto potrebbe essere fin troppo chiaro che questo sistema non produce molto valore aggiuntivo. Nel suo recente libro “Subprime Attention Crisis”, Hwang spiega che il problema principale con la misurazione dell’efficacia del sistema è che coloro che pubblicano i dati sono anche coloro che offrono i servizi: «Entità come Interactive Advertising Bureau e Association of National Advertisers are importanti sbocchi per la ricerca sullo stato del mercato, ma fungono contemporaneamente da organizzazioni di difesa per conto dell’industria. Lo spazio manca di un’istituzione solida e indipendente che possa fungere da contrappeso, indagare oggettivamente le affermazioni del settore e condurre sperimentazioni continue per testare la salute del mercato».
C’è un altro problema di efficacia che di fatto precede l’introduzione delle offerte automatizzate. La percentuale di clic sugli annunci pubblicati da AdWords di Google è dello 0,46%, meno di una persona su 200; inoltre, sembra che fino alla metà dei tocchi dello smartphone siano dovuti a persone che cliccano o toccano accidentalmente. Un’altra cosa che influenza l’accuratezza dei risultati è il fatto che molti di questi annunci non vengono mai realmente visti dall’utente: mentre il sistema di offerte automatiche può determinare con precisione quali annunci mostrare e in quali spazi mostrarli, questi annunci possono essere caricati in in fondo alla pagina o in un’altra area meno visibile. La visibilità è un problema familiare, come mostra un rapporto di Google del 2014. Il rapporto suggerisce che il 56,1% degli annunci pubblicati online non è mai stato visualizzato da un essere umano. Per quanto ne sappiamo, l’industria è riuscita a convincere inserzionisti ed editori che il loro sistema è indispensabile: un sistema che mette in pericolo i principi fondamentali della privacy e della protezione dei dati e comporta una potenziale illegalità. Per quanto riguarda l’effettiva efficacia di questi strumenti, dovremo attendere ulteriori ricerche.