(Un)fair useLa causa del New York Times a OpenAI non è sul diritto d’autore, ma sulla supremazia tecnologica

Il giornale più importante del mondo non vuole solo dimostrare la violazione di copyright dei chatbot, ma modificare per sempre il mercato, costringendo a creare nuove IA pensate sin dall’inizio per compensare gli autori delle opere usate dai modelli linguistici, ponendo fine al Far West iniziato con l’exploit di ChatGPT

Unsplash

Da più di un anno ormai il settore tecnologico gira attorno a un buco nero facendo finta di niente. Prima o poi il problema dovrà pur essere affrontato, ma non ora, non subito. Il buco nero in questione è un tema piuttosto complesso, che probabilmente condizionerà il dibattito anche politico dei prossimi anni, ed è presto detto: che ce ne facciamo del diritto d’autore nell’epoca delle intelligenze artificiali? Facciamo finta non sia mai esistito e tiriamo dritti sperando vada tutto bene? Oppure fermiamo la giostra miliardaria delle IA per rispettarne le norme? E poi, ancora, quali norme di preciso? Siamo proprio certi di non riscrivere tutto daccapo alla luce della rivoluzione innescata da ChatGPT?

Uno dei fronti più caldi di questa battaglia (culturale e legale) si gioca nelle news, come dimostra la causa intentata questa settimana dal New York Times contro OpenAI (e Microsoft) per uso improprio di milioni di suoi nella formazione (o training) del suo modello linguistico. La piccola “magia” che sta dietro a tecnologie come ChatGPT – ma anche di DALL-E, MidJourney e altri – si basa infatti sull’uso di enormi moli di dati, articoli, libri, post, immagini, filmati; contenuti che, nel caso di OpenAI, sono stati risucchiati dal web stesso, in quello che l’azienda sostiene essere stato fair use. Non paga, secondo l’accusa del quotidiano, l’azienda vorrebbe ora utilizzare quelle stesse tecnologie per fare concorrenza al New York Times, tessendo relazioni con altri editori (l’agenzia di stampa Associated Press e l’editore tedesco Axel Springer) e lavorando per “generare” articoli di giornale.

Tutto questo non sarebbe possibile se il chatbot non avesse formato le sue potenti reti neurali anche con il lavoro del NYT. La querela mossa a OpenAI include “centinaia” di prove: in molte occasioni, infatti, le risposte “generate” da ChatGPT ricalcano parola per parole gli articoli e i reportage del New York Times, cosa che confermerebbe le preoccupazioni del quotidiano.

Il documento sottolinea questo sospetto abuso anche graficamente, affiancando due paragrafi – uno “scritto” da ChatGPT, l’altro tratto dal New York Times –, e colorando in rosso tutte le parti copia-e-incollate dal giornale.

Il team legale del New York Times ha anche sottolineato la natura ambigua di OpenAI, nata come una non profit nel 2015 e diventata negli anni seguenti un gigante for profit ormai sposato a Microsoft che nel solo 2023 ha aumentato di un trilione di dollari la propria capitalizzazione di mercato, grazie soprattutto al suo peso in OpenAI. Quella che da lontano potrebbe sembrare una scaramuccia tra una bizzarra non profit di San Francisco e la grey lady del giornalismo statunitense è in realtà una questione di supremazia tecnologica che interessa qualsiasi azienda del settore, visto che tutti, da Google in giù, stanno puntando molto su servizi simili a ChatGPT.

Gary Marcus, esperto di intelligenze artificiali particolarmente scettico nei confronti dell’enorme hype registrato ultimamente dalle IA, ha definito questa causa come un momento storico per il settore. O meglio, per un certo modello economico portato avanti da OpenAI e Microsoft. «Le IA non moriranno», ha scritto, «ma Napster è morto»: ciò significa che ci saranno, a suo avviso, nuove IA pensate sin dall’inizio per compensare gli autori dei testi e delle opere usate dai modelli linguistici, ponendo quindi fine al Far West iniziato con l’exploit di ChatGPT.

Non tutti sono d’accordo con Marcus, però, perché il concetto di fair use è abbastanza elastico da poter essere plasmato fino a contenere OpenAI e simili. È un’opinione particolarmente cara nella Silicon Valley, dove sono stati investiti miliardi nel settore, sperando piuttosto espliticamente nella soppressione della questione copyright. A tal proposito, il fondo di investimenti Andreessen Horowitz ha recentemente dichiarato che «imporre il costo vero o potenziale del diritto d’autore sui creatori dei modelli di IA significa uccidere o limitarne seriamente lo sviluppo», ammettendo in qualche modo che le IA post-ChatGPT non sono state pensate per funzionare pagando il diritto d’autore.

Quella del New York Times non è stata la prima causa di questo tipo contro ChatGPT. Quest’anno la comica statunitense Sarah Silverman ha fatto causa a Meta e OpenAI accusandole di aver utilizzato senza permesso il suo materiale, e lo stesso è stato fatto altri artisti e scrittori. A Silverman le cose sono andate male, tanto che il giudice ha definito la sua iniziativa legale «senza senso», visto quanto è complesso dimostrare che il proprio materiale viene sfruttato e utilizzato da questi modelli linguistici. Il New York Times sembra essersi preparato meglio alla battaglia legale, dalla quale potrebbe dipendere un intero settore. Ammesso, ovviamente, che non sia troppo tardi per salvare il diritto d’autore.