
Chi si è cimentato almeno una volta con uno dei modelli linguistici di intelligenza artificiale avrà notato che gli errori marchiani sono piuttosto frequenti. Un po’ troppo, verrebbe da dire, per tecnologie così avanzate. ChatGpt di OpenAI è in grado di leggere testi lunghissimi in pochi secondi, scrivere tesi difficili, analizzare grandi quantità di dati complessi; i sistemi che producono immagini e video realizzano contenuti incredibilmente verosimili. Solo che puntualmente nei loro lavori si individuano facilmente delle sviste grossolane, magari dati inventati, nomi sbagliati, riferimenti a fatti o persone avulse dal resto della storia.
Questi errori sono diventati così caratteristici da avere già un nome. Sono comunemente chiamati allucinazioni. Nulla di simile con le allucinazioni che può avere un essere umano: i modelli di linguaggio non vedono e non sentono, non percepiscono nulla, non immaginano nulla. Per questo il mondo accademico preferisce dare un altro nome agli errori di ChatGpt e simili: «Non essendoci una mente umana, non essendoci pensiero, ma solo assemblaggio di parole e testi, parlare di allucinazione rischia di essere fuorviante», dice a Linkiesta Walter Quattrociocchi, direttore del Center for Data science and complexity.
Questi sistemi funzionano con algoritmi statistici che prevedono la parola successiva più probabile sulla base di grandi quantità di dati testuali. In sostanza, generano frasi costruendo sequenze di parole che, dopo un calcolo statistico, dovrebbero risultare coerenti.
È quindi un approccio probabilistico e può portare a inesattezze banali o a invenzioni di eventi e citazioni. «Gli errori dei chatbot hanno già prodotto errori costosi e problemi legali», scriveva martedì il Financial Times. Un esempio su tutti: l’anno scorso un tribunale ha imposto alla compagnia aerea Air Canada di onorare con i propri clienti uno sconto inventato dal suo chatbot.
Gli errori frequenti dell’intelligenza artificiale sono strutturali, cioè non possono essere annullati o azzerati. Non è questione di tempo o di perfezionamento del meccanismo. Perché sono una conseguenza dell’architettura stessa dell’intelligenza artificiale.
I modelli di linguaggio sono addestrati su enormi quantità di testi da cui replicano correlazioni tra parole, frasi e strutture linguistiche. Ma questa capacità dipende dalla precisione, dalla quantità e dalla qualità dei dati che alimentano la macchina. «Quella che chiamiamo allucinazione in realtà è un effetto fisiologico», dice ancora Quattrociocchi. «Un Large Language Model, LLM, ottimizza la coerenza statistica delle parole, non cerca la verità, perché ovviamente non sa cosa sia la verità. Allora l’errore di fondo sta in come viene raccontata questa tecnologia, viene chiamata intelligenza, ma non è corretto, stiamo semplicemente imparando a sfruttare la codifica del linguaggio, priva di cognizione di causa o di spirito critico».
Diverse grandi aziende, tra cui Google, Amazon, Cohere, Mistral e OpenAI, stanno investendo molto per ridurre le allucinazioni, sapendo che eliminarle del tutto è impossibile. Uno dei metodi usati è il cosiddetto grounding. Invece di basarsi solo sul training, il chatbot accede a fonti esterne verificate, come database interni, articoli di giornale o motori di ricerca aggiornati. Questo metodo, noto anche come Retrieval-Augmented Generation (Rag), permette di confrontare e integrare l’output con dati reali, riducendo gli errori. Mistral, ad esempio, ha stretto accordi con agenzie di stampa per includere articoli aggiornati nei loro modelli di linguaggio. Altri hanno aggiunto dei “modelli valutatori” più piccoli e specializzati, che seguono passo passo i ragionamenti dell’intelligenza artificiale e ne controllano la correttezza delle risposte prodotte – una specie di autenticazione a due fattori. Ma neanche questi sistemi permettono di azzerare l’errore.
Aziende, dipendenti e professionisti già usano bot di intelligenza artificiale per una gamma sempre più ampia di attività. Ma non esiste ancora alcun modo per garantire che questi sistemi producano solo informazioni accurate. Secondo il New York Times, le tecnologie più recenti e potenti – le piattaforme di aziende come OpenAI, Google e la cinese DeepSeek – stanno generando più errori, non meno. «Con il notevole miglioramento delle loro competenze matematiche, la loro comprensione dei fatti è diventata più incerta. Non è del tutto chiaro il perché».
Un maggior uso di modelli di linguaggio rischia di portare una diffusione maggiore di disinformazione, più o meno consapevole. Soprattutto in caso di maggior automazione – quindi un affidamento sempre più “cieco” a chatbot, generatori di immagini e di altri sistemi simili – il rischio è quello di non riuscire a distinguere i loro errori tipici che oggi appaiono macroscopici e in futuro potrebbero diventare impercettibili. «I chatbot possono ancora assomigliare a sofisticate macchine per la disinformazione, con diverse piattaforme che sputano risposte diametralmente opposte alle stesse domande, spesso ripetendo a pappagallo il pensiero di gruppo convenzionale e semplificazioni eccessive errate anziché cogliere la verità», ha scritto il Time la settimana scorsa, qualche giorno dopo il temporaneo impazzimento di Grok.
Il giorno dopo la pubblicazione dell’articolo del Time, Sam Altman, il fondatore di OpenAI, in un post su X aveva annunciato il lancio della nuova funzione di ChatGpt, Agent, una specie di assistente personale virtuale. In coda al suo post aveva suggerito di non darle troppe informazioni personali: potrebbe essere pericoloso, dice Altman (si può leggere l’articolo di Guia Soncini per tutte le considerazioni sul fatto che l’umanità è del tutto impreparata alle conseguenze dell’intelligenza artificiale).
«La scommessa su quella che chiamiamo impropriamente intelligenza artificiale è costruita sul fatto che, prima o poi, delegheremo tutti i compiti automatizzabili», dice Quattrociocchi. «Allora avremo un assistente virtuale che prende appuntamento dal parrucchiere, compra i biglietti del treno, gestisce il customer care, cose di questo tipo. Il problema è che da Altman in giù tutti sanno che la tecnologia ha limiti strutturali, ma costruisce una narrazione ottimistica secondo cui, prima o poi, diventerà davvero “intelligente”, per giunta anche in una dicotomia bene-male in cui la tecnologia può sembrare una minaccia ma loro lo sanno da tempo e quindi possono essere la soluzione. E così attirano investitori e attenzione pubblica».
In molti settori, i modelli di linguaggio hanno già cambiato abitudini e metodi di lavoro grazie alla loro capacità di produrre testi coerenti, risposte rapide e assistenza decisionale in tempo reale. Ma la sfida per il futuro sarà quindi trovare l’equilibrio tra accuratezza e creatività, affidabilità e innovazione, con la consapevolezza che la perfezione assoluta in un modello linguistico è un traguardo irraggiungibile, inesistente. L’intelligenza artificiale non sarà mai un’intelligenza, al massimo può essere uno strumento di supporto, necessariamente corretto da verifiche umane, capacità di discernimento e senso critico. Smettere di chiamarla “intelligenza” potrebbe essere un buon primo passo.