Circuito chiusoL’intelligenza artificiale ha già iniziato a progettare sé stessa

Per secoli il progresso tecnologico è stato interamente guidato dagli esseri umani. Oggi Claude scrive gran parte del codice utilizzato da Anthropic e sistemi sempre più avanzati contribuiscono allo sviluppo dei loro successori. È il primo assaggio di quello che i ricercatori chiamano miglioramento ricorsivo

Unsplash

Pochi giorni fa Anthropic ha pubblicato sul suo sito un articolo intitolato “When AI Builds Itself”, quando l’intelligenza artificiale si costruisce da sola. Il punto di partenza è un’osservazione semplice: abbiamo sempre considerato l’intelligenza artificiale come ogni altra innovazione tecnologica, in cui ogni ogni nuovo modello viene progettato, testato e rilasciato da esseri umani. Ci sono ingegneri per scrivere i codici, ricercatori per fare gli esperimenti, e tecnici a supervisionare l’addestramento. Ma questa dinamica sta scomparendo. Secondo l’azienda di Dario Amodei, oltre l’ottanta per cento dei codici che entrano nei suoi sistemi vengono ormai scritti da Claude, il chatbot che sviluppa e commercializza. Perché una quota crescente dell’attività quotidiana è già delegata alle macchine. Il risultato, sostiene Anthropic, è un’accelerazione impressionante della produttività: nel secondo trimestre del 2026 un ingegnere medio avrebbe prodotto circa otto volte più codice rispetto al 2024.

Insomma, l’intelligenza artificiale stia iniziando a contribuire direttamente allo sviluppo della generazione successiva di sistemi di intelligenza artificiale. «Non siamo ancora nel mondo in cui Claude progetta autonomamente il proprio successore», scrivono gli autori, ma ci stiamo lentamente avvicinando a una situazione in cui una parte crescente della ricerca sull’IA viene svolta dall’IA stessa (i numeri vanno presi con cautela, perché sono dati interni, quindi difficili da verificare dall’esterno, ma il concetto di fondo resta).

Nel lessico del settore questa nuova condizione si chiama recursive self-improvement, miglioramento ricorsivo. Una prima versione di un sistema contribuisce a sviluppare una seconda versione, leggermente migliore. La seconda contribuisce alla nascita della terza. La terza della quarta. E così via, in un processo che potrebbe accelerare progressivamente.

Pochi giorni dopo la pubblicazione dell’articolo di Anthropic ne ha parlato anche l’Economist: «Nessuno sa davvero quali potrebbero essere le conseguenze del miglioramento ricorsivo», scrive il magazine britannico, «e poiché l’intelligenza artificiale, a differenza degli esseri umani, può lavorare senza sosta e su scala enorme, alcuni ricercatori ritengono che potrebbe innescare una rapida corsa verso sistemi superintelligenti. I più pessimisti temono che una superintelligenza possa sfuggire al controllo umano e che l’avvio di un processo di recursive self-improvement rappresenti il momento in cui il destino tecnologico dell’umanità passa dalle mani degli esseri umani a quelle delle macchine. Altri osservano però che, almeno inizialmente, anche un sistema capace di migliorarsi da solo dovrebbe fare i conti con limiti molto concreti: la disponibilità di potenza di calcolo, di energia e di infrastrutture».

Se la prospettiva di sistemi capaci di progettare da soli il proprio successore è ancora lontana e speculativa, la vera novità è l’idea di un circuito chiuso, almeno in parte. Allo stato attuale sono ancora gli umani a svolgere il ruolo di direttori di laboratorio quando si tratta di creare codici dell’intelligenza artificiale. Sono loro a indicare la direzione di ricerca e a inquadrare i problemi, e ovviamente gli obiettivi sono tutti decisi dall’uomo. Gli agenti di intelligenza artificiale si limitano a fare da manovalanza, se così si può dire, cioè progettano gli esperimenti, scrivono il codice, fanno i test, correggono gli errori e così via. Più semplicemente, l’intelligenza artificiale è ancora uno strumento.

Ancora per poco, forse. Perché almeno nei laboratori che costruiscono i modelli più avanzati, l’intelligenza artificiale sta assumendo quel ruolo di direttore del laboratorio. L’Economist cita il caso di Andrej Karpathy, uno dei ricercatori più influenti dell’ultimo decennio, già tra i fondatori di OpenAI e poi responsabile dell’intelligenza artificiale di Tesla. Dopo aver sviluppato un piccolo modello linguistico chiamato Nanochat, Karpathy ha affidato a un agente di IA il compito di migliorarne il processo di addestramento. Nel giro di pochi giorni il sistema ha individuato una serie di ottimizzazioni che hanno ridotto ulteriormente i tempi necessari per addestrare il modello. «Io non ho toccato nulla», ha raccontato Karpathy. È esattamente il tipo di miglioramento incrementale di cui parla Anthropic.

Il dettaglio tecnico più rilevante è che non serve una macchina potentissima e onnisciente per accelerare il processo, ne basta una capace di produrre la prossima generazione di macchine.

Qui rientra in gioco Anthropic, l’azienda di Dario Amodei che più di ogni altra ha costruito la propria identità pubblica attorno ai rischi dell’intelligenza artificiale. Fin dalla sua fondazione, i dirigenti di Anthropic parlano della necessità di coordinare gli sforzi internazionali e, se necessario, persino di rallentare la corsa verso modelli sempre più potenti. Lo stesso articolo sul recursive self-improvement si conclude con un appello alla costruzione di meccanismi che rendano possibile una pausa coordinata nello sviluppo dell’IA, qualora si rendesse necessaria.

È una posizione quantomeno ambigua. Nel senso che Anthropic è anche una delle aziende che stanno spingendo più velocemente la frontiera tecnologica. Per citare ancora l’Economist, «quale leader di mercato non sarebbe felice di vedere i concorrenti rallentare mentre cerca di mantenere il proprio vantaggio?».

Anthropic sembra sinceramente convinta che l’intelligenza artificiale possa diventare una tecnologia trasformativa e potenzialmente pericolosa. Ma proprio per questo ritiene di dover restare tra gli attori che la sviluppano. È un comportamento da santoni, o da ipocriti, o qualcosa in mezzo a queste due opzioni.

Non tutti sono convinti che affidare una quota crescente della ricerca alle macchine equivalga necessariamente a produrre sistemi migliori. Un commento pubblicato ad aprile sul Washington Examiner, proponeva un punto di vista interessante. «Questo non è automiglioramento, è auto-rafforzamento», scrive l’autrice. L’obiezione è che sistemi addestrati da altri sistemi potrebbero diventare sempre più autoreferenziali, con il rischio di perdere il contatto con la realtà.

È quello che nell’ambiente viene chiamato specification gaming. Quando si assegna a un sistema un obiettivo misurabile, il sistema tende a ottimizzare la metrica scelta, non necessariamente il risultato prospettato inizialmente. L’esempio tipico è quello della corsa virtuale: se si vuole insegnare a un agente a correre lungo un tracciato si assegnano punti per ogni checkpoint, ma a un certo punto l’agente scopre che può girare in tondo su un checkpoint e accumulare punti all’infinito senza completare la gara. Perché sta massimizzando il punteggio anziché guardare l’obiettivo finale. È il motivo per cui molti ricercatori continuano a considerare il giudizio umano – Anthropic lo chiama research taste – l’ultimo vero argine.

Resta aperta una questione più ampia sul futuro dell’intelligenza artificiale come driver di innovazione. Perché la tecnologia è sempre stata intesa come quella cosa che amplificava le capacità umane – ma il suo sviluppo dipendeva sempre dagli esseri umani. L’intelligenza artificiale potrebbe essere la prima tecnologia capace di contribuire direttamente alla propria evoluzione. Non siamo ancora nel mondo della superintelligenza che popola tante discussioni futuristiche. Ma il circuito, almeno in parte, si è già chiuso. L’intelligenza artificiale sta iniziando a costruire l’intelligenza artificiale. Lo scorso febbraio il blogger Noah Smith ha spiegato così la posta in gioco: «Per la prima volta nella storia, gli esseri umani non sono più – o presto non saranno più – gli esseri più intelligenti del pianeta, in alcun senso funzionale del termine». Va letta come provocazione, ma siamo già al punto in cui il motore del progresso tecnologico non più un’esclusiva dell’uomo. Qualcosa vorrà dire.

X