Non è la domanda a inseguire una risposta; è la risposta che trepida per incontrare la sua domanda. Kafka ci ha insegnato a vedere le cose in questo modo nei Quaderni in Ottavo: «chi cerca non trova, ma chi non cerca verrà trovato». Le preoccupazioni che gli suggerivano queste conclusioni erano di ordine teologico, ma il suo genio inquieto forse gli aveva lasciato presentire qualcosa che stiamo sperimentando ai nostri giorni con i motori di ricerca di ultima generazione.
Anche Socrate avrebbe concordato sul principio che interrogare è molto più complesso di rispondere. Esiste un’arte per generare la verità somministrando all’interlocutore le domande giuste. Ma nemmeno lui avrebbe immaginato che un giorno qualcuno avrebbe sottoposto a misurazione la qualità delle domande per estrarre un algoritmo di predizione sul nesso che correla quesiti e risposte. L’annuncio fornito dal MIT è disarmante: il segreto per ottenere buone soluzioni sta nel formulare buone domande. Eh già. Per ottenere questo risultato sorprendente Yuan Yao e il suo team allo State Key Laboratory for Novel Software Technology in China hanno lavorato un anno. Monsieur de La Palice ha raggiunto traguardi molto più brillanti con molto meno sforzo.
In realtà la sintesi giornalistica questa volta ha giocato a sfavore della comprensione del tema. L’indagine è stata condotta sul forum di Stack Overflow tra il luglio 2008 e l’agosto 2011, un arco di tempo durante il quale 800 mila utenti hanno postato poco più di due quesiti in media a testa, poco più di quattro soluzioni e oltre sette commenti cadauno. Il sito gode della massima stima presso la comunità internazionale degli sviluppatori, tanto che il co-fondatore Jeff Atwood riferisce che i contenuti delle sue pagine vengono indicizzati dal bot di Google dieci volte al secondo. L’obiettivo dell’indagine è quello di individuare un criterio automatico per eliminare rumore informativo, separando le richieste capaci di arricchire la knowledge base della piattaforma, dal chiacchiericcio di curiosità e di reazioni futili che dilagano nel forum.
L’esigenza che ha animato lo studio del team di Yuan Yao quindi è il passaggio preliminare per assegnare ad un software il compito di rendere lo spazio di discussione per sviluppatori più intelligente. O meglio, per ripulirlo dalla stupidità che gli uomini vi iniettano con il sonno della ragione cui spesso hanno la debolezza di abbandonarsi. Talvolta anche Omero dorme, ammoniva Orazio; ma pare che chi si scontra ogni giorno con grandi moli di dati lamenti una propensione generalizzata all’irrazionalità da parte della componente biologica nell’interazione uomo-macchina. Visto che il software ha sempre svolto in modo intelligente il suo lavoro di valutazione delle risposte, sembra arrivato il momento di incrementare l’efficienza del sistema affidandogli anche il ruolo inquirente. Come il pessimo giornalista, stiamo chiedendo alla macchina di farsi una domanda e di darsi la risposta.
L’insieme dei criteri individuati da Yao può apparire discutibile: più che focalizzarsi sulla formula del quesito si concentrano sul soggetto che la espone. L’algoritmo calcola il valore che l’utente ha guadagnato in termini di reputazione attraverso la carriera di giudizi positivi ricevuti dagli interlocutori (sia in sede di imputazione di domande sia di risposte), il numero di interazioni precedenti, la popolarità delle sue proposte tematiche. Così però si scambia l’artista per l’opera, e si rinuncia ad intercettare il pisolino di Omero, quando gli si abbassano le palpebre. Orazio fin qui resta un detector migliore del software in corso di progetto.
Solo 600 megabyte di informazioni nel DNA umano
Google minaccia di essere un concorrente molto più aggressivo per l’acume del poeta latino. Già nel 2007 l’attuale CEO Larry Page faceva due conti con l’informazione disponibile nel DNA umano e alla conferenza annuale dell’American Association for the Advancement of Science derivava due conclusioni importanti: 1) esistono meno dati nel codice genetico di un uomo di quanti ne compaiano in qualunque sistema operativo in esercizio sui nostri computer portatili; 2) gli algoritmi che processano i pensieri nei nostri cervelli non possono eccedere la quantità di istruzioni disponibili nella doppia elica del DNA. Sia corretta o meno l’inferenza del fondatore, Google ha preso sul serio la missione non solo di riprodurre l’intelligenza umana, ma di correggerla laddove essa ha fallito. E pare succeda spesso.
Bill Slawski ha compiuto una ricognizione dei brevetti che sono confluiti nei comportamenti del motore dopo l’aggiornamento Hummingbird, e ha notato che a partire fin dal gennaio 2012 il software si intromette nell’elaborazione delle domande e delle risposte. Se l’autore della pagina che figura nel listato dei risultati ha ingarbugliato dizionario e sintassi del titolo assegnato al suo contenuto, il software corregge la sua balbuzie linguistica convertendo il tag title in una stringa lessicale più accessibile alla comprensione degli utenti. Google compatisce la debolezza intellettuale di scrittori e lettori, ripulendo la confabulazione cerebrale dei primi e fornendo un materiale addomesticato per i secondi.
Dopo i titoli, Google è passato a mettere mano agli snippet (le tre righe non cliccabili che accompagnano il link nell’elenco dei risultati), ma soprattutto ha ritenuto indispensabile rivedere le query postate dai ricercatori, suggerendo sinonimi o sostituti migliori delle parole chiave imputate dagli utenti. Lo scopo essenziale dell’aggiornamento Hummingbird è perfezionare la qualità delle risposte alle domande – anche correggendo l’incapacità cronica degli utenti di esprimere in modo decente il tema della loro curiosità. Il prelievo massivo di dati personali che Google perpetra nei confronti di tutti, gli permette di conoscere preventivamente dubbi, interrogativi e zone di esplorazione in cui ogni soggetto può rischiare di avventurarsi. Il servizio di Google Now persegue già l’obiettivo di indicarci cosa avrebbe senso richiedere dal motore, data la nostra storia passata e il giro di amicizie che ci ostiniamo a frequentare.
Dimmi qual è il tuo tipo ideale, così potrò ignorarlo
Ma Google non è l’unico a nutrire questa scarsa fiducia nelle nostre risorse intellettuali. Anche secondo Alex Wissner-Gross dalla forza della nostra razionalità non ci si possono attendere più sorprese di quelle che si possono produrre attraverso un’equazione, capace di prevedere il nostro comportamento futuro. Il vertice dello scetticismo non viene però raggiunto nei settori dove l’impegno cerebrale è rivolto alla soluzione di rompicapo scientifici o logici di elevata astrazione; pare che affrontiamo i problemi più insormontabili di giudizio nel momento in cui un form online ci chiede di esprimere le nostre preferenze estetiche nella selezione di un potenziale partner sessuale. Kang Zhao dell’Università dello Iowa si è fatto carico di verificare la congruenza tra le dichiarazioni di preferenza da parte degli utenti dei siti di dating online e le loro effettive adesioni ad appuntamenti per future esperienze sentimentali. L’esito dell’indagine lo ha convinto ad elaborare un algoritmo di valutazione che è stato modellato sullo schema dei suggerimenti di acquisto («potrebbe interessarti anche») disponibili su piattaforme di e-commerce come Amazon o Netflix. A quanto pare stiamo perdendo coscienza dei nostri genitali, ed occorre invocare la consulenza di un software che tracci le nostri azioni reali per sapere se e come si scatenerà una tempesta ormonale. Il sesso sta per essere inglobato nello stesso monitor delle previsioni del tempo.
Il problema di quando si parla di software è che le strategie da cui emergono diventano immediatamente operative sui nostri comportamenti, senza l’intermediazione del dibattito. La delega della curiosità e del desiderio alle piattaforme informatiche somiglia all’abdicazione dagli elementi che qualificano al più alto grado la nostra umanità – la scienza e l’anima. Finiremo per sognare fidanzate elettriche?