Da una parte ci sono centinaia di testi letterari interessanti, dall’altra pochissime persone in grado di leggere e comprendere l’alfabeto in cui sono stati scritti. È una situazione comune in Giappone, in cui le opere in kusushiji, una forma di corsivo utilizzato dal VIII al XX secolo, sono ormai diventate inaccessibili. Non è successo per caso: la spinta modernizzatrice cominciata nella seconda metà del 1800 ha portato a una progressiva cancellazione dell’insegnamento del kuzushiji dalle scuole del Paese con l’obiettivo di riallineare il Giappone (isolato per secoli) ai livelli di sviluppo dell’Occidente. Risultato: gran parte della popolazione adesso è tagliata fuori dalla lettura e dalla comprensione di opere scritte anche solo 150 anni fa.
Non è così grave. Esiste la possibilità di tradurre i testi antichi e, soprattutto c’è uno sparuto ma combattivo esercito di conoscitori, circa 700mila persone, che se ne può occupare. Il problema è che la quantità dei testi è enorme (1,7 milioni di libri pubblicati prima del 1867, più altri tre milioni non registrati dai cataloghi ufficiali e, infine, un miliardo di documenti storici in tutto il Paese) e per di più sono scritti a mano. Mentre tempo e pazienza dei professori sono risorse limitate.
È in questa situazione che si è fatta strada la soluzione del Deep Learning.
Un sistema in grado di trascrivere i caratteri kuzushiji in caratteri kanji (quelli utilizzati in modo corrente nel Giappone odierno) in modo automatico. Il programma, addestrato con testi del XVII e XIX secolo, fa rapidi progressi: all’inizio riusciva a identificare solo un carattere. Dopo poche settimane è arrivato a quota quattromila. L’algoritmo può, adesso, decifrare una pagina di testo in due secondi, con una precisione che gira intorno all’85%.
Non del 100%, chiaro. Perché si tratta pur sempre di una macchina e, soprattutto, perché non sempre i caratteri sono chiari e definiti. Per questa ragione l’interazione uomo-macchina, cioè il necessario contributo degli studiosi ed esperti umani, sarà comunque necessario. Sempre che i giapponesi saranno interessati a conoscere i documenti del loro passato.