Da una parte ci sono centinaia di testi letterari interessanti, dall’altra pochissime persone in grado di leggere e comprendere l’alfabeto in cui sono stati scritti. È una situazione comune in Giappone, in cui le opere in kusushiji, una forma di corsivo utilizzato dal VIII al XX secolo, sono ormai diventate inaccessibili. Non è successo per caso: la spinta modernizzatrice cominciata nella seconda metà del 1800 ha portato a una progressiva cancellazione dell’insegnamento del kuzushiji dalle scuole del Paese con l’obiettivo di riallineare il Giappone (isolato per secoli) ai livelli di sviluppo dell’Occidente. Risultato: gran parte della popolazione adesso è tagliata fuori dalla lettura e dalla comprensione di opere scritte anche solo 150 anni fa.

Non è così grave. Esiste la possibilità di tradurre i testi antichi e, soprattutto c’è uno sparuto ma combattivo esercito di conoscitori, circa 700mila persone, che se ne può occupare. Il problema è che la quantità dei testi è enorme (1,7 milioni di libri pubblicati prima del 1867, più altri tre milioni non registrati dai cataloghi ufficiali e, infine, un miliardo di documenti storici in tutto il Paese) e per di più sono scritti a mano. Mentre tempo e pazienza dei professori sono risorse limitate.

È in questa situazione che si è fatta strada la soluzione del Deep Learning.