OrientaliaI giapponesi hanno cambiato sistema di scrittura e non capiscono più i vecchi documenti. Li salverà un algoritmo?

Il sistema corsivo Kuzushiji non è più insegnato da decenni nelle scuole del Sol Levante: risultato, pochissimi riescono a leggere opere e scritti precedenti al 1868. Forse un software di Deep Learning potrebbe risolvere il problema

da Wikimedia

Da una parte ci sono centinaia di testi letterari interessanti, dall’altra pochissime persone in grado di leggere e comprendere l’alfabeto in cui sono stati scritti. È una situazione comune in Giappone, in cui le opere in kusushiji, una forma di corsivo utilizzato dal VIII al XX secolo, sono ormai diventate inaccessibili. Non è successo per caso: la spinta modernizzatrice cominciata nella seconda metà del 1800 ha portato a una progressiva cancellazione dell’insegnamento del kuzushiji dalle scuole del Paese con l’obiettivo di riallineare il Giappone (isolato per secoli) ai livelli di sviluppo dell’Occidente. Risultato: gran parte della popolazione adesso è tagliata fuori dalla lettura e dalla comprensione di opere scritte anche solo 150 anni fa.

Non è così grave. Esiste la possibilità di tradurre i testi antichi e, soprattutto c’è uno sparuto ma combattivo esercito di conoscitori, circa 700mila persone, che se ne può occupare. Il problema è che la quantità dei testi è enorme (1,7 milioni di libri pubblicati prima del 1867, più altri tre milioni non registrati dai cataloghi ufficiali e, infine, un miliardo di documenti storici in tutto il Paese) e per di più sono scritti a mano. Mentre tempo e pazienza dei professori sono risorse limitate.

È in questa situazione che si è fatta strada la soluzione del Deep Learning.

 https://www.youtube.com/embed/ci3d_hMj5y8/?rel=0&enablejsapi=1&autoplay=0&hl=it-IT 

Un sistema in grado di trascrivere i caratteri kuzushiji in caratteri kanji (quelli utilizzati in modo corrente nel Giappone odierno) in modo automatico. Il programma, addestrato con testi del XVII e XIX secolo, fa rapidi progressi: all’inizio riusciva a identificare solo un carattere. Dopo poche settimane è arrivato a quota quattromila. L’algoritmo può, adesso, decifrare una pagina di testo in due secondi, con una precisione che gira intorno all’85%.

Non del 100%, chiaro. Perché si tratta pur sempre di una macchina e, soprattutto, perché non sempre i caratteri sono chiari e definiti. Per questa ragione l’interazione uomo-macchina, cioè il necessario contributo degli studiosi ed esperti umani, sarà comunque necessario. Sempre che i giapponesi saranno interessati a conoscere i documenti del loro passato.