orientalia
17 Luglio Lug 2019 0600 17 luglio 2019

I giapponesi hanno cambiato sistema di scrittura e non capiscono più i vecchi documenti. Li salverà un algoritmo?

Il sistema corsivo Kuzushiji non è più insegnato da decenni nelle scuole del Sol Levante: risultato, pochissimi riescono a leggere opere e scritti precedenti al 1868. Forse un software di Deep Learning potrebbe risolvere il problema

変体いろは47字 1
da Wikimedia

Da una parte ci sono centinaia di testi letterari interessanti, dall’altra pochissime persone in grado di leggere e comprendere l’alfabeto in cui sono stati scritti. È una situazione comune in Giappone, in cui le opere in kusushiji, una forma di corsivo utilizzato dal VIII al XX secolo, sono ormai diventate inaccessibili. Non è successo per caso: la spinta modernizzatrice cominciata nella seconda metà del 1800 ha portato a una progressiva cancellazione dell’insegnamento del kuzushiji dalle scuole del Paese con l’obiettivo di riallineare il Giappone (isolato per secoli) ai livelli di sviluppo dell’Occidente. Risultato: gran parte della popolazione adesso è tagliata fuori dalla lettura e dalla comprensione di opere scritte anche solo 150 anni fa.

Non è così grave. Esiste la possibilità di tradurre i testi antichi e, soprattutto c’è uno sparuto ma combattivo esercito di conoscitori, circa 700mila persone, che se ne può occupare. Il problema è che la quantità dei testi è enorme (1,7 milioni di libri pubblicati prima del 1867, più altri tre milioni non registrati dai cataloghi ufficiali e, infine, un miliardo di documenti storici in tutto il Paese) e per di più sono scritti a mano. Mentre tempo e pazienza dei professori sono risorse limitate.

È in questa situazione che si è fatta strada la soluzione del Deep Learning.

Un sistema in grado di trascrivere i caratteri kuzushiji in caratteri kanji (quelli utilizzati in modo corrente nel Giappone odierno) in modo automatico. Il programma, addestrato con testi del XVII e XIX secolo, fa rapidi progressi: all’inizio riusciva a identificare solo un carattere. Dopo poche settimane è arrivato a quota quattromila. L’algoritmo può, adesso, decifrare una pagina di testo in due secondi, con una precisione che gira intorno all’85%.

Non del 100%, chiaro. Perché si tratta pur sempre di una macchina e, soprattutto, perché non sempre i caratteri sono chiari e definiti. Per questa ragione l’interazione uomo-macchina, cioè il necessario contributo degli studiosi ed esperti umani, sarà comunque necessario. Sempre che i giapponesi saranno interessati a conoscere i documenti del loro passato.

Potrebbe interessarti anche
 Iscriviti alla newsletter

Vuoi essere sempre aggiornato? Iscriviti alla newsletter de Linkiesta.it .

Quando invii il modulo, controlla la tua inbox per confermare l'iscrizione

 Seguici su Facebook