Il filologo automatico

Una delle pietre angolari della storia antica è l’epigrafia, cioè la branca dell’archeologia che studia le iscrizioni incise nel bronzo o nel marmo. Come si può trasformare questa scienza usando il computer? Se lo sono chiesti un gruppo di scienziati che è giunta alla conclusione che sarebbe stato un caso perfetto per applicare un sistema di intelligenza artificiale.

Epigrafe
Epigrafe

Brevissima digressione: quel che chiamiamo genericamente “intelligenza artificiale” in questo caso è settoriale e non generale (non esiste al mondo una “intelligenza artificiale generale”) e si basa su tecnologie di machine learning: un particolare algoritmo struttura una rete neurale (un insieme di matrici digitali che simulano la struttura dei neuroni) e vengono addestrate sottoponendo un ampissimo repertorio di dati di un particolare problema, ad esempio il riconoscimento dei volti. Tra le molte istanze della rete neurale quelle che risultano essere più efficienti vengono selezionate e ulteriormente addestrate sino a che non si giunge a un software capace di riconoscere automaticamente ad esempio i volti. Visto in un altro modo, a differenza di un software tradizionale che contiene le regole e a cui vengono sottoposti dei dati di input per arrivare ad emettere un risultato come output, una rete neurale contiene già i risultati e i dati (campioni di volti e indicazioni su quali sono volti o no) e genera come output le regole (i criteri tramite i quali il software riconoscerà i volti). 

Gli scienziati di DeepMind si sono chiesti: perché non provarci anche con le epigrafi? Addestrare una rete neurale a riconoscere le lettere e le parole, ricostruendo quelle parti illeggibili o ambigue che tormentano da secoli generazioni di filologi. L’esperimento è andato avanti per un po’ e ha prodotto Pythia, il primo sistema di recupero dei testi antichi fortemente danneggiati. 

Funziona? In realtà, non molto. C’è tantissimo da imparare. DeepMind è «un team di scienziati, ingegneri, esperti di machine learning e altro ancora, – scrivono gli scienziati sul loro sito – che lavorano insieme per far avanzare lo stato dell’arte dell’intelligenza artificiale. Usiamo le nostre tecnologie per diffondere le scoperte scientifiche e i vantaggi pubblici che ne possono derivare, e collaboriamo con altre persone su sfide critiche, garantendo che la sicurezza e l’etica siano la massima priorità».

I test hanno mostrato un tasso di errore ancora troppo elevato per fare la differenza – uno dei principali problemi è la comprensione del contesto – ma il lavoro procede. Le prossime generazioni di filologi potrebbero avere nel loro arsenale di strumenti anche un sistema automatico capace di rivoluzionare il loro lavoro.