Marco Trombetti

Futuro

Potete aumentare le vostre possibilità di successo identificando, cavalvando e anticipando i macro trend in crescita. Il modo semplice per identificare tali tendenze è vivere nel futuro. Non esiste ancora una macchina del tempo: per sperimentare il futuro, è necessario vivere in un contesto che la maggior parte delle altre persone considererebbe il futuro. Un laboratorio di ricerca, un’impresa innovativa e un gruppo di amici con un forte interesse in comune per la tecnologia sono ottimi esempi.

Comprendere le tendenze è importante, ciò che posso condividere qui è una breve esperienza personale su questo argomento.

L’intelligenza artificiale è affascinante e spaventosa. Il linguaggio umano e in particolare la traduzione sono forse la sfida più difficile per le macchine. Il linguaggio naturale è un canale di comunicazione molto compresso, denso di significato, che per essere compreso necessita di informazioni contestuali che vanno al di là del testo in sé. La lingua è la sfida più grande per le macchine perché è la cosa più umana che esista. Per questo i sistemi di traduzione automatica stanno progredendo lentamente; tuttavia, è innegabile che stiano compiendo passi avanti.

In Translated, il servizio di traduzione che ho fondato, negli ultimi 15 anni abbiamo applicato l’intelligenza artificiale per aiutare i traduttori professionisti a tradurre meglio e più velocemente. Abbiamo cercato di creare una simbiosi tra uomo e macchina. L’abbiamo fatto in molti modi, tra cui uno molto importante è la fornitura di suggerimenti (pre-traduzioni) per ogni frase. Abbiamo sviluppato un tool di traduzione per i traduttori professionisti che integra tutto il materiale professionalmente tradotto presente sul web e AI in grado di predire le frasi mai viste. Questa è la base del nostro prodotto open source, chiamato Matecat.

Altri hanno provato approcci più disruptive: sostituire i traduttori professionisti con tecnologie di traduzione end-to-end. L’esempio più lampante è Google Translate.

Aiutando i traduttori professionisti siamo stati esposti ad un’opportunità unica: misurare il progresso dell’AI nell’arco di molti anni.

Abbiamo misurato quanto i professionisti correggono i suggerimenti forniti dall’AI, lo abbiamo fatto giorno per giorno, mese per mese e anno per anno.

Nel lontano 2003, con il prezioso aiuto economico della Commissione Europea, conducemmo una ricerca in cui, traducendo qualche centinaia di migliaia di parole, misurammo un tasso di correzione (post-editing effort1) del 43% circa per Inglese > Italiano e Inglese > Francese. Nel 2015, per le stesse combinazioni linguistiche, il tasso di correzione è stato del 27%. Questa volta abbiamo usato un campione di 50 milioni di parole tradotte in Matecat. Stimiamo che nel 2018, grazie all’applicazione di MMT, che è capace di adattarsi all’utente, e della neural machine translation arriveremo a un livello di correzione tra il 22% e il 26%.

Il miglioramento è stato inarrestabile e continuo, con qualche piccolo rallentamento e accelerazione dovuti, rispettivamente, al raggiungimento del pieno potenziale di una tecnologia e all’introduzione di una nuova. Ci sono stati due grandi cambiamenti: la traduzione statistica, introdotta in produzione nel 2006 e il deep learning entrata in produzione alla fine del 2016.

Continuando di questo passo, quando arriveremo a un punto in cui non ci sarà più bisogno di correggere le traduzioni realizzate da una macchina?

Se consideriamo i soli dati, sembra che questo possa avvenire tra il 2030 e 2035.

Tuttavia, c’è un altro dato interessante che spesso dimentichiamo: gli esseri umani non sono perfetti.

Quando abbiamo analizzato 20 milioni di parole di suggerimenti provenienti da traduttori umani (definite “match del 100%”), abbiamo osservato che una proposta fornita da un altro essere umano registra in media un tasso di correzione dell’11% e non dello 0%. Questo avviene sia perché errare humanum est, sia perché ognuno di noi ha uno stile unico che vuole promuovere. Quando parliamo di singolarità, dobbiamo quindi ricordarci di definire qual è il benchmark: la perfezione assoluta? Il migliore traduttore al mondo? O semplicemente il traduttore professionista medio?

Se ci accontentiamo di una macchina in grado di tradurre meglio del traduttore professionista medio, il 2025 potrebbe essere una data più plausibile in cui raggiungeremo un tasso di correzione dell’11% in queste combinazioni linguistiche. Per me è spaventosamente vicina.

Mi sto chiedendo se vendere subito Translated al milgior acquirente, perché il mercato della traduzione professionale si ridurrà significativamente, oppure se provare a cavalcare il cambiamento per cogliere un’opportunità ancora maggiore. In fondo le persone avranno bisogno di più traduzioni, non di meno. Mi sento un po’ la Kodak tra il passaggio dalla pellicola al digitale.

Il fatto che io ne sia consapevole è già qualcosa, per questo ho già deciso: andiamo a cavallo! È probabile che in ogni settore l’intelligenza artificiale giocherà un ruolo fondamentale. Se la lingua è la cosa più difficile per le macchine è possibile che in molte altre aree la disruption avvenga anche prima, il che rappresenta un’eccellente opportunità per fare nuove startup.

1Post Editing Effort: per misurare il tasso di correzione usiamo un algoritmo simile al Fuzzy Match tipico dell’industria della traduzione. Un Edit Distance Word-Level con alcuni aggiustamenti per tenere conto di errori di punteggiatura, il casing (uso delle maiuscole) e formattazione.