Percorso: "Rappresentazione e analisi del testo e dei documenti" UNITA' 10 - Strumenti di traduzione automatica e loro uso didattico La traduzione automatica ieri e oggi La traduzione automatica (MT = machine translation) è una tecnologia che ha fatto passi da gigante negli ultimi anni, anche se è stata uno dei principali campi di interesse dell'intelligenza artificiale fin dalla nascita di questa disciplina, circa 50 anni fa. In generale, la MT non raggiunge la qualità di una buona traduzione professionale, ma è diventata una seria concorrente dei traduttori umani. Questi ultimi, per raggiungere un livello di produttività che gli consenta di restare sul mercato, sono costretti a usare strumenti di aiuto (CAT = computer assisted translation) che a loro volta fanno un uso rilevante dei servizi di traduzione automatica. Sul possibile uso didattico della traduttori automatici si è cominciato a ragionare da diversi anni. Tuttavia, 10-15 anni fa era prevalente la preoccupazione dei docenti per un loro "uso improprio", in pratica per copiare e così aggirare le verifiche di competenza [6]. Attualmente, anche sulla base dell'esperienza, si è più propensi a valutare in modo equilibrato i casi in cui l'uso di un traduttore automatico può aiutare a migliorare le competenze di un traduttore, come effetto collaterale, o addirittura fornire al discente l'occasione per un primo livello di apprendimento. Infine, si deve notare che ad un certo punto qualcuno si è chiesto se, considerati i grandi progressi già fatti dalla MT negli ultimi dieci anni, e quelli prevedibili per il prossimo futuro, valga veramente la pena di dedicare tante energie e tanti investimenti all'apprendimento delle lingue straniere (dell'Inglese in particolare) [11]. I principali traduttori automatici La maggior parte dei sistemi di traduzione automatica sono accessibili in due modalità: online, attraverso interfaccia web interattiva, e tramite API web che possono essere invocate su Internet sia da applicazioni CAT personali sia da servizi erogati su cloud. Di solito la traduzione interattiva, frase per frase è libera e gratis. La traduzione di frasi o interi documenti richiesta direttamente tramite API web, o con l'intermediazione di una qualche applicazione, di regola è a pagamento, ma i costi ultimamente sono calati fortemente. I principali traduttori automatici si distinguono per la qualità media della traduzione e per il numero di coppie linguistiche che sono in grado di gestire. Da tempo i traduttori di Google e di Microsoft sono in grado di effettuare traduzioni tra coppie linguistiche a partire da oltre 100 lingue; tuttavia per alcune tra le lingue meno diffuse è disponibile solo la traduzione da o per l'Inglese: la traduzione verso altre lingue passa attraverso la traduzione da o per l'Inglese. Google Traduttore (Google Translator) Probabilmente è il traduttore più noto, oltre che uno di quelli disponibili da più tempo. L'interfaccia web della pagina di traduzione interattiva, non elegante ma funzionale, è divisa verticalmente in due sezioni, una per il testo sorgente e una per la traduzione. Oltre a scegliere la lingua destinazione, si può impostare la scelta della lingua sorgente, ma c'è anche una funzione di riconoscimento automatico. E' inoltre possibile scambiare le due lingue per invertire la direzione della traduzione. C'un bottone per chiedere l'esecuzione o la riesecuzione della traduzione. Viene mostrata una sola traduzione, ma è possibile avere un elenco di traduzioni alternative e anche suggerirne una migliore. Tra le caratteristiche più interessanti: la possibilità di avere su schermo una tastiera virtuale, particolarmente utile per lingue che usano un alfabeto diverso da quello latino, o comunque un diverso script di base; la possibilità di sentire la pronuncia (non sempre impeccabile) delle frasi originale e tradotta. Bing Microsoft Translator Bing Translator è comparabile a Google Translator sia per la funzionalità che per la qualità della traduzione. In alcune aree tematiche è migliore, in altre peggiore. Viene mostrata una sola traduzione. Forse il numero di coppie linguistiche supportate è leggermente inferiore. Per alcune lingue la pronuncia sembra migliore. DeepL Translator DeepL Translator si distingue per una qualità molto alta delle traduzioni, che per l'Inglese e lo Spagnolo, per esempio, a parere di molti supera quella di Google Translator. Probabilmente traduce con uno stile un po' più spigliato e meno tradizionale. Tuttavia il risultato del confronto può variare di molto cambiando genere e dominio applicativo; per esempio nel campo tecnico-informatico Google sembra preferibile. Tra le caratteristiche più interessanti: la velocita; DeepL è molto reattivo: quando si è in modalità interattiva, DeepL traduce in tempo reale, a mano a mano che viene digitato il testo originale, senza attendere un comando esplicito; sempre in tempo reale DeepL mostra eventuali traduzioni alternative ed è in grado di utilizzare i suggerimenti umani: riconfigura quasi istantaneamente la lista delle possibili traduzioni, analogamente a come fa GoogleMaps, nella modalità "directions", quando l'utente forza il percorso a passare per un certo punto della mappa. MyMemory MyMemory è una piattaforma su cloud che fornisce un servizio di "translation memory" (TM), gestita dalla società italiana "Translated.net" e inizialmente sviluppata all'interno di un progetto Europeo di ricerca collaborativa. Una memoria di traduzione (TM) è un database che memorizza "segmenti", che possono consistere in frasi, paragrafi o unità simili (intestazioni, titoli, elementi di un elenco, ecc.), che sono stati tradotti in precedenza, al fine di aiutare un traduttore umano [Wikipedia]. Probabilmente MyMemory include la più estesa memoria di traduzione accessibile pubblicamente. Inoltre gestisce a pagamento memorie di traduzione private; richiede un abbonamento anche l'accesso da programma con API web. E' gratis il servizio di interrogazione interattivo con interfaccia web, che di solito riporta molte traduzioni alternative: del testo in ingresso e/o di testi simili. Inoltre consente all'utente di suggerire nuove traduzioni. MyMemory non è un motore di traduzione automatica ma, accedendo a sua volta ad un insieme di traduttori come Google Translate, quando la si interroga digitando una frase in input riporta non solo le traduzioni presenti nella memoria di traduzione, ma anche altre ottenute da traduzione automatica. Sia in modalità interattiva, sia quando si accede tramite API, MyMemory riporta un insieme di metadati per ogni traduzione alternativa: tipo di fonte, fonte, grado di attendibilità, ecc. Per le sue caratteristiche, quindi, MyMemory è usata prevalentemente da traduttori professionali, soprattutto all'interno di sistemi CAT. Modalità di uso dei traduttori automatici Un traduttore automatico può essere usato in svariati modi, tra cui: - per mezzo di un plugin (estensione) del browser web, allo scopo di ottenere la traduzione in una lingua target di un'intera pagina web o di una sua porzione - interattivamente per tradurre un documento, passando attraverso le fasi di upload (caricamento da locale) del documento originale, traduzione remota, download (scaricamento in locale) del documento tradotto - interattivamente per tradurre una frase o un breve testo - per tramite di uno strumento CAT in grado di interrogarlo attraverso le sue API - per mezzo di un qualsiasi linguaggio di programmazione in grado di consentirne l'interrogazione attraverso le API (Python, Java, PHP, ...); in questo modo è anche possibile chiedere la traduzione di molte frasi o di testi lunghi. Nei primi due casi, ovviamente, il traduttore automatico deve anche essere in grado di gestire il formato del documento (HTML, PDF, .docx, ecc.). Molto spesso, inoltre, quando si digita una frase nella propria lingua, o in una lingua comune come l'Inglese, in un motore di ricerca, questo interpreta la ricerca come una implicita richiesta di traduzione, anche sulla base del profilo che si è costruito dell'utente stesso. Uso non convenzionale dei traduttori automatici Come già visto, un traduttore automatico può essere usato per dare una scorsa alla traduzione nella propria lingua di una pagina web in una lingua straniera, anche in una lingua del tutto ignota. Quando però si posseggono i rudimenti della lingua straniera, è possibile farsi tradurre "in place" (nel contesto), selettivamente, una singola frase; come è anche possibile immettere la frase in lingua straniera nell'interfaccia interattiva a doppio pannello del traduttore automatico. Le operazioni inverse si possono compiere per abbozzare una traduzione dalla lingua nativa ad una lingua straniera. In tutti i casi di cui sopra, un utente più o meno consapevolmente e/o volutamente, modifica la propria competenza nella lingua straniera. Se in meglio o in peggio dipende da un insieme di fattori, ma di solito l'utente ha la possibilità di fare qualche verifica per saggiare l'attendibilità del traduttore automatico nel singolo caso o più in generale. Per esempio, se fa tradurre la frase F1 dalla lingua L1 alla lingua L2 dal traduttore A, ottenendo la traduzione F2, può chiedere al traduttore B di tradurre F2 in senso inverso e confrontare il risultato con F1. Se l'utente ha una pur scarsa conoscenza di L2, probabilmente si accorgerà se almeno una delle due traduzioni è incorsa in qualche errore grossolano e potrà poi cercare di approfondire. Altro caso; supponiamo che, per mezzo di un programma ad hoc o di uno strumento CAT commerciale, l'utente si faccia tradurre 1000 segmenti, sia da Google Translator che da DeepL, dall'Italiano allo Spagnolo o all'Inglese; o 1000 frasi dall'Italiano all'Arabo, sia da Google Translate che da Microsoft Translator; nei casi in cui le traduzioni della stesso segmento sono (quasi) uguali, l'utente potrebbe prendere per buona una delle due, evitando di spenderci altro tempo, lui stesso o un traduttore terzo. Uno si potrebbe chiedere: ma che cosa c'entra questo con l'apprendimento delle lingue? Basta provare: se avete una qualche conoscenza della lingua destinazione, e scorrete a vista le coppie di segmenti originale-tradotto per individuare quelle con una buona concordanza tra i due traduttori automatici, probabilmente vi resterà qualcosa di utile in testa. ACRONIMI CAT - computer assisted translation = traduzione assistita dal computer MT - machine translation = traduzione automatica TM - translation memory = memoria di traduzione RIFERIMENTI (webography) [1] Google Translate, https://translate.google.com/ [2] Bing Translator (Microsoft https://www.bing.com/translator [3] DeepL Translator, https://www.deepl.com/translator [4] MyMemory, https://mymemory.translated.net/ [6] Harold Somers et al., Detecting inappropriate use of free online machine translation by language students, 2006, https://www.researchgate.net/publication/228353067_Detecting_inappropriate_use_of_free_online_machine_translation_by_language_students-A_special_case_of_plagiarism_detection [7] Harold Somers, Does Machine Translation have a role in language learning?, 2004, https://personalpages.manchester.ac.uk/staff/harold.somers/Untele.ppt [9] Bryan Lynn, How Will Machine Translators Change Language Learning?, https://learningenglish.voanews.com/a/how-will-machine-translation-change-the-future-of-language-training-and-learning/3634810.html [10] Dr Ignacio García, Isabel Pena, Machine translation as a tool for language learning,2010, http://www.uws.edu.au/__data/assets/pdf_file/0005/159368/Machine_translation_as_a_tool_for_language_learning.pdf [11] Joan Clifford, Lisa Merschel, Joan Munné, What is the Role of Machine Translation in Language Learning?, 2013, https://dialnet.unirioja.es/descarga/articulo/4334892.pdf DA WIKIPEDIA Translation memory, https://en.wikipedia.org/wiki/Translation_memory Memoria di traduzione, https://it.wikipedia.org/wiki/Memoria_di_traduzione