Nuove Tecnologie per la TraduzioneGrande Dizionario Italiano di GABRIELLI ALDO Dizionario della...

Post on 29-Feb-2020

14 views 0 download

Transcript of Nuove Tecnologie per la TraduzioneGrande Dizionario Italiano di GABRIELLI ALDO Dizionario della...

Nuove Tecnologie

per la

Traduzione

Roma, Tor Vergata,LINFO Giuseppe Forte María Lozano Zahonero Sandra Petroni

Contenuti del seminario

1. Dalla traduzione automatica alla traduzione

assistita

2. I corpora, le basi di dati terminologiche e

testuali, le memorie di traduzione e il processo

traduttivo

3. Creazione di corpora, allineamenti e memorie di

traduzione.

TEORIA

PRATICA

4. La traduzione interattiva, il post-editing e il

cleaning dei dati (tmx)

30-03 13:00-15:00

T12A

05-04 09:00-11:00

T12B

12-04 09:00-11:00

T12B

13-04 09:00-11:00

T12A

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

1. Dalla traduzione automatica alla traduzione

assistita

1.1 Il mercato della traduzione: sviluppi

1.2 Il mercato della traduzione: domanda

1.3 La traduzione automatica (TA/MT)

1.4 La traduzione assistita (CAT)

- Il workflow

Nuove Tecnologie

per la

Traduzione

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

30-03 13:00-15:00

T12A

• Il progresso tecnologico: Internet

1.1 IL MERCATO DELLA TRADUZIONE: sviluppi

• Globalizzazione

“Processo economico di integrazione

dell'intera economia mondiale in un unico

mercato, con conseguente superamento

delle barriere nazionali” Grande Dizionario Italiano

di GABRIELLI ALDO Dizionario della Lingua Italiana

• Documentazione multilingue:

domanda di traduzione

L'aumento esponenziale di testi da

tradurre richiede l'uso di

tecnologie in grado di ridurre

significativamente tempi e costi

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Stati Uniti: Warren Weaver, 1947

Possibilità di tradurre attraverso l’uso di una

macchina:

…metodo basato sulla sostituzione di parola per

parola, e proponeva di integrarlo con tecniche di

statistica applicata per rilevare la frequenza di

parole e caratteri in testi paralleli… (Wikipedia)

1.3 LA TRADUZIONE AUTOMATICA (TA/MT)

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

TRADUZIONE AUTOMATICA

“La traduzione automatica (TA), definita anche traduzione

automatizzata o MachineTranslation (MT) è un processo

mediante il quale un software viene utilizzato per tradurre

un testo da una lingua naturale (ad esempio, l’inglese) ad

un’altra (ad esempio, lo spagnolo) senza l’intervento

umano”

(Systran)

Source Text

Machine Translation Translations

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

1.3 TRADUZIONE AUTOMATICA (TA/MT):

Fallimento: l’ALPAC, Automatic Laguage Processing

Advisory Committee proclama la TA inutile e dispendiosa;

Non sarebbe stato possibile ottenere un sistema di

traduzione completamente automatico di alta qualità e

che potesse sostituire la traduzione umana.

Ripresa: anni ‘80/’90 nuovo interesse

Finanziamenti da parte di grandi organizzazioni

internazionali

Nascita dei primi sistemi di TA:

Systran (russo-inglese)

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

1.3 TRADUZIONE AUTOMATICA (TA/MT):

Ambito di indagine della Linguistica Computazionale

(Natural Language Processing – Trattamento Automatico delle

Lingue) Anni ‘90

Discplina che si occupa dell’elaborazione delle lingue, in ogni

possibile aspetto, mediante l’uso di calcolatori.

Modelli principali:

Diretti o per unità

Sintattici o transfer-system

Sistemi a interlingua

Sistema basato su esempi

Sistema basato su statistiche

Sistemi ibridi

1. Rule-Based:

2. Probabilistici:

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Sistemi basati su regole (Rule-Based)

CARATTERISTICHE

Un numero quasi infinito di regole linguistiche

rappresentate in diagrammi ad albero

(morfologici/sintattici).

Milioni di dizionari bilingui per ogni combinazione

linguistica

Le traduzioni vengono create in base a processi di:

lemmatizzazione, etichettatura, parser,tokenizzazione, …

<verb>, <n>, <m>, <f>, <sg>, <pl>, …

Diretti o per unità

Sintattici o transfer-system

Sistemi a interlingua

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Input LP

Analisi lessicale

Analisi morfologica

LP

Traducente

DIZIONARIO

Liste omonimi

Forma selezionata

Elaborazione

Traduzione

Elaborazione Analisi

morfologica LA

Traduzione

Diretti o per unità:

Scomposizione al

minimo delle

informazioni

linguistiche da

analizzare tenendo

conto solo delle

caratteristiche della

LP e della LA

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Sintattici o transfer-system

Sistemi più

usati per la

comprensione

automatica del

Linguaggio naturale.

Più complessi.

Input LP Segmentazione

Analisi morfologica e sintattica LP

Transfer lessico-sintattico

Sintesi

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Sistemi a interlingua:

Rappresentazione morfologica, sintattica e semantica

semplificata.

Sono necessari due passaggi di traduzione:

• Passaggio dalla Source Language all’interlingua,

• Passaggio dall’interlingua al Target Language

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Sistema basato

su regole:

PeTra Online

http://petra.interfree.it/

PeTra utilizza un avanzato

sistema di Machine Translation

basato su regole (rule-based)

sviluppato da SyNTHEMA.

1. Dalla traduzione automatica alla traduzione assistita

Sistemi probabilistici

CARATTERISTICHE:

Basati su Corpora paralleli e monolingui

Statistiche per la selezione delle parole

Possono utilizzare o no regole grammaticali

Peso delle parole all’interno dei corpora paralleli:

occorrenza delle parole nei corpora, posizione e

confronto con la lingua target: n-gram

Si necessita di GRANDI quantità di dati per avere

risultati ottimali.

Sistema basato su esempi

Sistema basato su statistiche

Sistemi ibridi

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Sistema basato su esempi

Traduzione per analogia: ricava i frammenti

linguistici all’interno di testi allineati

Sistemi statistici

Uso di statistiche sull’occorrenza delle

parole all’interno di grandi corpora

bilingui. Confronto con corpora

monolingui. Flessibilità di creazione.

Possibilità di aggiungere terminologia

“propria”.

Sistemi ibridi

Combinazione di moduli statistici e basati

su regole.

EN ES

EN ES

Term

EN ES

Term

Rules

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Sistemi probabilistici

Risorse:

Corpara paralleli molto grandi (minimo 2mln di

parole) per dominio specifico: risultati migliori

Piattaforme hardware potenti e costose

Software Open-Source: MOSES

Fondi economici

1. Dalla traduzione automatica alla traduzione assistita

Flusso di lavoro e professionisti coinvolti:

Installazione ambiente hardware e software:

Informatico

Preparazione risorse linguistiche (cleaning corpora,

terminologia, regole, etc.) Linguista-Informatico

(formati, macro, CAT-tools, pre-processing,…)

Coordinazionazione del progetto: Linguista-

informatico

Difficoltà:

• Preparazione del materiale linguistico:

selezione dei dati, pulizia dei dati,

automatizzazione dei processi di pre-processiong

• Installazione ambiente hardware e software:

poche informazioni a riguardo, esperti linguistici-

informatici

• Definizione strategie

TEMPO!

Usi:

• Traduzione di pagine web (NO localizzazione)

• Necessità di comunicazione

• Pre-traduzione

• Gist translation?

• Misleading?

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

1.4 La traduzione assistita - Computer

Assisted Translation (CAT)

Anni ‘70: nasce l’idea di creare una stazione di

lavoro per il traduttore, workstation, workbench

Avvento dei corpora, glossari, dizionari, basi di

dati in formato digitale

Nuova idea: come sfruttare i testi già tradotti

precedentemente in modo da poter risparmiare

tempo e denaro

Ripartizione del lavoro tra più figure professionali:

revisore, traduttore, proofreader, project

manager, terminologo,…)

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

1. Dalla traduzione automatica alla traduzione assistita

TRADUZIONE ASSISTITA

Computer-Assisted Translation (CAT)

“Sistema di traduzione in cui il traduttore

professionista (e non una macchina) utilizza

applicativi software specificamente sviluppati per

facilitare e migliorare il processo di traduzione”

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Traduttore

MT

Memorie di traduzione

Terminologia

Dizionari

testoLP

testoLA

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Strumenti CAT

Memorie di traduzione (Translation Memory,

TM)

Basi di dati terminologiche (TermBase, TB)

Basi di dati testuali (TextBase)

Programmi di allineamento (Aligners)

Project Management

Localizzazione

Garanzia di coerenza stilistica e terminologica

Tempi di traduzione ridotti: produttività

Personalizzazione e condivisione

Interattività: rialimentazione e correzione

Funzioni di pre-traduzione

Ricerca e consultazione

Integrazione con MT!

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

MEMORIE DI TRADUZIONE

TERMINOLOGIA

DIZIONARI Autosuggest

WO

RK

BEN

CH

Pe

r la

Tra

du

zio

ne

MACHINE TRANSLATION

BASI TESTUALI

WO

RK

BEN

CH

Pe

r la

Do

cum

en

tazi

on

e

Altre risorse (esterne)

Testo LP

CA

T Tools

TRANSLATION MANAGEMENT

WORKFLOW MANAGEMENT

Piattaforme di

gestione

• Project Manager

Testo LA

AUTORE/

CLIENTE

Il Workflow

• Revisore • Traduttore • Proofreader • Terminologo • Documentazione • Supporto CAT

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

USI:

Traduzione e Pretraduzione

Qualsiasi formato: .doc/docx, .ppt, .txt, html, xml,

xhtml, etc.

Traduzione di Software

Localizzazione

1. Dalla traduzione automatica alla traduzione assistita

COMPETENZE:

Competenze informatiche medio/alte

Conoscenza medio/alta dei programmi di video

scrittura

Conoscenza dei diversi formati: xml, html, txt, pdf

Conoscenza di Editor

Localizzazione

Conoscenza dei motori di ricerca

Aggiornamenti

Installazione

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

La traduzione assistita (CAT)

Risorse:

Software “pacchetto”: gestione di TM, termbase,

textbase, dizionari, glossari, altre risorse

Personal computer (per freelance)

Connessione Internet

Database o server

1. Dalla traduzione automatica alla traduzione assistita

Svantaggi (?):

Software costosi

“Buone” competenze

Privacy delle informazioni

Esempio file tmx

Alcuni nomi:

1. Dalla traduzione automatica alla traduzione assistita

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

Chi usa questi strumenti?

Organizzazioni Internazionali

Agenzie di traduzione

Traduttori freelance

1. Dalla traduzione automatica alla traduzione assistita

Requisito necessario?

Requisito minimo!

Consigli:

• Monaco, G. (2011): Utopia o realtà? Fin dove è possibile

la traduzione automatica. Tesi di Laurea, Roma, Tor

Vergata (Didattica Web -giorgiamonaco@gmail.com)

• Forte, G. (2011): La traduzione globalizzata. Tesi di

Laurea, Roma, Tor Vergata (Didattica Web –

giuseppe.forte@fao.org)

• TAUS: Translation Automotion

http://www.translationautomation.com

• Systran: Translation services

http://www.systran.it

• MOSES SMT: Statistical Machine Translation

www.statmt.org/moses/

• SDL Trados: CAT tools

http://www.trados.com/en/

BIBLIOGRAFIA / SITOGRAFIA

Domande?

giuseppe.forte@fao.org

Giuseppe Forte

Workflow, Meeting Template and Language Support CSCM

Food and Agriculture Organization of the United Nations,

FAO

Roma

Nuove Tecnologie

per la

Traduzione

Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni

2. I corpora, le basi di dati terminologiche e

testuali, le memorie di traduzione e il processo

traduttivo

05-04 09:00-11:00

T12B