Computer e traduzione 10-15-16/3/2010 Informatica applicata alla comunicazione multimediale Cristina...

Post on 01-May-2015

215 views 0 download

Transcript of Computer e traduzione 10-15-16/3/2010 Informatica applicata alla comunicazione multimediale Cristina...

Computer e traduzione

10-15-16/3/2010Informatica applicata alla

comunicazione multimedialeCristina Bosco

Overview

• Traduzione: • Traduzione automatica• Traduzione assistita dal computer

Traduzione

• Traduzione e mondo• Traduzione e nuove tecnologie• Traduzione e ipertesto

Traduzione

Il processo di traduzione comporta

la decodifica del significato del testo nel linguaggio sorgente

la ricodifica di tale significato nel testo nel linguaggio destinazione

Traduzione

Il processo di traduzione comporta quindi

una serie di operazioni cognitive solo apparentemente semplici e molto difficili da affrontare in modo automatico

Traduzione

Necessità crescente di traduzione:• Aumento di comunicazioni• Necessità di distruggere le barriere

linguistiche (ad es. in regioni, stati e comunità multilingui)

• Variazione delle logiche di mercato (inglese come lingua franca o multilinguismo?)

Traduzione

Ma la traduzione è • progressivamente più integrata con

la comunicazione• quindi deve essere più veloce e di

elevata qualità• riguarda grandi moli di documenti e

coinvolge gruppi di traduttori

Traduzione e nuove tecnologie

Le nuove tecnologie • arricchiscono il nostro orizzonte

culturale di nuove modalità espressive• ma incidono anche profondamente sul

modo in cui utilizziamo le altre modalità espressive, interagiamo con l'ambiente e costruiamo la nostra conoscenza

tra le nuove modalità espressive l'ipertesto si pone come la più realistica

simulazione dei processi cognitivi

Traduzione e nuove tecnologie

Sono ipertestuali • la lettura di un testo che contiene

note e rimandi• la consultazione di un dizionario

mentre si legge un testo

E’ IPERTESTUALE ogni lettura che esce dalla logica sequenziale del testo

Traduzione e nuove tecnologie

ipertesti che contengano testi e loro traduzioni

consentono rapidi confronti tra versioni

e svolgono un ruolo importante nel farsi e rifarsi del processo traduttivo

Traduzione e nuove tecnologie

L’ipertesto è adatto quindi come supporto alla traduzione in quanto

consente di realizzare in modo esplicito legami tra il testo e le sue

traduzioni, i commenti, i rapporti con altri testi anche sviluppati da altre

persone

Traduzione e nuove tecnologie

Internet è uno strumento fondamentale perchè contiene un'enorme quantità

di informazioni linguistiche e culturali: archivi di testi letterari,

grandi corpora, dizionari

Traduzione e nuove tecnologie

Overview

• Traduzione• Traduzione automatica• Traduzione assistita dal computer

Traduzione automatica

• Cos’è la traduzione automatica• Breve storia della traduzione

automatica

Traduzione automatica

Per traduzione automatica (Machine Translation, MT) si intende un processo di traduzione

completamente eseguito da uno strumento software

Traduzione automatica

Il software di traduzione automatica

• prende in input un testo TA in una lingua A

• restituisce in output il testo TB che nella lingua B ha lo stesso significato di TA

• il modo in cui si passa dall’input all’output è indifferente

Traduzione automatica

La traduzione automatica presenta molti vantaggi:

• omogeneità nello stile ed uso di vocaboli

• coerenza (la stessa frase è tradotta sempre nello stesso modo)

• ma soprattutto risparmio di tempo e denaro

Traduzione automatica

La traduzione automatica è particolarmente adatta per determinati tipi di testo:

• guide di musei• documenti dell’Unione Europea• manualistica tecnica

Traduzione automatica

Tuttavia la traduzione automatica non ha utilità in certi casi, ad esempio quando:

• lo scopo è di comprendere il contenuto di un documento

• si vuole la presenza della componente umana stilistica

Traduzione automatica

MA la traduzione completamente automatica non è attualmente

realizzabile

E non sappiamo se lo sarà mai!

Traduzione automatica

La traduzione completamente automatica ricade infatti nei

problemi, tipici del NLP, legati a:

• ambiguità del linguaggio • incapacità delle macchine di

immagazzinare ed utilizzare tutta la conoscenza situazionale/contestuale richiesta nella comprensione di un testo

Traduzione automatica

La traduzione completamente automatica è dunque impossibile

quando la comunicazione tra esseri umani avviene in “ambienti”

(culturali e cognitivi)aperti,

mutevoli, governati da regole variabili

Traduzione automatica

La traduzione completamente automatica è oggi possibile in casi

particolari e ristretti in cui la comunicazione è limitata ad ambienti chiusi, circoscritti.

Ed esistono molti casi che possono essere ricondotti a questa

situazione.

Traduzione automatica

Il forte interesse teorico, ma soprattutto pratico per la traduzione

completamente automaticaè il motivo per cui esistono ancora progetti di MT, e soprattutto il motivo per cui sono esistiti molti progetti di

MT

Traduzione automatica: breve storia

Nel 17esimo secolo le idee di Leibniz e Cartesio hanno provocato discussioni

su nozioni di linguaggio universale (precorrendo l’esperanto) che faciliterebbe il commercio e

linguaggi logici (precorrendo i linguaggi del computer)

Traduzione automatica: breve storia

Nel 1933, Georges Artsouni ideò un “cervello meccanico”, un dispositivo per trattare (archiviare,

consultare e stampare) informazioni, creato per scopi di crittografia, ma

utilizzabile per la traduzione e basato sulla traduzione diretta parola per

parola (senza nessuna analisi linguistica sottostante)

Traduzione automatica: breve storia

Il prototipo del “cervello meccanico” viene presentato e premiato all’esposizione

Universale di Parigi del 1937.Le poste e l’esercito francesi

commissionano due macchine che non verranno mai realizzate a causa della guerra.

Traduzione automatica: breve storia

Nel 1933, Petr Petrovic Trojanskij brevetta un modello più evoluto di

macchina per la traduzione che prevede la trasformazione del testo

in forma logica universale (esperanto) prima di passare alla

lingua di destinazione e utilizza forme di analisi morfologica e sintattica

Traduzione automatica: breve storia

L’importanza del lavoro di Artsouni e di Trojanskij sta nel fatto di aver

proposto i due modelli che da allora in poi si utilizzeranno per la

traduzione automatica:

• traduzione diretta, parola per parola • traduzione indiretta, basata su

interlingua o transfer

Traduzione automatica: breve storia

Traduzione automatica: breve storia

La MT basata sull’interlingua o transfer prevede la trasformazione del testo sorgente in una lingua astratta e la successiva generazione del testo

destinazione a partire dall’interlingua. Richiede la presenza

di informazioni morfologiche sintattiche e semantiche

Traduzione automatica: breve storia

La MT diretta non prevede rappresentazioni intermedie e si

basa sulla traduzione di ogni parola del linguaggio sorgente nella

corrispondente parola nel linguaggio destinazione

Traduzione automatica: breve storia

Ma ufficialmente la storia della MT nasce nel 1949, quando Warren

Weaver, esperto di decrittazione di codici, produce il promemoria

“Translation”

Traduzione automatica: breve storia

Weaver, formula ipotesi sulla possibilità e i metodi della MT basati su:

• sostituzione parola per parola (da Artsouni + crittografia/crittoanalisi)

• presenza di universali linguistici (metafora delle torri)

• frequenza delle parole (da crittoanalisi)

Traduzione automatica: breve storia

Le tecniche proposte da Weaver si rifanno sostanzialmente alla crittografia e alla crittoanalisi, tecniche molto antiche,

già in uso ad esempio presso i romani durante il periodo di Cesare.

(Una avvincente storia della crittografia:Simon Singh, Codici e segreti, Mondadori)

Traduzione automatica: breve storia

Un esempio di crittografia: il codice di Cesare

Traduzione automatica: breve storia

Gli studi di crittografia e crittoanalisi ebbero grande sviluppo nel 700 in Francia e poi durante la seconda guerra mondiale, consentendo la

vittoria degli alleati e la sconfitta dei tedeschi

(grazie al contributo di Alan Turing e del gruppo di Bletchley Park)

Traduzione automatica: breve storia

Dopo l’entusiasmo generato da Weaver e 10 anni ricchi di progetti di MT,

la MT entra in una fase di stagnazione per lo scarso successo ottenuto dai

progetti e per le critiche di vari studiosi, tra cui in particolare quella

del filosofo Bar-Hillel (1959)

Traduzione automatica: breve storia

Bar-Hillel sostiene che la MT è inattuabile perché non esistono i mezzi tecnici per realizzarla e

soprattutto perché sicuramente non si può riprodurre in una macchina la conoscenza situazionale che è a

fondamento di qualunque traduzione

Traduzione automatica: breve storia

Bar-Hillel vede come irraggiungibile la FAHQT (fully automatic high quality

translation) che rappresenta il traguardo più ambizioso per i sistemi di traduzione, ma non necessario in

molti casi reali.Teorizza una traduzione di tipo transfer.

Traduzione automatica: breve storia

Negli stessi anni (1954) l’IBM attirava fondi e interesse pubblico

pubblicizzando l’esperimento di Georgetown:

traduzione, dal russo all’inglese, di 49 frasi accuratamente preparate

utilizzando 6 regole grammaticali e 250 item lessicali

Traduzione automatica: breve storia

Nel 1966 l’ALPAC (Automatic Language Processing Advisory Committee,

composto da 6 scienziati statunitensi) diffonde il suo rapporto in cui si dichiara impraticabile la MT e si enfatizza la necessità di ricerca

di base nella linguistica computazionale

Traduzione automatica: breve storia

Riassumendo:

• precursori (1933-1949), alcuni studiosi sviluppano macchine per la traduzione e si evidenziano i due modelli, traduzione diretta e traduzione tramite interlingua o transfer.

Traduzione automatica: breve storia

Riassumendo:i due modelli:• traduzione diretta• traduzione indiretta, tramite

interlingua o transfer

Traduzione automatica: breve storia

Traduzione automatica: breve storia

Riassumendo:traduzione diretta:basata essenzialmente su una

traduzione parola per parole, con qualche aggiustamento a livello sintagmatico, di ordine dei costituenti e di locuzioni idiomatiche

Traduzione automatica: breve storia

traduzione indiretta di tipo transfer:LS ->SYS-S -> SYS-D ->LD

dal testo in LS si estrae SYS-S (rappresentazione strutturale conforme alla LS)

SYS-S viene trasformata in SYS-D (rappresentazione strutturale conforme alla LD) ed impiegata per generare un testo in LD.

Traduzione automatica: breve storia

traduzione indiretta di tipo interlingua: LS-> lingua universale -> LDda un testo in LS è tradotto in una forma

linguistica non caratterizzata (universale)che viene tradotto in LS.

Traduzione automatica: breve storia

Riassumendo:

• prima fase (1946-1954), detta sperimentale, caratterizzata da ottimismo euforico: si supponeva che un’approfondita ricerca avrebbe permesso di creare macchine in grado di tradurre tutto e con altissima qualità.

Traduzione automatica: breve storia

Riassumendo:

• seconda fase (1954-1966), inizia l’entusiasmo per l’esperimento di Georgetown, continua con lo scetticismo di Bar-Hillel, e si conclude con il rapporto ALPAC secondo cui la FAHQT è impossibile e occorre sviluppare sistemi di supporto alla traduzione ed approfondire la linguistica computazionale

Traduzione automatica: breve storiaRiassumendo:

• terza fase (1966-1975), detta di linguistica computazionale, si sviluppano nuovi sistemi basati su informazione linguistica, si approfondiscono gli studi sul parsing e sul trattamento del linguaggio.

Traduzione automatica: breve storia

Riassumendo:

• quarta fase (dal 1975), in cui la ricerca sulla MT si lega ai nuovi approcci di intelligenza artificiale con orientamento interdisciplinare (informatica, linguistica computazionale e traduttologia).

Overview

• Traduzione• Traduzione automatica• Traduzione assistita dal computer

Traduzione assistita dal computer

• Breve storia dei sistemi integrati• Cosa sono i sistemi integrati

Traduzione assistita dal computer

L'invito dell’ALPAC a sviluppare sistemi di supporto alla traduzione per molti anni non potè essere seguito a causa dei limiti dei calcolatori dell’epoca.

Ma negli anni '60 e '70 alcuni grandi uffici di traduzione iniziarono a

creare banche dati

Traduzione assistita dal computer

Essendo caricate in supercalcolatori, le banche dati potevano però essere

utilizzate solo all'interno delle organizzazioni che le avevano

sviluppate(Comunità Europee, governo canadese,

Ufficio federale per le questioni linguistiche della Svizzera ...)

Traduzione assistita dal computer

Solo a metà degli anni '80, con la diffusione dei PC e successivamente

con l’avvento delle reti, vengono sviluppati e resi disponibili tools per la gestione di corpora terminologici (sistemi di gestione terminologica,

sistemi di gestione di glossari, vocabolari digitali …)

Traduzione assistita dal computer

All'inizio degli anni '90 nascono i cosiddetti sistemi integrati finalizzati alla raccolta e la riproposta di traduzioni già effettuate dall'utente, gestite in modo da poterle

condividere con altri traduttori (anche in rete), per ridurre i tempi di traduzione e

garantire una maggiore coerenza formale e contenutistica della traduzione

Traduzione assistita dal computer

I sistemi integrati di traduzione assistita (CAT, Computer Assisted Translation)

sono solitamente composti da

• Memoria di traduzione• Database terminologico• Editor di traduzione

Traduzione assistita dal computer

Cosa è la memoria di traduzione (TM, tanslation memory)?

É un database di frasi bilingue allineate, una raccolta di testi precedentemente

tradotti, che viene automaticamente generata e consultata per verificare

se (parte del)la frase è già stata tradotta.

Traduzione assistita dal computer

Come funziona una TM?

Se la frase è già stata tradotta, propone la traduzione (con il grado di

concordanza tra la frase contenuta nella TM e quella nuova) che potrà essere eventualmente modificata.

Traduzione assistita dal computer

Come funziona una TM?

Se la frase NON è ancora stata tradotta, l’utente dovrà digitare l’intera frase

nuova, che verrà a sua volta memorizzata nella TM.

Traduzione assistita dal computer

Come funziona una TM?

Nella traduzione proposta, i segmenti di frase modificati e quelli nuovi sono evidenziati in modo da rendere più

immediata e chiara la verifica e correzione della frase che si sta

traducendo

Traduzione assistita dal computer

Cosa è il database terminologico?

È una raccolta di termini tradotti eventualmente arricchita di

informazioni relative ai termini stessi

Traduzione assistita dal computer

Come funziona un database terminologico?

Viene creato dall’utente che vi inserisce i termini e le relative informazioni, e poi utilizzato in fase di traduzione.

Traduzione assistita dal computer

Cosa è l’editor per la traduzione?

È il software che guida l’utente attraverso la traduzione e gestisce il

dialogo tra le finestre che contengono il testo di partenza, la traduzione, le proposte del database testuale e del

database terminologico.

Traduzione assistita dal computer

Come funziona l’editor per la traduzione?Deve riconoscere e proteggere i cosiddetti

markers, perché, a traduzione ultimata, il programma provvede

automaticamente a reimpostare nel testo tradotto il medesimo formato del testo di partenza (in colonne, tabelle,

grafici, note a pié pagina, ecc.).

Traduzione assistita dal computer

I sistemi di CAT si possono basare su 2 diversi approcci:

1) il programma fa un confronto automatico dell’intero testo da tradurre con i contenuti dei suoi database, PRIMA di iniziare la traduzione. Durante la traduzione, proporrà le frasi tradotte in base al materiale trovato.

Traduzione assistita dal computer

I sistemi di CAT si possono basare su 2 diversi approcci:

2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella

successiva. Poi propone la traduzione in base ai dati contenuti

nel database.

Traduzione assistita dal computer

I sistemi di CAT possono:2) Il sistema effettua la ricerca per ogni

singola frase, nel momento in cui si passa dalla frase tradotta a quella

successiva. Poi propone la traduzione in base ai dati contenuti

nel database.