Passa ai contenuti principali
EMT Blog
  • Articolo
  • 10 maggio 2022
  • 12 min di lettura

Traduzione multiutente e software CAT open source: come funziona OmegaT

Di Lilian FAEDI e Ismaël GARIN, studenti dell’UFR Arts, Lettres et Langues Metz – Université de Lorraine, supervisionati da Jean-Christophe Helary, supervisore del tirocinio, traduttore e membro del team di sviluppo di OmegaT. Tradotto in italiano da Nico Guerra, Cristina Lacorte, Irene Lombardini, Angela Maestri, Jessica Maganza, Martina Mannino, Gloria Simion, Sara Simoncelli, studenti del Corso di Laurea magistrale in Traduzione Specialistica e Interpretazione di Conferenza (a.a. 2023-2024), IUSLIT, Università di Trieste

Questo articolo è stato scritto da Lilian FAEDI e Ismaël GARIN nel corso del tirocinio previsto al secondo anno di laurea magistrale in Tecnologie per la traduzione (TeTra), UFR Arts, Lettres et Langues Metz – Université de Lorraine. L'articolo è stato scritto sotto la supervisione di Jean-Christophe Helary, supervisore del tirocinio, traduttore e membro del team di sviluppo di OmegaT.

 

Introduzione

Gli obiettivi principali di questo articolo sono: avvicinare il lettore al funzionamento della traduzione multiutente in OmegaT, dimostrare le funzionalità più utili per la modalità multiutente e presentare alcuni principi generali del funzionamento di OmegaT, un software open source che può essere utilizzato gratuitamente in configurazione multiutente. Questo software offre soluzioni facilmente accessibili ai professionisti, proprio ora che il telelavoro paradossalmente consente una maggiore collaborazione tra colleghi.

La domanda a cui cercheremo di rispondere è: in che modo lavorare a un progetto multiutente con OmegaT si adatta alle esigenze del traduttore?

 

OmegaT, un software open source

Evidenziamo ora i vantaggi che il software open source può portare al lavoro collaborativo in generale. La licenza di OmegaT ne consente il libero utilizzo, il che significa che il software è gratuito. I diritti garantiti all'utente sono definiti dettagliatamente nella licenza (GPL, versione 3):

https://en.wikipedia.org/wiki/GNU_General_Public_License

Possiamo riassumere tali diritti come segue:

  • la libertà di utilizzare il programma per qualsiasi scopo;
  • la libertà di studiare il funzionamento del programma e di adattarlo alle proprie esigenze;
  • la libertà di ridistribuire copie del programma (che implica la possibilità sia di dare che di vendere copie);
  • la libertà di migliorare il programma e di distribuire gli aggiornamenti al pubblico, a beneficio dell’intera comunità. L’accesso al codice sorgente è condizione per l’esercizio dei diritti 1 e 3.

OmegaT è un CAT tool professionale che esiste da 20 anni e ha beneficiato delle modifiche che la DGT, il governo sudafricano e aziende specializzate in CAT come weLocalize e Kilgray hanno apportato al codice, oltre alle numerose aziende meno conosciute che hanno contribuito al codice e alle caratteristiche del progetto:

https://omegat.org/sponsorship.html

 

Progetto multiutente: condivisione e integrità dei dati

OmegaT in sé non supporta la condivisione dei dati. Tuttavia, prevede funzionalità che consentono di utilizzare sistemi di condivisione dei dati.

Esistono tre tipi di sistemi di condivisione dei dati:

  • sistemi che non controllano l’integrità dei dati quando vi accedono contemporaneamente più utenti (come “DropBox”);
  • sistemi che garantiscono l’integrità dei dati limitando l’accesso a un utente alla volta (“database” in modalità client-server);
  • sistemi che forniscono una copia dei dati a ciascun utente e sincronizzano le modifiche integrandole regolarmente nella versione originaria, fornendo al contempo un sistema per la gestione di modifiche potenzialmente in conflitto (come i “sistemi di controllo di versione” utilizzati nei progetti di scrittura di codice multi-sviluppatore online).

OmegaT ha scelto la terza opzione per i seguenti motivi:

  • i sistemi come “DropBox” non garantiscono l’integrità dei dati ad accesso simultaneo;
  • i sistemi di database sono difficili da installare e richiedono conoscenze tecniche avanzate;
  • i sistemi di sviluppo collaborativo sono onnipresenti su internet. Non richiedono l’installazione di software aggiuntivi e le conoscenze necessarie per utilizzarli non eccedono quelle di un utente medio di strumenti informatici.
OmegaT Screenshot number 1

Piattaforma di sviluppo collaborativo “gitea” ospitata dall’associazione April

 

Progetto multiutente per OmegaT

Questo articolo non copre la parte di configurazione del progetto, che sarà sviluppata in un articolo successivo. Vi presentiamo il progetto multiutente così come ci è stato messo a disposizione per tutta la durata del nostro tirocinio. Questo progetto è disponibile a uso gratuito ma limitato e può essere visualizzato qui:

https://forge.chapril.org/brandelune/documentation_emacs

L’accesso a un progetto multiutente è determinato dalle impostazioni di accesso del sito web in cui sono ospitati i file:

  • il progetto può essere invisibile a persone che non sono membri (come per i progetti di un’agenzia di traduzione);
  • il progetto può essere visibile al pubblico ma modificabile solo dai membri (come per i progetti di volontariato);
  • il progetto può essere visibile al pubblico e modificabile (come per i progetti di prova).

Tutti i progetti in OmegaT (multiutente e locali) sono costituiti da un file “omegat.project” contenente le impostazioni del progetto; una cartella “omegat/” con la memoria di traduzione in formato TMX, condivisa per la lettura e la scrittura; una cartella “glossary/” che contiene il glossario in formato TSV (codificato in UTF-8), anch’esso condiviso per la lettura e la scrittura.

I conflitti di accesso, di scrittura e di altra natura ancora sono interamente gestiti dal sistema “gitea”. OmegaT funge da proxy trasparente tra utente e sistema.

È possibile accedere al progetto multiutente dall’interfaccia del software, che creerà una copia di tutti i file di progetto in locale e autorizzerà una sincronizzazione regolare (di default ogni tre minuti, il che consente di tradurre in modalità "offline" per la sincronizzazione asincrona).

Per lavorare in locale, ogni utente deve avviare il software e fare clic sull’opzione “Scarica progetto in collaborazione” (disponibile nella finestra principale, tramite il menu “Progetto”):

OmegaT Screenshot number 2

Scarica il progetto in collaborazione

OmegaT Screenshot number 3

Inserisci l’indirizzo del progetto e la posizione per la copia locale

Ogni partecipante al progetto è autorizzato dal project manager a sovrascrivere i file che si trovano online. Dopo il caricamento, OmegaT chiederà le credenziali di accesso.

OmegaT Screenshot number 4

Inserire le proprie credenziali di accesso

Ora sarà visibile l’elenco dei file di progetto. Si noti che i file di origine del progetto non sono ospitati sul sito di repository di gestione dei file corrispondente, bensì in un repository separato che si trova nel file “omegat.project” sopra descritto:

https://forge.chapril.org/brandelune/documentation_emacs/src/branch/main/omegat.project

La riga “30” del file indica l’indirizzo del repository, a cui possiamo accedere direttamente:

https://git.sr.ht/~brandelune/emacs_documentation_repository/tree

Una volta visualizzati i file nell’interfaccia di traduzione di OmegaT, è possibile tradurli uno per uno, convalidare la traduzione con “Invio” e, una volta trascorso il tempo di salvataggio impostato, OmegaT sincronizzerà i contenuti tradotti. Il server associato recupererà questo contenuto una volta avvenuta la sincronizzazione. Possibili conflitti (che si verificano quando lo stesso segmento è stato tradotto in due modi diversi tra due sincronizzazioni) vengono visualizzati nell’interfaccia di OmegaT  in una finestra in cui viene chiesto all’utente di scegliere tra la propria versione e la versione suggerita nella finestra di sincronizzazione.

OmegaT Screenshot number 5

Esempio di conflitto quando si aggiunge un segmento

 

Memorie di traduzione in OmegaT

 

Memoria di progetto

Per comprendere l’uso delle memorie di traduzione in OmegaT è importante capire cosa sono. Innanzitutto, OmegaT crea automaticamente una memoria di traduzione per ciascun progetto. In altre parole, non è necessario che l’utente crei una memoria e la associ a un progetto. Un progetto OmegaT è una memoria di traduzione, che è al centro del progetto. La memoria è alimentata dal lavoro del traduttore e, nella modalità multiutente, dalle traduzioni sincronizzate dei vari membri del progetto. Come accennato in precedenza, la memoria si trova nella cartella “omegat/”:

https://forge.chapril.org/brandelune/documentation_emacs/src/branch/main/omegat

Tutte le memorie utilizzate da OmegaT sono nel formato standard TMX, che consente l’interoperabilità con altri CAT tool.

 

Memorie ausiliarie

Un progetto OmegaT è una gerarchia di file in cui esiste, allo stesso livello di “omegat/”, “source/”, “glossary/”, una cartella “tm/” in cui caricare le memorie di riferimento (generalmente in formato TMX, ma anche negli altri formati bilingui supportati da OmegaT come XLIFF, PO, ecc.).

Questa cartella può contenere sottocartelle per migliorare il funzionamento di queste risorse. Alcune di esse hanno caratteristiche specifiche che il traduttore può utilizzare liberamente:

  • “tm/auto/” contiene le memorie che il traduttore desidera utilizzare per tutto il progetto come se fosse la memoria predefinita;
  • “tm/enforce/” contiene le memorie che hanno la priorità rispetto ai contenuti già salvati nel progetto. I nuovi contenuti sovrascriveranno quindi i contenuti già salvati nella memoria del progetto;
  • “tm/mt/” include le memorie che provengono da sistemi di traduzione automatica di cui il traduttore dovrebbe essere specificamente a conoscenza. Tali contenuti verranno visualizzati ed evidenziati in rosso ogni volta che verranno inseriti in un segmento;
  • “tm/penalty-010/” contiene le memorie a cui è stata attribuita una penalizzazione pari al numero che segue il trattino (qui 10%);
  • “tm/tmx2source/” contiene le memorie che provengono da un documento tradotto in un’altra lingua di arrivo. Il traduttore può quindi vedere la propria traduzione nell’altra lingua di arrivo direttamente sotto il segmento da tradurre.

Per poter essere immediatamente utilizzata all’interno di un progetto, una memoria deve essere copiata nella cartella “tm/”. Allo stesso modo, una memoria deve essere rimossa dalla cartella affinché il suo contenuto non sia parte della memoria di riferimento.

 

Memorie condivise

Ogni volta che un utente crea un documento di arrivo, OmegaT genera tre file TMX che includono solo segmenti tradotti dei file di partenza in fase di traduzione e mai l’intero contenuto della memoria globale del progetto. Questi tre file hanno le seguenti caratteristiche:

  • “[nome del progetto]-omegat.tmx” contiene le traduzioni seguite dai tag utilizzati internamente da OmegaT da riutilizzare in altri progetti di OmegaT;
  • “[nome del progetto]-level1.tmx” contiene i dati di tipo TMX 1.4b level 1, ossia solo il testo della traduzione, senza alcun tag;
  • “[nome del progetto]-level2.tmx” contiene i dati di tipo TMX 1.4b level1 2, ossia il testo della traduzione con i tag come definiti dallo standard TMX.

https://www.gala-global.org/tmx-14b#SectionIntroduction

Queste memorie possono essere condivise con altri utenti, usate in futuro, ecc.

 

Glossari

Come avviene in altri CAT tool, OmegaT utilizza non solo memorie di traduzione ma anche glossari.

All’interno della cartella “glossary/” di un progetto condiviso, ogni componente del team di traduttori può aggiungere un proprio glossario, ossia un file di testo in formato TSV (Tab Separated Values) con codifica UTF-8.

L’utente deve semplicemente creare un file di testo (con estensione .txt) per poterlo caricare nel programma. Se desidera inserire o aggiungere un nuovo termine, dovrà tener conto dei seguenti elementi, delimitati da tabulazioni:

  • termine di partenza (es.: and so on);
  • termine di arrivo (es.: et ainsi de suite);
  • note (es.: idiomatic expression to keep).
OmegaT Screenshot number 6

Glossario aperto con un editor di testo

 

Si può accedere direttamente ai glossari in due modi:

  • cliccando su “Progetto” > “Accedi al contenuto del progetto” > “Glossario modificabile”;
  • cliccando sull’ingranaggio nell’angolo in alto a destra della finestra “Glossari” (se aperta durante la traduzione).

Le modifiche apportate sono visibili all’interno del progetto non appena vengono salvate dall’editor di testo.

L’interfaccia di OmegaT permette di aggiungere direttamente i termini attraverso il menu “Modifica > Crea voce di glossario”, senza dover ricorrere a un editor di testo. Queste voci vengono aggiunte al glossario modificabile del progetto, che sarà sincronizzato nel progetto multiutente.

OmegaT Screenshot number 7

Glossario aperto in OmegaT

 

Comunicare tra membri del progetto con le note sincronizzate

Il “Blocco note” in OmegaT è utile per molti scopi: uno di questi è la correzione di bozze. Ogni utente può aggiungere note ad uno specifico segmento di testo per fornire indicazioni varie sugli elementi da correggere, oppure osservazioni e consigli relativi al glossario o alla coerenza della traduzione. Si tratta infatti dello strumento fondamentale dei correttori di bozze.

OmegaT Screenshot number 8

Finestra “Blocco note” contenente una nota relativa al segmento attivo

 

Le note di OmegaT fanno parte della TMX standard:

https://www.gala-global.org/tmx-14b#note

Il contenuto delle note viene poi sincronizzato nei progetti multiutente e consente la comunicazione tra i componenti del team.

Attraverso il menu “Vista”, OmegaT può segnalare i segmenti a cui sono state aggiunte note grazie alla funzione “Evidenzia i segmenti con note” (che vengono evidenziati in azzurro). In questo modo i segmenti vengono facilmente identificati nella finestra principale della traduzione:

OmegaT Screenshot number 9

Segmenti con note riconoscibili tra i segmenti tradotti

 

Ѐ possibile effettuare una ricerca a partire dal contenuto delle note per visualizzare i segmenti relativi e poterci lavorare.

 

Strumenti per l’assicurazione di qualità (QA)

In OmegaT sono presenti vari strumenti per il controllo della qualità e la revisione. Altri articoli, in francese, se ne sono già occupati:

 

Lavoro di gruppo in un progetto multiutente

Un progetto multiutente ha lo scopo di suddividere i compiti tra i componenti del team che lavorano a un progetto condiviso.

Ogni componente viene identificato con il nome con cui ha effettuato l’accesso alle impostazioni di OmegaT. Lo user ID dei membri viene salvato in ogni segmento della memoria TMX attraverso un codice data-ora ogni volta che si crea un nuovo segmento o se ne modifica uno già esistente.

https://forge.chapril.org/brandelune/documentation_emacs/src/branch/main/omegat/project_save.tmx#L43

OmegaT non permette l’assegnazione di ruoli, ma offre un numero sufficiente di funzioni specifiche affinché i componenti di un dato progetto possano suddividersi i compiti autonomamente. Per esempio, un team di traduzione potrebbe avere:

  • un componente che traduce il documento;
  • un componente che si occupa della revisione, possibilmente entro una decina di minuti;
  • un componente che esegue una correzione globale per la standardizzazione dei contenuti (glossario, riferimenti, ecc.);
  • un componente che crea un file sorgente atto alla correzione di bozze, in vista della creazione del formato finale, così da poter apportare le modifiche al progetto.

La funzione di ricerca è estremamente efficace e può cercare nomi, date, contenuti (con o senza espressioni regolari), sia nel testo di partenza che in quello di arrivo. In questo modo è possibile individuare facilmente i segmenti tradotti da un membro in due momenti distinti.

La maschera di ricerca può filtrare i segmenti trovati per obbligare OmegaT a visualizzare solo quelli presenti nell’editor.

 

Conclusioni

Nel presente articolo vengono mostrate le funzionalità multiutente che fanno di OmegaT uno strumento di alto livello per progetti di traduzione complessi. La sincronizzazione permette l’uso di siti web di sviluppo collaborativo che forniscono all’utente (e a tutto il team di traduzione) l’accesso a tutti gli elementi di un progetto, così da mantenerli continuamente aggiornati. Le memorie di traduzione sincronizzate sono ciò che rende OmegaT così utile per i progetti multiutente condivisi. Grazie ai glossari condivisi, alle note e ad altri strumenti per l’assicurazione della qualità, la traduzione non è mai stata così semplice, e lo strumento consente anche di svolgere attività di verifica dei contenuti.

 

Dettagli

Data di pubblicazione
10 maggio 2022
Lingua
  • inglese
  • francese
Categoria EMT
  • Tecnologie della traduzione