Questo articolo è stato scritto da Lilian FAEDI e Ismaël GARIN nel corso del tirocinio previsto al secondo anno di laurea magistrale in Tecnologie per la traduzione (TeTra), UFR Arts, Lettres et Langues Metz – Université de Lorraine. L'articolo è stato scritto sotto la supervisione di Jean-Christophe Helary, supervisore del tirocinio, traduttore e membro del team di sviluppo di OmegaT.
Introduzione
Gli obiettivi principali di questo articolo sono: avvicinare il lettore al funzionamento della traduzione multiutente in OmegaT, dimostrare le funzionalità più utili per la modalità multiutente e presentare alcuni principi generali del funzionamento di OmegaT, un software open source che può essere utilizzato gratuitamente in configurazione multiutente. Questo software offre soluzioni facilmente accessibili ai professionisti, proprio ora che il telelavoro paradossalmente consente una maggiore collaborazione tra colleghi.
La domanda a cui cercheremo di rispondere è: in che modo lavorare a un progetto multiutente con OmegaT si adatta alle esigenze del traduttore?
OmegaT, un software open source
Evidenziamo ora i vantaggi che il software open source può portare al lavoro collaborativo in generale. La licenza di OmegaT ne consente il libero utilizzo, il che significa che il software è gratuito. I diritti garantiti all'utente sono definiti dettagliatamente nella licenza (GPL, versione 3):
https://en.wikipedia.org/wiki/GNU_General_Public_License
Possiamo riassumere tali diritti come segue:
- la libertà di utilizzare il programma per qualsiasi scopo;
- la libertà di studiare il funzionamento del programma e di adattarlo alle proprie esigenze;
- la libertà di ridistribuire copie del programma (che implica la possibilità sia di dare che di vendere copie);
- la libertà di migliorare il programma e di distribuire gli aggiornamenti al pubblico, a beneficio dell’intera comunità. L’accesso al codice sorgente è condizione per l’esercizio dei diritti 1 e 3.
OmegaT è un CAT tool professionale che esiste da 20 anni e ha beneficiato delle modifiche che la DGT, il governo sudafricano e aziende specializzate in CAT come weLocalize e Kilgray hanno apportato al codice, oltre alle numerose aziende meno conosciute che hanno contribuito al codice e alle caratteristiche del progetto:
https://omegat.org/sponsorship.html
Progetto multiutente: condivisione e integrità dei dati
OmegaT in sé non supporta la condivisione dei dati. Tuttavia, prevede funzionalità che consentono di utilizzare sistemi di condivisione dei dati.
Esistono tre tipi di sistemi di condivisione dei dati:
- sistemi che non controllano l’integrità dei dati quando vi accedono contemporaneamente più utenti (come “DropBox”);
- sistemi che garantiscono l’integrità dei dati limitando l’accesso a un utente alla volta (“database” in modalità client-server);
- sistemi che forniscono una copia dei dati a ciascun utente e sincronizzano le modifiche integrandole regolarmente nella versione originaria, fornendo al contempo un sistema per la gestione di modifiche potenzialmente in conflitto (come i “sistemi di controllo di versione” utilizzati nei progetti di scrittura di codice multi-sviluppatore online).
OmegaT ha scelto la terza opzione per i seguenti motivi:
- i sistemi come “DropBox” non garantiscono l’integrità dei dati ad accesso simultaneo;
- i sistemi di database sono difficili da installare e richiedono conoscenze tecniche avanzate;
- i sistemi di sviluppo collaborativo sono onnipresenti su internet. Non richiedono l’installazione di software aggiuntivi e le conoscenze necessarie per utilizzarli non eccedono quelle di un utente medio di strumenti informatici.
Piattaforma di sviluppo collaborativo “gitea” ospitata dall’associazione April
Progetto multiutente per OmegaT
Questo articolo non copre la parte di configurazione del progetto, che sarà sviluppata in un articolo successivo. Vi presentiamo il progetto multiutente così come ci è stato messo a disposizione per tutta la durata del nostro tirocinio. Questo progetto è disponibile a uso gratuito ma limitato e può essere visualizzato qui:
https://forge.chapril.org/brandelune/documentation_emacs
L’accesso a un progetto multiutente è determinato dalle impostazioni di accesso del sito web in cui sono ospitati i file:
- il progetto può essere invisibile a persone che non sono membri (come per i progetti di un’agenzia di traduzione);
- il progetto può essere visibile al pubblico ma modificabile solo dai membri (come per i progetti di volontariato);
- il progetto può essere visibile al pubblico e modificabile (come per i progetti di prova).
Tutti i progetti in OmegaT (multiutente e locali) sono costituiti da un file “omegat.project” contenente le impostazioni del progetto; una cartella “omegat/” con la memoria di traduzione in formato TMX, condivisa per la lettura e la scrittura; una cartella “glossary/” che contiene il glossario in formato TSV (codificato in UTF-8), anch’esso condiviso per la lettura e la scrittura.
I conflitti di accesso, di scrittura e di altra natura ancora sono interamente gestiti dal sistema “gitea”. OmegaT funge da proxy trasparente tra utente e sistema.
È possibile accedere al progetto multiutente dall’interfaccia del software, che creerà una copia di tutti i file di progetto in locale e autorizzerà una sincronizzazione regolare (di default ogni tre minuti, il che consente di tradurre in modalità "offline" per la sincronizzazione asincrona).
Per lavorare in locale, ogni utente deve avviare il software e fare clic sull’opzione “Scarica progetto in collaborazione” (disponibile nella finestra principale, tramite il menu “Progetto”):
Scarica il progetto in collaborazione
Inserisci l’indirizzo del progetto e la posizione per la copia locale
Ogni partecipante al progetto è autorizzato dal project manager a sovrascrivere i file che si trovano online. Dopo il caricamento, OmegaT chiederà le credenziali di accesso.
Inserire le proprie credenziali di accesso
Ora sarà visibile l’elenco dei file di progetto. Si noti che i file di origine del progetto non sono ospitati sul sito di repository di gestione dei file corrispondente, bensì in un repository separato che si trova nel file “omegat.project” sopra descritto:
https://forge.chapril.org/brandelune/documentation_emacs/src/branch/main/omegat.project
La riga “30” del file indica l’indirizzo del repository, a cui possiamo accedere direttamente:
https://git.sr.ht/~brandelune/emacs_documentation_repository/tree
Una volta visualizzati i file nell’interfaccia di traduzione di OmegaT, è possibile tradurli uno per uno, convalidare la traduzione con “Invio” e, una volta trascorso il tempo di salvataggio impostato, OmegaT sincronizzerà i contenuti tradotti. Il server associato recupererà questo contenuto una volta avvenuta la sincronizzazione. Possibili conflitti (che si verificano quando lo stesso segmento è stato tradotto in due modi diversi tra due sincronizzazioni) vengono visualizzati nell’interfaccia di OmegaT in una finestra in cui viene chiesto all’utente di scegliere tra la propria versione e la versione suggerita nella finestra di sincronizzazione.
Esempio di conflitto quando si aggiunge un segmento
Memorie di traduzione in OmegaT
Memoria di progetto
Per comprendere l’uso delle memorie di traduzione in OmegaT è importante capire cosa sono. Innanzitutto, OmegaT crea automaticamente una memoria di traduzione per ciascun progetto. In altre parole, non è necessario che l’utente crei una memoria e la associ a un progetto. Un progetto OmegaT è una memoria di traduzione, che è al centro del progetto. La memoria è alimentata dal lavoro del traduttore e, nella modalità multiutente, dalle traduzioni sincronizzate dei vari membri del progetto. Come accennato in precedenza, la memoria si trova nella cartella “omegat/”:
https://forge.chapril.org/brandelune/documentation_emacs/src/branch/main/omegat
Tutte le memorie utilizzate da OmegaT sono nel formato standard TMX, che consente l’interoperabilità con altri CAT tool.
Memorie ausiliarie
Un progetto OmegaT è una gerarchia di file in cui esiste, allo stesso livello di “omegat/”, “source/”, “glossary/”, una cartella “tm/” in cui caricare le memorie di riferimento (generalmente in formato TMX, ma anche negli altri formati bilingui supportati da OmegaT come XLIFF, PO, ecc.).
Questa cartella può contenere sottocartelle per migliorare il funzionamento di queste risorse. Alcune di esse hanno caratteristiche specifiche che il traduttore può utilizzare liberamente:
- “tm/auto/” contiene le memorie che il traduttore desidera utilizzare per tutto il progetto come se fosse la memoria predefinita;
- “tm/enforce/” contiene le memorie che hanno la priorità rispetto ai contenuti già salvati nel progetto. I nuovi contenuti sovrascriveranno quindi i contenuti già salvati nella memoria del progetto;
- “tm/mt/” include le memorie che provengono da sistemi di traduzione automatica di cui il traduttore dovrebbe essere specificamente a conoscenza. Tali contenuti verranno visualizzati ed evidenziati in rosso ogni volta che verranno inseriti in un segmento;
- “tm/penalty-010/” contiene le memorie a cui è stata attribuita una penalizzazione pari al numero che segue il trattino (qui 10%);
- “tm/tmx2source/” contiene le memorie che provengono da un documento tradotto in un’altra lingua di arrivo. Il traduttore può quindi vedere la propria traduzione nell’altra lingua di arrivo direttamente sotto il segmento da tradurre.
Per poter essere immediatamente utilizzata all’interno di un progetto, una memoria deve essere copiata nella cartella “tm/”. Allo stesso modo, una memoria deve essere rimossa dalla cartella affinché il suo contenuto non sia parte della memoria di riferimento.
Memorie condivise
Ogni volta che un utente crea un documento di arrivo, OmegaT genera tre file TMX che includono solo segmenti tradotti dei file di partenza in fase di traduzione e mai l’intero contenuto della memoria globale del progetto. Questi tre file hanno le seguenti caratteristiche:
- “[nome del progetto]-omegat.tmx” contiene le traduzioni seguite dai tag utilizzati internamente da OmegaT da riutilizzare in altri progetti di OmegaT;
- “[nome del progetto]-level1.tmx” contiene i dati di tipo TMX 1.4b level 1, ossia solo il testo della traduzione, senza alcun tag;
- “[nome del progetto]-level2.tmx” contiene i dati di tipo TMX 1.4b level1 2, ossia il testo della traduzione con i tag come definiti dallo standard TMX.
https://www.gala-global.org/tmx-14b#SectionIntroduction
Queste memorie possono essere condivise con altri utenti, usate in futuro, ecc.
Glossari
Come avviene in altri CAT tool, OmegaT utilizza non solo memorie di traduzione ma anche glossari.
All’interno della cartella “glossary/” di un progetto condiviso, ogni componente del team di traduttori può aggiungere un proprio glossario, ossia un file di testo in formato TSV (Tab Separated Values) con codifica UTF-8.
L’utente deve semplicemente creare un file di testo (con estensione .txt) per poterlo caricare nel programma. Se desidera inserire o aggiungere un nuovo termine, dovrà tener conto dei seguenti elementi, delimitati da tabulazioni:
- termine di partenza (es.: and so on);
- termine di arrivo (es.: et ainsi de suite);
- note (es.: idiomatic expression to keep).
Glossario aperto con un editor di testo
Si può accedere direttamente ai glossari in due modi:
- cliccando su “Progetto” > “Accedi al contenuto del progetto” > “Glossario modificabile”;
- cliccando sull’ingranaggio nell’angolo in alto a destra della finestra “Glossari” (se aperta durante la traduzione).
Le modifiche apportate sono visibili all’interno del progetto non appena vengono salvate dall’editor di testo.
L’interfaccia di OmegaT permette di aggiungere direttamente i termini attraverso il menu “Modifica > Crea voce di glossario”, senza dover ricorrere a un editor di testo. Queste voci vengono aggiunte al glossario modificabile del progetto, che sarà sincronizzato nel progetto multiutente.
Glossario aperto in OmegaT
Comunicare tra membri del progetto con le note sincronizzate
Il “Blocco note” in OmegaT è utile per molti scopi: uno di questi è la correzione di bozze. Ogni utente può aggiungere note ad uno specifico segmento di testo per fornire indicazioni varie sugli elementi da correggere, oppure osservazioni e consigli relativi al glossario o alla coerenza della traduzione. Si tratta infatti dello strumento fondamentale dei correttori di bozze.
Finestra “Blocco note” contenente una nota relativa al segmento attivo
Le note di OmegaT fanno parte della TMX standard:
https://www.gala-global.org/tmx-14b#note
Il contenuto delle note viene poi sincronizzato nei progetti multiutente e consente la comunicazione tra i componenti del team.
Attraverso il menu “Vista”, OmegaT può segnalare i segmenti a cui sono state aggiunte note grazie alla funzione “Evidenzia i segmenti con note” (che vengono evidenziati in azzurro). In questo modo i segmenti vengono facilmente identificati nella finestra principale della traduzione:
Segmenti con note riconoscibili tra i segmenti tradotti
Ѐ possibile effettuare una ricerca a partire dal contenuto delle note per visualizzare i segmenti relativi e poterci lavorare.
Strumenti per l’assicurazione di qualità (QA)
In OmegaT sono presenti vari strumenti per il controllo della qualità e la revisione. Altri articoli, in francese, se ne sono già occupati:
- Gli script sono spiegati nel dettaglio da Lilian FAEDI: https://lilianfaedi.wixsite.com/my-site/post/relecture-et-la-r%C3%A9vision-dans-omegat-les-scripts;
- Il controllo ortografico e la funzione di revisione che evidenzia gli errori presenti nel documento corrente sono illustrati da Ismaël GARIN: https://igtraduction.blogspot.com/2022/04/les-outils-de-choix-pour-relire-et.html.
Lavoro di gruppo in un progetto multiutente
Un progetto multiutente ha lo scopo di suddividere i compiti tra i componenti del team che lavorano a un progetto condiviso.
Ogni componente viene identificato con il nome con cui ha effettuato l’accesso alle impostazioni di OmegaT. Lo user ID dei membri viene salvato in ogni segmento della memoria TMX attraverso un codice data-ora ogni volta che si crea un nuovo segmento o se ne modifica uno già esistente.
https://forge.chapril.org/brandelune/documentation_emacs/src/branch/main/omegat/project_save.tmx#L43
OmegaT non permette l’assegnazione di ruoli, ma offre un numero sufficiente di funzioni specifiche affinché i componenti di un dato progetto possano suddividersi i compiti autonomamente. Per esempio, un team di traduzione potrebbe avere:
- un componente che traduce il documento;
- un componente che si occupa della revisione, possibilmente entro una decina di minuti;
- un componente che esegue una correzione globale per la standardizzazione dei contenuti (glossario, riferimenti, ecc.);
- un componente che crea un file sorgente atto alla correzione di bozze, in vista della creazione del formato finale, così da poter apportare le modifiche al progetto.
La funzione di ricerca è estremamente efficace e può cercare nomi, date, contenuti (con o senza espressioni regolari), sia nel testo di partenza che in quello di arrivo. In questo modo è possibile individuare facilmente i segmenti tradotti da un membro in due momenti distinti.
La maschera di ricerca può filtrare i segmenti trovati per obbligare OmegaT a visualizzare solo quelli presenti nell’editor.
Conclusioni
Nel presente articolo vengono mostrate le funzionalità multiutente che fanno di OmegaT uno strumento di alto livello per progetti di traduzione complessi. La sincronizzazione permette l’uso di siti web di sviluppo collaborativo che forniscono all’utente (e a tutto il team di traduzione) l’accesso a tutti gli elementi di un progetto, così da mantenerli continuamente aggiornati. Le memorie di traduzione sincronizzate sono ciò che rende OmegaT così utile per i progetti multiutente condivisi. Grazie ai glossari condivisi, alle note e ad altri strumenti per l’assicurazione della qualità, la traduzione non è mai stata così semplice, e lo strumento consente anche di svolgere attività di verifica dei contenuti.
Dettagli
- Data di pubblicazione
- 10 maggio 2022
- Lingua
- inglese
- francese
- Categoria EMT
- Tecnologie della traduzione