Come tradurre un manuale tecnico scritto in LaTeX

Come tradurre un manuale tecnico scritto in LaTeX

Qualche tempo fa ho collaborato con uno studio d’ingegneria alla traduzione di un manuale d'istruzioni di un macchinario industriale. L’originale in italiano era stato redatto in LaTeX. Quello che segue è uno sguardo alle procedure che abbiamo utilizzato per consegnare un file tradotto pronto per la stampa, senza la necessità di riformattare la traduzione.

Per chi non lo sapesse, LaTeX è un linguaggio di markup usato per la preparazione di testi complessi. Questo linguaggio si basa sul programma di tipografia digitale TEX, creato nel 1978 da Donald Knuth, un celebre studioso e professore d'informatica degli Stati Uniti. Una curiosità: la pronuncia esatta è /latek/ e non /latecs/, perché poiché il nome TEX deriva dalla radice della parola greca τέχνη, (techne) che significa arte, tecnica, tecnologia. La X presente nel nome è dunque la lettera greca “chi” maiuscola (Χ) la cui grafia si confonde con quella della “ics” dell’alfabeto latino.

LaTeX è usato principalmente per la redazione di testi matematici e scientifici, poiché consente un’estrema precisione nell’impaginazione, oltre a disporre di numerose funzioni di DTP automatizzabili e soprattutto perché permette di ottenere diversi formati di presentazione da un unico formato di partenza (si può generare un PDF, HTML, un file di OpenOffice, ecc.) Inoltre è distribuito come software libero ed è disponibile per qualsiasi sistema operativo.

A dir il vero, in 14 anni di carriera come traduttore tecnico non mi sono imbattuto spesso in clienti che richiedono traduzioni da questo formato. Nonostante la sua diffusione nel settore dell’ingegneria e della ricerca scientifica, i committenti di solito preferiscono spedire una copia in PDF del documento pubblicato e far tradurre quello. E d’altro canto i fornitori di traduzioni in grado di lavorare direttamente su file LaTeX non sono numerosi, e ancor meno lo sono i committenti consapevoli che ciò è possibile. In realtà il procedimento di traduzione è di una banalità sconcertante, a patto di usare lo strumento giusto.

Prima di addentrarci nella descrizione del processo, due parole sul formato in sé. I file LaTeX sono file di testo semplice che seguono una formattazione particolare, con etichette e codici di controllo. A colpo d’occhio non è sempre facilissimo distinguere quali parti costituiscono il contenuto traducibile e quali no. Bisogna aggiungere che normalmente un manuale complesso non è formato da un solo file TEX, ma da una struttura di cartelle in cui sono annidati diversi file, oltre alle corrispondenti illustrazioni (nei formati standard, PNG, JPEG, ecc.)

Che strategia seguire dunque? Essendo i TEX file di testo, c’è sempre l’opzione di aprire i file che costituiscono il manuale con un editor di testo, possibilmente uno avanzato (come Notepad++ o simili) e tradurli uno alla volta. Tuttavia, per garantire maggiore uniformità, per non tradurre due volte i testi ripetuti (sempre abbondanti nei manuali tecnici) e per tradurre tutti i singoli file in un colpo solo, è consigliabile utilizzare uno strumento di traduzione assistita. A questo scopo, bisogna trovare prima il modo di distinguere le sole parti traducibili dal resto del testo, pur mantenendo intatto il formato di ogni file e la struttura della directory in cui sono ubicati.

Per quanto ne so, esistono solo due strumenti in grado di farlo: Tortoise Tagger (in combinazione con un qualsiasi CAT tool compatibile) e OmegaT. La serie di macro di Microsoft Word chiamata Tortoise Tagger consente di bloccare tutte le parti di codice LaTeX esponendo soltanto il testo traducibile. In un secondo momento si può usare uno strumento di traduzione assistita in grado di elaborare file Word o RTF con etichette di Trados, come appunto Trados, Wordfast o memoQ. In alternativa, ed è la scelta che consigliamo, si può usare OmegaT, uno strumento di traduzione assistita gratuito e open source, che legge direttamente i file TEX. Vediamo entrambi i procedimenti nei dettagli.

Tortoise Tagger, sviluppato da Aleksandr Okunev nel 2004, è un template gratuito di Word che legge stringhe di testo e comandi contenuti in appositi file di testo creati dall’utente. Alcuni di questi file, detti taglist, sono messi a disposizione dall’autore del programma. Fra questi si trova la taglist per LaTeX. Questo elenco, tuttavia, può non contenere tutti i codici usati dal redattore del manuale da tradurre e potrebbe essere necessario integrarla. Lo scopo del programma è quello di etichettare i documenti provenienti da altri sistemi contrassegnando il testo non traducibile con due stili di Word, considerati standard nel settore delle traduzioni: tw4winExternal e tw4winInternal, che identificano rispettivamente le parti di testo che devono essere lasciate all’esterno del testo traducibile e quelle che possono invece comparire all’interno dello stesso. Queste parti etichettate risulteranno bloccate nei programmi di traduzione assistita più comuni, impedendo di fatto al traduttore di corrompere il contenuto del file TEX originale. Il procedimento, spiegato con maggiori dettagli nella documentazione di Tortoise Tagger, è il seguente:

  1. Avviare Microsoft Word.
  2. Aprire il file .tex o la cartella in cui sono contenuti.
  3. Attivare Tortoise Tagger ed etichettare il file.
  4. Salvare il file in formato RTF.

A questo punto si può avviare il proprio programma di traduzione assistita e tradurre il file RTF etichettato. Al termine della fase di traduzione e revisione si dovrà:

  1. Avviare Microsoft Word.
  2. Salvare il file (o i file) in formato solo testo.
  3. Rinominare tutto con la stessa estensione dell’originale (di solito .tex)

Con OmegaT il procedimento è senz’altro più semplice. Questo programma è infatti in grado di aprire direttamente i file in formato .tex e .latex senza ulteriori conversioni. Dalla versione 2.3.0 preserva anche le linee commentate all’interno del codice LaTeX, che spesso contengono informazioni utili a chi deve pubblicare il manuale. Il flusso di lavoro è quello standard di ogni progetto realizzato con OmegaT:

  1. Avviare OmegaT.
  2. Creare un nuovo progetto.
  3. Importare i file .tex o .latex nella cartella /source/, oppure indicare al programma la cartella radice che contiene tutte le sottocartelle del manuale.
  4. Tradurre.
  5. Creare i file d’arrivo.

Tutto qua. Nella finestra dell’editor di OmegaT verrà visualizzato solo il testo traducibile e tutto il codice sarà occulto. Solo gli eventuali tag interni saranno visualizzati con il consueto formato, cosicché il lavoro del traduttore sarà molto più agevole.

A prescindere dal procedimento seguito, l’ultimo passaggio è la revisione del risultato finale. Dopo una renderizzazione del manuale in PDF (o in qualunque altro formato desiderato), se si riscontrassero errori è buona norma correggerli direttamente in un ambiente di modifica LaTeX, per esempio con LEd oppure con MiKTeX. A questo punto si procede a una seconda “stampa” in PDF. Naturalmente, si tratta di un processo iterativo, ovvero va ripetuto dopo ogni eventuale modifica sul codice.

Per completezza va citato anche il programma po4a, disponibile per Linux. Si tratta di un modulo scritto in Perl che consente di convertire formati diversi di file (fra cui LaTeX) nel formato PO e dal PO tradotto al formato originale. Lo si trova su http://po4a.alioth.debian.org. La documentazione, in inglese, è molto completa e si rimanda ad essa per ulteriori dettagli.

Qabiria white logo

Crediamo nell’aumento della produttività attraverso l’uso creativo della tecnologia.

Ultime notizie

Contatti

Qabiria Studio SLNE
Carrer Lleida, 3 1-2
08912 Badalona
(Barcelona)
SPAGNA

+34 675 800 826

qabiria

Inviaci un messaggio

Ricevi la newsletter

Vuoi leggere gli articoli e le novità di Qabiria direttamente nella posta?