Il ruolo degli standard nell'evoluzione delle tecnologie del linguaggio e della traduzione

Il ruolo degli standard nell'evoluzione delle tecnologie del linguaggio e della traduzione

Questo articolo illustra gli standard più comuni nel settore linguistico e della traduzione, e come possono influenzare positivamente l’evoluzione delle tecnologie del linguaggio e della traduzione. Nella prima parte, verranno analizzati brevemente i tre principali tipi di standard e si vedrà come intervengono nei processi di traduzione e localizzazione. Nella seconda parte, verrà presa in considerazione la misura in cui tali standard vengono applicati dagli sviluppatori di software e dai fornitori di servizi linguistici (LSP) durante i flussi di lavoro. Infine, verranno esposte alcune riflessioni su come la standardizzazione e l’interoperabilità siano in grado di migliorare la qualità delle interazioni nel mercato dei servizi linguistici

Introduzione

Come affermato dall’Istituto Europeo per gli Standard nelle Telecomunicazioni (ETSI), l’obiettivo principale della standardizzazione è quello di consentire agli acquirenti l’interoperabilità e la libertà di scelta in un contesto di fornitori, reti e servizi multipli. Gli LSP in particolare devono necessariamente fare in modo che i loro servizi, sempre più richiesti, soddisfino almeno alcuni degli standard unificati del settore.

I fornitori di servizi linguistici si occupano principalmente di file di testo, dunque gli standard del settore dovrebbero incentrarsi sul testo e sulla sua rappresentazione digitale. In effetti, l’interoperabilità nel settore linguistico dovrebbe fondamentalmente consentire di creare ed elaborare documenti in ambienti diversi e trasferirli con mezzi diversi senza che perdano le loro proprietà. Finora, questo non è stato sempre possibile, dal momento che le politiche dei leader del mercato hanno spesso ostacolato l’interoperabilità degli strumenti a disposizione. Tuttavia, negli ultimi quindici anni c’è stato un impegno crescente in questa direzione e gli standard stanno iniziando a svolgere un ruolo costruttivo nell’evoluzione delle tecnologie linguistiche.

Per maggiore chiarezza, questo articolo prenderà in esame tre gruppi principali di standard che riguardano direttamente il settore della traduzione:

  1. Standard di codifica dei caratteri
  2. Formati dei file
  3. Standard di processo

Standard di codifica dei caratteri

Gli standard di codifica dei caratteri stabiliscono il modo in cui un testo si presenta sotto forma di codice digitale, per poter essere trasmesso da un sistema informatico a un altro. Esistono vari set di caratteri, ma solo alcuni di essi sono universalmente supportati. Pertanto l’uso di set di caratteri non standard può produrre testi non decifrabili quando i documenti vengono trasferiti da un sistema all’altro. Il classico risultato è un testo visualizzato male, caotico, pieno di punti interrogativi, quadratini e altri simboli.

Il problema si pone soprattutto nel caso di testi multilingue in cui devono coesistere differenti alfabeti o persino lettere e ideogrammi. Un glossario russo-inglese, per esempio, dovrebbe essere codificato in modo tale che sia l’alfabeto cirillico che quello latino siano leggibili da qualsiasi computer, indipendentemente dalla configurazione del sistema locale. Una soluzione a questo problema è l’uso dello standard Unicode che fornisce un numero univoco per ogni singolo carattere o ideogramma di quasi tutte le lingue scritte. UTF-8 e UTF-16 sono due set di caratteri basati su Unicode tra i più completi e diffusi. La capacità di Unicode di rappresentare e gestire testi espressi nella maggior parte dei sistemi di scrittura del mondo ne ha determinato l’ampio utilizzo in pagine web e, dunque, anche nel settore dei servizi linguistici.

Formati dei file

I formati dei file definiscono la struttura interna dei file stessi, in modo che vengano caricati, aperti, elaborati e salvati correttamente dall’applicazione adeguata. Le aziende dovrebbero utilizzare formati standard per i file scritti che contengono informazioni di vitale importanza, così da mantenere sempre la proprietà di tali informazioni. Al contrario, se vi sono solo una o poche applicazioni commerciali a disposizione delle imprese per l’elaborazione e la traduzione dei loro documenti, viene a crearsi un rapporto di dipendenza rischioso. Oltre a non aderire agli standard, la software house che vende l’applicazione può costringere gli acquirenti a effettuare aggiornamenti che ne impediscono la compatibilità con versioni precedenti. Può anche succedere che l’azienda smetta di sviluppare l’applicazione o, peggio ancora, che arrivi alla totale chiusura dell’attività e lasci gli utenti senza aggiornamenti né supporto.

Sin dai tempi delle schede perforate, gli utenti finali sono stati spesso testimoni di queste pratiche di “vendor lock-in” da parte delle principali società di software che cercano così di ottenere o mantenere la loro quota di mercato, noncuranti della qualità dei prodotti offerti. Di fatto è stata la mancanza di standard comuni per elaboratori di testo a causare una sofferta migrazione di massa degli utenti da WordPerfect a Microsoft Word quando, a metà degli anni Novanta, Windows ha sostituito il DOS come principale sistema operativo.

La nicchia dei servizi linguistici non fa assolutamente eccezione con SDL Trados come attuale leader di mercato e standard di fatto, anche se è ben lungi dall’essere il miglior software di traduzione, almeno in termini di compatibilità. Anzitutto si basa sulla tecnologia .NET di Microsoft, perciò esclude gli utenti di Mac e Linux. Inoltre, non permette che le versioni precedenti aprano file creati da versioni successive e la sua interfaccia ingombrante e caotica, reminiscenza dei primi anni ’90, è stata migliorata solo di recente. Ancora più rilevante è il fatto che nel passato abbia dimostrato di trattare i suoi utenti paganti come beta tester, per esempio nel settembre 2011 rilasciò una versione della sua suite Studio 2011 non ancora esente da errori e, solo tre mesi dopo, fece uscire il primo Service Pack da ben 347 Mb.

Nel settore della traduzione la standardizzazione dei formati di file è particolarmente necessaria per i diversi file di testo con etichette, che di solito sono dei sottoprodotti intermedi e ausiliari del processo di traduzione, quando esso viene realizzato utilizzando uno strumento di traduzione assistita dal computer (CAT). In genere gli strumenti CAT sono in grado di elaborare almeno tre tipi di file: memorie di traduzione, testi bilingui e database terminologici. Se la struttura interna di tali file segue specifiche comuni, espressamente destinate alla loro condivisione in ambienti differenti, la documentazione multilingue di un’azienda non dipenderà soltanto da uno o da pochi fornitori.

Alcuni degli standard, progettati specificamente per il processo di localizzazione, erano regolati dalla Localization Industry Standards Association (LISA), fino al suo scioglimento, avvenuto il 28 febbraio 2011. Più tardi, quello stesso anno, ETSI diede avvio a un gruppo di interesse speciale per la localizzazione (LIS) che intendeva avanzare nello sviluppo degli standard TBX, TMX, SRX, GMX-V e xml:tm, senza tuttavia aver portato progressi di rilievo in questa direzione finora.

Memorie di traduzione

Le memorie di traduzione sono di solito file di tipo database che contengono i testi precedentemente tradotti, indicazioni sulla loro formattazione e altre proprietà. Alcune delle proprietà sono definite di default (ad esempio lingua di origine e di arrivo, data, ora, ID della persona o software che ha svolto la traduzione, ecc.), mentre altri possono essere aggiunti come attributi personalizzati. Ogni strumento CAT ha il suo modo di archiviare le memorie di traduzione, ma per tutti i fornitori di servizi linguistici è estremamente importante condividere le memorie di traduzione per poter svolgere le loro attività. Translation Memory eXchange (TMX) è un formato basato su XML che permette di rappresentare la struttura del database ed è stato progettato per lo scambio di memorie di traduzione tra differenti strumenti CAT. Anche in questo caso lo sviluppo si è interrotto diversi anni fa, quando è stata proposta la versione 2.0 delle specifiche, che non è mai stata implementata.

File bilingui

Qualunque sia il formato del file di origine, nella maggior parte dei casi, la traduzione e i relativi processi hanno come sottoprodotto dei file testuali che riportano al loro interno l’estrazione del testo, tag e segnaposto per mantenere il layout di stampa o la visualizzazione originale. Tali file sono detti bilingui perché in essi coesistono le frasi del testo originale e la relativa traduzione in parallelo. Il formato XML Localisation Interchange File Format (XLIFF) fornisce una struttura unificata per i documenti bilingui. Il formato XLIFF viene utilizzato come “ponte” che conferisce la struttura adeguata al testo estratto. Gli elementi e gli attributi specifici del formato stesso servono per definire le proprietà di ogni coppia di segmenti (originale e traduzione), come la lingua di partenza e di arrivo, lo strumento di estrazione, ecc. A differenza dei formati di cui sopra, lo standard XLIFF è stato sviluppato dal consorzio OASIS. L’ultima versione è la 2.0, rilasciata nel 2014.

Anche Portable Object (PO) di Gettext è un formato multilingue ed è specificamente progettato per il settore della localizzazione di software. I file PO hanno una struttura molto semplice, priva di attributi particolari,  di solito visualizzata in colonne con le stringhe da tradurre a sinistra e la relativa traduzione a destra.

Database terminologici

Term-Base eXchange (TBX), Universal Terminology eXchange (UTX) e Open Lexicon Interchange Format (OLIF) sono tre formati basati su XML specificamente progettati per i dati terminologici e lessicali. Tutti e tre possono contenere glossari, sia per la traduzione umana che per quella automatica. Immagazzinano coppie di termini della lingua di partenza e di arrivo, oltre a ulteriori dati terminologici come la funzione grammaticale, il genere, il numero e informazioni lessicali più dettagliate.

Altri tipi di file

Esistono altri tipi di file che hanno un loro standard e che intervengono nel processo di traduzione assistita in questo modo:

Il formato Segmentation Rules eXchange (SRX) si utilizza per definire regole di segmentazione. La segmentazione è l’operazione che consente di dividere il testo in parti, chiamate segmenti, traducibili una per una. Quando un programma deve segmentare un documento, occorrono regole per determinare dove termina un segmento e inizia quello successivo. Nella maggior parte dei casi è il punto fermo che determina la fine del segmento, tranne quando il punto è inserito all’interno di un indirizzo Internet o di acronimi, per esempio.

Global information management Metrics eXchange (GMX) è un insieme di standard finalizzati a fornire mezzi comuni per misurare gli aspetti quantitativi di un documento, come il numero di parole, la complessità, ecc. Quando un’agenzia di traduzioni riceve un incarico, è necessario stimare tutto il lavoro di traduzione al fine di fare un preventivo del progetto. I preventivi di traduzione per uno stesso testo possono variare molto, dal momento che ogni agenzia di traduzione misura la complessità e la lunghezza di un testo in modo diverso. Con lo sviluppo e l’integrazione di standard GMX, il settore della traduzione beneficerà di parametri verificabili e definiti che si applicano ai documenti di testo.

Standard di processo

La crescita del mercato della traduzione negli ultimi quindici anni ha creato un grande bisogno di sviluppare standard di qualità per i servizi di traduzione. Da un lato, la domanda aumenta per via del crescente volume di informazione scritta e del numero di clienti che, per lo più, non hanno familiarità con concetti come localizzazione, internazionalizzazione e globalizzazione. D’altra parte, grazie a Internet, è ora più facile che mai avviare e gestire una società di traduzione con investimenti modesti. Infatti il mercato è affollato di nuovi fornitori privi di esperienza.

Di conseguenza, i governi e altre istituzioni come le associazioni di traduzione hanno promosso l’introduzione di standard di qualità per descrivere formalmente tutti i passaggi necessari a fornire un servizio di traduzione soddisfacente. Qualunque sia il prodotto finale, un contratto commerciale, i sottotitoli di un documentario, un catalogo prodotti, un sito web multilingue, ecc., la standardizzazione va a tutto vantaggio degli utenti finali in quanto fornisce un quadro di riferimento, basato su criteri riconosciuti e imparziali, attraverso il quale valutare la loro esperienza con i fornitori di servizi linguistici.

Poiché è molto difficile concordare un modo per definire e misurare la qualità delle traduzioni scritte, gli standard di processo si incentrano principalmente sulla qualità complessiva di un flusso di lavoro di traduzione tradizionale, a partire dalla richiesta del servizio sino alla consegna del prodotto. Infatti, non forniscono criteri specifici per la traduzione o la qualità del progetto, in quanto sono aspetti molto soggettivi. Piuttosto stabiliscono i parametri che gli LSP dovrebbero prendere in considerazione prima di iniziare un progetto di traduzione (risorse umane, analisi del progetto e preventivo, specifiche del cliente e comunicazione), durante la sua esecuzione (gestione della terminologia, traduzione, editing, formattazione, correzione delle bozze e controllo qualità) e dopo la consegna (manutenzione delle memorie di traduzione e monitoraggio dei feedback).

A differenza dei produttori e dei fornitori di servizi che hanno a disposizione l’ISO 9001 come principale certificazione internazionale, fino al 2015 le migliori prassi nel settore della traduzione erano definite da diversi standard di qualità, a seconda della posizione geografica. In Europa, la norma UNI 10574:1996 prima e successivamente la UNI EN 15038:2006 si proponevano di unificare la terminologia delle attività di traduzione, così come la definizione di buone prassi per il rapporto acquirente-venditore. In Nord America, la Canada’s Language Industry Association (AILIA) ha contribuito allo sviluppo dello standard nazionale del Canada per i servizi di traduzione CAN/CGSB 131.10-2008, conforme allo standard europeo. Negli Stati Uniti, l’associazione di traduttori ATA ha approvato la ASTM F2575 Standard Guide for Quality Assurance in Translation, che stabilisce i parametri di garanzia della qualità nella traduzione. Nel 2015 è stata introdotta la norma ISO 17100, che è valida a livello mondiale e finalmente stablisce i requisiti per la fornitura di servizi di traduzione di qualità su scala internazionale.

Conclusioni

La standardizzazione ha molti nemici nel settore della traduzione. Una prova di questo è che un organo orientato alle telecomunicazioni come l’ETSI fu l’unico a farsi avanti per continuare a sviluppare i formati standard rilasciati da LISA fino a quel momento, al posto degli stessi stakeholder del settore attraverso le loro numerose organizzazioni come EUATC, FIT, GALA, ELIA, ecc., che sembrano mancare di volontà per concordare un insieme unificato di standard. Infatti finora il settore linguistico ha subito l’evoluzione della tecnologia in modo passivo, invece di crescere con essa e orientarne lo sviluppo. Inoltre, c’è molto poca coerenza poiché l’iniziativa è in mano a un piccolo gruppo di organizzazioni. Senza contare che le pratiche di “vendor lock-in” da parte degli sviluppatori di software costituiscono una minaccia per il libero mercato.

Tuttavia, gli standard stanno già giocando e giocheranno in futuro un ruolo decisivo nel settore della documentazione e della traduzione, e la loro progressiva introduzione sarà la chiave per l’evoluzione tecnologica della traduzione. Anche se ancora non coprono tutti gli aspetti dei servizi di traduzione, gli standard forniscono un quadro accettato e accettabile per l’implementazione di processi di migliore qualità a tutti i livelli. Dal momento che contribuiscono a migliorare la gestione della traduzione in generale, tutti gli stakeholder, gli sviluppatori di software, i fornitori di servizi linguistici e i clienti finali, hanno la responsabilità di sostenere la standardizzazione e migliorare l’interoperabilità.

In realtà, molti sviluppatori di software stanno adottando standard di settore per avere un modello di progettazione di programmi compatibili. Di conseguenza, i fornitori di servizi linguistici di qualsiasi dimensione possono eludere le restrizioni del software commerciale. D’altra parte, mediante l’applicazione di standard di processo, gli LSP possono scegliere i loro fornitori di traduzione in base alle loro reali qualifiche, dato che aver acquistato una certa licenza software non dovrebbe essere una condizione necessaria per la scelta di un fornitore di servizi linguistici.

Ancora più importante: i clienti possono beneficiare di una maggiore trasparenza nel mercato della traduzione, a prescindere dal ruolo che ciascuna parte ricopre, e di una migliore comunicazione con i fornitori di servizi linguistici per stabilire specifiche prive di difetti. In altre parole, gli standard aiutano i clienti a ottenere il miglior servizio di traduzione perché promuovono la concorrenza e li facilitano nella scelta del fornitore di servizi linguistici più adatto a soddisfare le loro esigenze. Dunque gli stessi clienti dovrebbero impegnarsi ad assumere fornitori che rispettano gli standard.

Qabiria white logo

Crediamo nell’aumento della produttività attraverso l’uso creativo della tecnologia.

il traduttore insostituibile

Ultime notizie

Contatti

Qabiria Studio SLNE
Carrer Lleida, 3 1-2
08912 Badalona
(Barcelona)
SPAGNA

+34 675 800 826

qabiria

Inviaci un messaggio

Ricevi la newsletter

Vuoi leggere gli articoli e le novità di Qabiria direttamente nella posta?