Normas o estándares en la tecnología de la traducción

Normas o estándares en la tecnología de la traducción

Resumen

En este artículo haremos un esbozo de los estándares más utilizados en el sector lingüístico y de la traducción y de cómo pueden influir positivamente en la evolución de las tecnologías del lenguaje y la traducción. En la primera parte, analizaremos brevemente los tres tipos principales de normas y el modo en que encajan en los procesos de traducción y localización. En la segunda parte, examinaremos el grado en que estas normas son implementadas por los desarrolladores de software y proveedores de servicios lingüísticos en sus flujos de trabajo. Por último, haremos una pequeña reflexión sobre cómo puede mejorar la calidad de las interacciones en el mercado de servicios lingüísticos gracias a la normalización (o estandarización) y la interoperabilidad

Introducción

Según lo declarado por el Instituto Europeo de Normas de Telecomunicaciones (ETSI), el objetivo principal de la normalización es permitir la interoperabilidad y la libertad de elección a los compradores en un contexto de múltiples proveedores, redes y servicios. En particular, si existe algún colectivo que no pueda darse el lujo de permitir que sus servicios, cada vez más demandados, no cumplan con al menos algunos estándares unificados del sector es el de los proveedores de servicios lingüísticos (PSL).

Los PSL se ocupan, principalmente, de los archivos de texto, por lo que los estándares del sector deberían centrarse en el texto y su representación digital. De hecho, sería de esperar que la interoperabilidad en el sector lingüístico permitiera crear y procesar documentos de manera básica en diferentes entornos y transferirlos por diferentes medios sin perder ninguna propiedad. Pero esto no ha sido siempre posible, ya que las políticas de los líderes del mercado se interponían en el camino de la interoperabilidad con frecuencia. Sin embargo, en la última década ha habido un creciente esfuerzo en esa dirección y las normas comienzan a desempeñar un papel constructivo en la evolución de las tecnologías de la lengua.

Para mayor claridad, en el artículo examinaremos tres bloques principales de los estándares que afectan directamente al sector de la traducción:

  1. Normas de codificación de caracteres
  2. Formatos de archivo
  3. Normas de procesos

Normas de codificación de caracteres

Las normas de codificación de caracteres indican cómo hay que representar un texto según un código digital subyacente, con el fin de enviarlo de un sistema informático a otro. Hay una gran cantidad de conjuntos de caracteres diferentes, pero pocos de ellos son universalmente compatibles, razón por la que el uso de grupos de caracteres al margen del estándar puede dar lugar a textos ilegibles cuando los documentos son transferidos de un sistema a otro. El resultado típico es un texto que no termina de visualizarse bien, distorsionado, con signos de interrogación, cuadraditos y otros caracteres extraños.

Sobre todo, resulta un problema en el caso de textos en varios idiomas, en los que deben coexistir diferentes alfabetos o incluso letras e ideogramas. En un glosario ruso-inglés, por ejemplo, lo ideal sería que la codificación fuera de tal manera que tanto el alfabeto cirílico como el latino puedieran ser leídos por cualquier ordenador, independientemente de la configuración regional del sistema. Una solución a este problema es el uso del estándar Unicode, que proporciona un punto de código único para cada carácter o ideograma de casi todas las lenguas escritas. UTF-8 y UTF-16 son dos de los conjuntos de caracteres más completos y generalizados basados en Unicode. La capacidad de Unicode para representar y manipular textos expresados en la mayoría de los sistemas de escritura del mundo ha determinado su gran acogida en páginas web y, por tanto, también en el sector de servicios lingüísticos.

Formatos de archivo

Los formatos de archivo definen la estructura interna de los archivos, para que la aplicación de software adecuada los cargue, abra, procese y guarde correctamente. Si las empresas, por ejemplo, hacen uso de formatos estándares en los archivos escritos que contengan información vital, podrán mantener la propiedad de dicha información en todo momento. Por el contrario, si solo hay una o alguna aplicación comercial disponible para que las empresas elaboren y traduzcan su documentación, aparece una relación de dependencia arriesgada. Además de no adherirse a las normas, la empresa de software que vende la aplicación, quizás obligue a los compradores a actualizar impidiendo la compatibilidad con versiones anteriores. Puede que incluso abandone la aplicación, o peor aún, cierre su negocio por completo y deje a los usuarios sin actualizaciones ni apoyo.

Desde los días de las tarjetas perforadas hasta la actualidad, los usuarios finales han sido testigo de muchas de estas prácticas de «bloqueo» por parte de los principales fabricantes de software con el fin de ganar o mantener su cuota de mercado, independientemente de la calidad de sus productos. De hecho, fue la falta de normas comunes para procesadores de texto lo que provocó una sentida migración en masa de los usuarios de WordPerfect a Microsoft Word a mediados de 1990, cuando Windows estaba implantando DOS como sistema operativo principal.

El nicho de la lengua no es ninguna excepción con SDL Trados como líder del mercado y estándar de facto a día de hoy, pero lejos de ser el mejor software de traducción, al menos en términos de compatibilidad. Para empezar, se basa en la tecnología .NET de Microsoft, por lo que deja de lado a los usuarios de Mac y Linux. Para continuar, no permite que las versiones anteriores abran archivos creados por versiones posteriores, y, hasta hace poco, la interfaz era engorrosa y desordenada (recordaba a principios de 1990). Lo más importante es que han demostrado tratar a sus usuarios de pago como probadores beta en varias ocasiones, como en septiembre de 2011, cuando lanzaron una versión del conjunto de aplicaciones de Studio 2011 con errores, seguida del primer Service Pack, de 347 Mb, tan solo tres meses después.

En el sector de la traducción, la normalización de los formatos de archivo es especialmente necesaria para los diferentes archivos de texto etiquetado, que suelen ser subproductos intermedios y auxiliares del proceso de traducción si este se realiza mediante una herramienta de traducción asistida por ordenador (TAO). Por lo general, las herramientas TAO suelen procesar al menos tres tipos de archivo: memorias de traducción, textos bilingües y bases terminológicas. Si la estructura interna de este tipo de archivos sigue las especificaciones compartidas que están expresamente destinadas a ser compartidas dentro de diferentes entornos, la documentación multilingüe de una empresa no depende solamente de uno o algunos proveedores.

Algunos de los estándares, diseñados específicamente para el proceso de localización, los regulaba la asociación de estándares de la industria de la localización LISA (Localization Industry Standards Association) hasta su desaparición el 28 de febrero de 2011. Más tarde ese mismo año, el ETSI inició un grupo de interés especial para la localización (LIS) que actualmente trabaja en los estándares TBX, TMX, SRX, GMX-V y xml:tm.

Memorias de traducción

Las memorias de traducción son, por lo general, grandes archivos de bases de datos que contienen textos previamente traducidos, su formato y otras propiedades. Algunas de las propiedades están definidas por defecto (por ejemplo, fuente y lengua de destino, fecha, hora, identificación de la persona o el software que realiza la traducción, etc.), mientras que se puede añadir otras como atributos personalizados. Cada herramienta TAO tiene su manera de almacenar las memorias de traducción, pero para todos los proveedores de servicios lingüísticos es extremadamente importante compartir memorias de traducción para realizar sus tareas. Translation Memory eXchange (TMX) es un formato basado en XML que permite representar la estructura de bases de datos, diseñado para el intercambio de memorias de traducción entre diferentes herramientas de traducción.

Archivos bilingües

Sea cual sea el formato del archivo de origen, en la mayoría de los casos, la traducción y los procesos que la engloban se llevan a cabo en las extracciones de texto que incluyen etiquetas y marcadores de posición para mantener el diseño de impresión o de visualización originales. También contienen las frases del texto original y su correspondiente traducción en paralelo. El formato XML Localisation Interchange File Format (XLIFF) proporciona una estructura unificada para documentos bilingües. XLIFF se usa como un formato «puente» que da al texto extraído la estructura apropiada. Los elementos y atributos específicos proporcionan los medios para definir las propiedades de cada pareja de segmentos (original y traducción), como la lengua de partida y de llegada, la herramienta de extracción, etc. A diferencia de los formatos nombrados, el estándar XLIFF está siendo desarrollado por el consorcio OASIS.

Portable Object (PO) de Gettext también es un formato multilingüe y está especialmente diseñado para el sector de la localización de software. Los archivos PO contienen un campo para cada cadena a traducir y un campo para introducir la traducción.

Bases terminológicas

Term-Base eXchange (TBX), Universal Terminology eXchange (UTX) y Open Lexicon Interchange Format (OLIF) son tres formatos compatibles con XML pensados específicamente para datos terminológicos y léxicos. Todos ellos contienen glosarios, tanto para traducción humana como para traducción automática. Almacenan pares de términos de las lenguas de partida y llegada, así como otros datos terminológicos, como el tipo de palabra, el género, el número e información léxica más detallada.

Otros tipos de archivo

Existen formatos estándares para otros tipos de archivo que tienen lugar en el proceso de traducción asistida por ordenador:

El formato Segmentation Rules eXchange (SRX) se utiliza para definir reglas de segmentación. La segmentación es la operación que permite dividir el texto en partes llamadas segmentos, que se pueden traducir uno por uno. Cuando un programa necesita segmentar un documento, se necesitan reglas para determinar dónde termina un segmento y comienza el siguiente. En la mayoría de los casos, los puntos marcan el fin de segmento, pero no cuando forman parte de una dirección de Internet o de acrónimos, por ejemplo.

Global information management Metrics eXchange (GMX) es un conjunto de estándares destinado a la proporción de medios comunes para medir los aspectos cuantitativos de un documento, como pueden ser el número de palabras, la complejidad, etc. Cuando una agencia de traducción recibe un pedido, necesita hacer un cálculo del trabajo de traducción con el fin de realizar un presupuesto del proyecto. Los presupuestos de traducción para un mismo texto pueden variar mucho, ya que cada agencia de traducción mide la complejidad y la longitud de un texto de manera diferente. Con el desarrollo y la integración de los estándares de GMX, el sector de la traducción se beneficiará de los parámetros verificables y definidos que se apliquen a los documentos de texto.

Normas de procesos

El crecimiento del mercado de la traducción en la última década ha creado una gran necesidad de desarrollar estándares de calidad para los servicios de traducción. Por un lado, la demanda aumenta debido al creciente volumen de información escrita y número de clientes, en su mayoría no familiarizados con conceptos como localización, internacionalización y globalización. Por otro lado, gracias a Internet, en la actualidad es más fácil que nunca crear una empresa de traducción y sacarla adelante con muy poca inversión. Así, han surgido muchos proveedores nuevos y sin experiencia que están abarrotando el mercado.

Como resultado, los gobiernos y otras instituciones, como asociaciones de traducción, han promovido la introducción de estándares de calidad para describir formalmente todos los pasos involucrados en la entrega de un servicio de traducción satisfactorio. Cualquiera que sea el producto final, es decir, ya sea un contrato comercial, un catálogo de productos, una página web multilingüe, etc., las normas benefician a los clientes finales, ya que proporcionan un marco con el cual pueden evaluar la experiencia con su proveedor de servicios lingüísticos mediante un criterio reconocido e imparcial.

Puesto que es muy difícil ponerse de acuerdo en una manera de definir y medir la calidad de las traducciones escritas, las normas de procesos se centran principalmente en la calidad general de un flujo de trabajo de traducción completa tradicional, desde la solicitud del servicio hasta la obtención del producto. De hecho, no proporcionan criterios específicos para la traducción o la calidad del proyecto, ya que son aspectos realmente subjetivos. Más bien, establecen parámetros que los PSL deben tener en cuenta antes de comenzar un proyecto de traducción (recursos humanos, análisis y presupuesto del proyecto, especificaciones del cliente y comunicación), durante la ejecución del proyecto (gestión de la terminología, traducción, edición, formateo, revisión y control de calidad) y después de la entrega (mantenimiento de memorias de traducción y seguimiento de la retroalimentación).

A diferencia de los fabricantes y proveedores de servicios que tienen la ISO 9001 como principal certificación internacional disponible, las mejores prácticas del sector de la traducción se definen en varios estándares de calidad, dependiendo de la ubicación geográfica. En Europa, la norma EN 15038 está destinada a unificar la terminología entre las agencias traducción, así como a definir las mejores prácticas para la relación cliente-proveedor. En América del Norte, la asociación canadiense del sector lingüístico AILIA ha contribuido al desarrollo de la CAN/CGSB-131.10-2008, que es una norma nacional de Canadá para servicios de traducción que se adapta a la norma europea EN 15038. En Estados Unidos, la asociación de traductores ATA aprobó la ASTM F2575-06, una guía de normas que establece los parámetros para el control de calidad en la traducción.

Conclusión

La normalización tiene muchos enemigos en el sector de la traducción. Un ejemplo de ello es que haya sido un organismo orientado a las telecomunicaciones como ETSI quien decidió continuar con el desarrollo de los formatos estándares de LISA anteriores en lugar de las partes interesadas del sector a través de sus numerosas organizaciones como EUATC, FIT, GALA, ELIA, etc., que, al parecer, carecen de voluntad para ponerse de acuerdo en un conjunto unificado de normas. De hecho, hasta ahora, el sector lingüístico ha estado sometido a la evolución de la tecnología de manera pasiva, en lugar de crecer con ella y dirigir su desarrollo. Por otra parte, existe una amplia falta de coherencia debido a que esta iniciativa está en manos de un pequeño grupo de organizaciones. Aparte, las prácticas de «bloqueo» por parte de los fabricantes son una amenaza a la libertad de mercado.

Sin embargo, los estándares ya desempeñan y desempeñarán un papel decisivo en el sector de la documentación y la traducción y, su introducción progresiva resulta fundamental para la evolución de la tecnología de traducción. A pesar de que todavía no cubren todos los aspectos de los servicios de traducción, las normas ofrecen un marco aceptado y aceptable para implementar procesos de mejor calidad a todos los niveles. Dado que las normas ayudan a mejorar la gestión de la traducción en general, todas las partes interesadas, incluidos los desarrolladores de software, los proveedores de servicios lingüísticos y los clientes finales, son responsables de respaldar la normalización y mejorar la interoperabilidad.

De hecho, muchos desarrolladores de software adoptan estándares del sector para contar con una plantilla para diseñar programas compatibles. Como resultado, los proveedores de servicios lingüísticos de cualquier magnitud pueden liberarse de las restricciones del software comercial. Por otro lado, mediante la aplicación de normas de proceso, los PSL de mayor tamaño seleccionan proveedores de traducción basándose en sus calificaciones reales, ya que haber adquirido una licencia de software concreta no debería condicionar la contratación de un PSL.

Lo más importante: los clientes pueden beneficiarse de una mayor transparencia en el mercado de la traducción, sin tener en cuenta el papel que desempeña cada parte, y de una mejor comunicación con los proveedores de servicios lingüísticos para establecer especificaciones sin defectos. En otras palabras, las normas ayudan a los clientes a obtener el mejor servicio de traducción, ya que promueven la competencia y hacen que sea más fácil elegir el PSL más adecuado según sus necesidades. Es por ello que sería de esperar que se comprometieran a contratar proveedores que se adhieran a los estándares.

Qabiria white logo

Creemos en el incremento de la productividad mediante el uso creativo de la tecnología.

Últimas noticias

Contacto

Qabiria Studio SLNE
Carrer Lleida, 3 1-2
08912 Badalona
(Barcelona)
ESPAÑA

+34 675 800 826

qabiria

Envíanos un mensaje

Recibe nuestro boletín

¿Quieres leer los artículos y novedades de Qabiria directamente en tu bandeja de entrada?