IAT - UAM 2012 : diciembre 2012

martes, 25 de diciembre de 2012

Aplicación práctica de la asignatura

MT en el programa Déjà Vu

Doy por finalizado este blog de Informática Aplicada a la Traducción con una última entrada sobre la aplicación práctica del programa Déjà Vu, un proyecto que debemos hacer para clase con la traducción de esta página web: http://www.on-channel.com/

La imagen que podéis ver a continuación es la interfaz del programa Déjà Vu, con los elementos del texto origen ya importados (archivo > nuevo > proyecto > seleccionar los archivos que queremos importar) y la traducción de los diferentes segmentos hecha. Gracias a las pestañas de arriba a la izquierda podemos hacer uso de distintas opciones como, por ejemplo, “traducción > propagar la traducción”, que nos sirve para no tener que rehacer la traducción de las frases que se van repitiendo.

Una vez tengamos toda la traducción hecha, debemos darle a "exportar archivo traducido", con lo que el programa creará en nuestro ordenador una carpeta llamada "es-es". Cuando se trata de traducir una página web, como en este caso, tenemos que tener una carpeta con las imágenes de dicha página web, de modo que después podamos copiar los archivos originales que estamos traduciendo junto con las imágenes guardadas en esa carpeta llamada “es-es”. Así, obtendremos un archivo en el que podemos pinchar para que salga nuestra página web ya traducida.

Este programa, tan útil para este tipo de traducciones y, sobre todo, para tener almacenados nuestros textos, se puede obtener en la página de Atril (http://atril.com/) donde encontraremos las distintas versiones del programa, con sus correspondientes precios, así como la versión gratuita, que permanece válida durante 30 días.

¡FELIZ NAVIDAD A TODOS!

miércoles, 5 de diciembre de 2012

Aprovechamiento de las MT

Crear una Memoria de Traducción

Una vez tengamos bien estructurada la teoría básica sobre las Memorias de Traducción y la segmentación de textos dentro de ellas podemos pasar a hablar sobre los procesos y programas con los que crear nuestra propia MT, algo que podemos llevar a cabo de dos formas: o bien utilizando el método de la alineación de textos a partir de bases de datos, del que ya hemos hablado en las entradas sobre corpus, o bien utilizando un método interactivo, basado en una forma de traducción interactiva. En este último, las nuevas traducciones quedan almacenadas para su uso inmediato (en el mismo texto) o futuro, lo que comporta una mayor calidad pero menor productividad a corto plazo. Además, con el método interactivo podemos hacer uso del trabajo en la red o, lo que es lo mismo, de la colaboración de distintos traductores para formar una MT.

Entre los documentos más apropiados para constituir una MT se encuentran: los textos con contenido repetitivo interno (propagación), que pueden ser documentos técnicos, como manuales de usuario y especificaciones de productos, o documentos jurídicos o legales, como contratos y patentes; las revisiones, es decir, la versión corregida de un texto anterior o las páginas web, la nueva edición de un manual, etc.; el aprovechamiento de textos (reciclado), que consiste en el trabajo para el mismo cliente, lo que implica el mantenimiento de terminología y preferencias estilísticas; y las actualizaciones sobre la marcha que, en un proceso normal, conllevan la necesidad de comparar la nueva versión con la antigua (Word), teniendo en cuenta que se puede empezar la traducción aunque la versión definitiva no esté completamente terminada.

Crear una MT es algo muy útil porque cuenta con numerosas ventajas entre las cuales cabe destacar la productividad, conseguida únicamente cuando se conoce ya un programa (curva de aprendizaje, cambios de entornos…), cuando la MT es representativa, cuando surge la necesidad de convertir formatos, etc. También destacan la calidad (el contenido de la MT debe ser bueno; mejora la coherencia de una traducción, o para un mismo cliente; necesidad de revisar y actualizar base de datos; se hacen menos revisiones que con procesadores de textos), el formato electrónico (evaluar la relevancia de un texto para su futura reutilización antes de usar un OCR) y la propiedad de la MT (un valioso recurso que reclaman traductores y clientes para el que aún no hay una clara solución).

Además, las MT integran otras herramientas, como la gestión terminológica, la traducción automática o la integración con procesador de textos (Word), así como la incorporación de un editor independiente y la compatibilidad con filtros de formatos diferentes. Entre los programas que cuentan con estas herramientas, destacamos Multiterm (Trados) y Déjà vu y Omega T (de acceso gratuito online).

FUENTE: Informática Aplicada a la Traducción, por María José López Chollet

domingo, 2 de diciembre de 2012

Componentes generales de las MT

Segmentación y coincidencias

A modo de continuación de la anterior entrada sobre Memorias de Traducción vamos a ver ahora algunas nociones básicas sobre la segmentación de textos que se lleva a cabo en este tipo de programas. Por lo general, los segmentos se definen siguiendo las reglas de puntuación y de ahí que la oración sea la unidad utilizada como segmento por defecto. Obviamente, nos surge un problema relacionado con siglas, abreviaturas, etc. ya que, al haber punto, el programa interpreta que se trata de final de oración y, por tanto, también de segmento.

Sin embargo, podemos modificar los criterios de segmentación y considerar párrafos completos como segmentos. Personalmente, creo que esto no es muy práctico porque los párrafos incluyen demasiada información y es casi imposible encontrar párrafos iguales en distintas traducciones, pero lo importante aquí es que tenemos dicha posibilidad. Ahora que ya sabemos lo que son los segmentos de las MT, pasamos a precisar cuáles son los distintos tipos de coincidencias entre ellos: exactas, plenas, parciales, terminológicas y por subsegmentos.

Las coincidencias exactas son aquellas en las que las dos cadenas de caracteres son iguales en lo relativo al texto, la puntuación y el formato, mientras que las coincidencias plenas son aquellas en las que el nuevo segmento sólo se diferencia por algunos elementos ciertamente variables como cifras, fechas, divisas, medidas, etc. Además, existe el “fuzzy matching”, que consiste en coincidencias parciales en las que el traductor como factor humano configura el “umbral de sensibilidad” de la traducción, aunque el programa siempre presenta los segmentos más próximos al original en primer lugar.

Por otro lado, existen las coincidencias terminológicas, que se basan en la consulta automática de diccionarios teniendo en cuenta que, aunque la MT no encuentre un término similar en la base de datos, siempre ofrece equivalencias. Finalmente, las coincidencias por subsegmentos tienen que ver con que los elementos de la comparación son bloques de segmentos, de modo que el programa puede generar un segmento a partir de trozos que encuentra en diferentes segmentos almacenados en la memoria.

Por último, es interesante mencionar que se están desarrollando nuevas estrategias en materia de segmentación. Algunos programadores están actualmente trabajando en la posibilidad de que las MT proporcionen un enfoque parecido al que ofrecen los sistemas de traducción que basan su proceso en la búsqueda de ejemplos. La diferencia radica en que en estos programas el traductor no es el responsable último del análisis y la formulación de la traducción, sino que lo es el ordenador (el programa en sí), al contrario que con las MT.

FUENTE: "Introducción a Memorias de Traducción", María José Chollet, UAM.