jueves, 15 de noviembre de 2012

Gestión de corpus multilingües


Alineación de textos paralelos

Llegados a este punto, tenemos que hablar de un apartado fundamental de la Informática Aplicada a la Traducción sobre la utilización de textos paralelos, corpus y memorias de traducción. De hecho, considero que es el verdadero fundamento de esta asignatura de la que venimos hablando desde el principio.

Para elaborar una memoria de traducción podemos recoger los textos mientras traducimos o después de acabar nuestras traducciones. En cualquier caso, la cuestión es incorporar textos originales con sus respectivas traducciones, ya que esto es en lo que consiste realmente el proceso de alineación de textos: comparación entre los textos originales y sus traducciones, haciendo coincidir todos los segmentos correspondientes y uniéndolos como unidades de una memoria de traducción. Por esta razón, un corpus paralelo se constituye como la base imprescindible para la elaboración de memorias de traducción. 

Para llevar a cabo la alineación de textos paralelos podemos recurrir directamente a hojas de cálculo de Excel, pero también tenemos a nuestra disposición algunas herramientas incluidas en los paquetes de memorias de traducción, entre las cuales destacan especialmente WinAlign (Trados) y el alineador propio del programa Déjà Vu Atril. Además, existen los llamados sistemas de código abierto, como Microsoft Bilingual Sentence Aligner o Bitext2tmx. Al utilizar estos sistemas de alineación de textos podemos encontrarnos con una serie de errores frecuentes como la incoherencia de formatos entre ambos textos o la falta de correspondencias, es decir, que un segmento del texto original se encuentre dividido en dos segmentos diferentes en la traducción, etc.

Por eso, siempre debemos revisar la alineación propuesta por el programa porque no deja de ser una máquina (tecnología informática) y puede cometer errores de puntuación y otros. Siempre debemos especificar el formato de entrada de los textos, así como las lenguas de origen y de llegada y, por supuesto, el conjunto de caracteres que queremos utilizar (por lo general, utilizaremos el sistema ISO). Y, finalmente, siempre debemos tener en cuenta que no todos los textos son susceptibles de ser utilizados en un programa de alineación de textos o de alimentar una memoria de traducción.

Para terminar, es interesante mencionar que los textos paralelos alineados no sólo se utilizan con estos fines, sino que también se pueden usar como sustitutos de diccionarios terminológicos (podemos comprobar con qué aparece asociado siempre un término y tener la traducción al alcance de la mano) o como herramientas para comprobar el índice de frecuencia de aparición de un término en un texto (resulta útil cuando queremos hacer análisis sobre textos y corpus). 

FUENTE: https://moodle.uam.es/file.php/9166/Alineacion_de_textos_paralelos.pdf 

No hay comentarios:

Publicar un comentario