viernes, 23 de noviembre de 2012

Herramientas avanzadas de IAT


Memorias de traducción

Una de las herramientas fundamentales en el estudio de la Informática Aplicada a la Traducción es la que se conoce con el nombre de Memorias de Traducción, que ya hemos mencionado en varias ocasiones. De ahora en adelante, nos referiremos a ellas como MT y en esta entrada vamos a ver qué son exactamente y cuál es el proceso de traducción convencional que seguimos conforme a ellas.

En lo que se refiere a la definición más adecuada, nos encontramos con que el proyecto EAGLES define esta herramienta como “a multilingual text archive containing (segmented, aligned, parsed and classified) multilingual texts, allowing storage and retrieval of aligned multilingual text segments against various search conditions”. En resumen, diríamos que una MT es una base de datos en la que almacenamos textos originales junto con sus traducciones, haciendo coincidir los segmentos de los mismos para reutilizarlos en un futuro.

En cuanto a las características básicas de las MT, tenemos que destacar que:

- No es un proceso automático de traducción como en los programas de TA (Traducción Automática), ya que no nos sirve estrictamente para hacer traducciones sobre la marcha, sino que consiste en el almacenaje de las mismas para poder consultarlas en ocasiones futuras que sean similares. No obstante, es una herramienta que ayuda a la TAO (Traducción Automática Online).

- El traductor como persona, como factor humano, es el motor de trabajo. Por muy informatizado que esté el proceso, el traductor humano no dejará de ser necesario para aportar la visión del ámbito cultural a la traducción.

- Reúne las herramientas de uso habitual en los programas de traducción y añade algunos recursos extra, como el análisis del documento, la búsqueda terminológica, la gestión y la revisión. Además, también podemos encontrar opciones propias de las bases de datos, como la compactación o la desfragmentación, así como diccionarios, glosarios específicos y correctores.

Existen otros dos componentes característicos (fuzzy matching y leveraging) que tienen que ver con la alineación de segmentos dentro de una MT, pero de eso ya hablaremos en la siguiente entrada. Por el momento y para terminar este primer contacto, es interesante señalar que las funciones básicas de trabajo con una MT siguen el siguiente proceso: comparar un segmento con los textos almacenados en la base de datos, si el programa encuentra un segmento exacto o similar, presentarlo al usuario (en este caso, el traductor consulta este segmento y puede decidir si lo reutiliza, modifica o lo traduce de nuevo) y, finalmente, almacenar la nueva traducción en la BDD (Base De Datos) junto con el segmento original. 

FUENTE: http://www.eagle-translations.com/ 

sábado, 17 de noviembre de 2012

Corpus y textos paralelos


Ejemplos e Internet

Para terminar con el apartado relativo a la alineación de textos paralelos vamos a ver algunos ejemplos representativos de lo explicado. Antes que nada, quisiera que vierais esta imagen que corresponde a un corpus paralelo en el que los segmentos están perfectamente asociados a su traducción: 


Por otro lado, existe un último corpus de gran amplitud del que es muy interesante hablar porque es muy probable que hayáis hecho uso de él en innumerables ocasiones y, sin duda, seguiréis haciéndolo: se trata del Google Translate. Este sistema funciona mediante la llamada Traducción Automática Estadística, según la cual se extraen estadísticas de uso a partir de un conjunto de textos paralelos.

De esta manera, el traductor elige cuál es la traducción más adecuada para cada ocasión. Los internautas podemos colaborar con ello mediante el “Google Translator Toolkit”, que consiste en un potente y sencillo editor que ayuda a los traductores a trabajar mejor y más rápido. Permite subir y traducir documentos (podemos utilizar documentos de nuestro ordenador y documentos de la web), descargar y publicar traducciones (de la Wikipedia o del Knol), chatear y compartir traducciones online (colaborar online con otros traductores, una característica básica de nuestro oficio) y utilizar herramientas avanzadas (memorias de traducción y glosarios multilingües).

En conclusión, el “Toolkit” nos puede ayudar a mejorar el rendimiento del traductor de Google al contar con textos paralelos o textos bilingües. Ahora que sabemos lo que son y cómo funcionan, así como su utilidad para traductores como nosotros, es interesante que colaboremos en estos proyectos. 

FUENTE: https://moodle.uam.es/file.php/9166/Alineacion_de_textos_paralelos.pdf 
FUENTE: http://translate.google.com/toolkit/ 

viernes, 16 de noviembre de 2012

Umbral de representatividad de un corpus


Corpas Pastor y Seghiri Domínguez

Después de leer la entrada anterior, es posible que nos surja una duda: si nos decidimos a elaborar nuestro propio corpus de textos paralelos, ¿cuántos textos tenemos que incluir en él para poder llamarlo “corpus” como tal? Las doctoras Gloria Corpas Pastor y Miriam Seghiri Domínguez, de la Universidad de Málaga, han elaborado un artículo en el que se da una solución objetiva y cuantificable para determinar a posteriori el tamaño mínimo que debe alcanzar un corpus para ser considerado representativo, siempre hablando en términos estadísticos.

Lo primero que tenemos que saber es que existe un programa informático llamado ReCor, por medio del cual estas dos profesoras están intentando dar una respuesta a esa pregunta que nos surge irremediablemente sobre la amplitud mínima necesaria en un corpus. Hasta ahora, la búsqueda de una respuesta válida se había estado fundamentando en las opiniones personales de los expertos en lingüística pero nunca se había llegado a un consenso, puesto que cada uno tiene una opinión y considera que es la mejor opción frente a las demás.

Este programa informático del que hablamos se caracteriza especialmente por su interfaz de usuario que, pese a la aparente complejidad de un programa de este tipo, es realmente sencilla. Funciona mediante el algoritmo N-Cor, que tiene en cuenta el análisis de la densidad léxica en relación a los aumentos incrementales del corpus documento a documento. Su ecuación base es la siguiente: 

Cn= d1+ d2+d3+...+dn

Gracias a esta sencilla ecuación, podemos analizar gradualmente todos los archivos que componen el corpus y extraer de ellos información sobre la frecuencia de las palabras tipo, a las que llamamos types, y las ocurrencias o instancias, llamadas tokens. Entre los criterios de selección de archivos, podemos elegir dos procedimientos: el orden alfabético (las types y las tokens se analizan en el primer documento y el resultado se va sumando al análisis de los demás documentos) y el orden aleatorio (el mismo proceso de análisis, pero considerando un rango de longitudes de secuencia).

Partiendo de la base de que el resultado de la división entre las types y las tokens, es decir, entre las palabras reales y las totales de un texto, no aumenta proporcionalmente a partir de un número de textos determinado, esta herramienta informática permite ilustrar gráficamente el punto a partir del cual un corpus que ha sido compilado según criterios cualitativos comienza a ser representativo en términos cuantitativos. Actualmente, los creadores del programa están trabajando en una versión actualizada del mismo con más posibilidades. 

FUENTE: http://www.sepln.org/revistaSEPLN/revista/39/20.pdf 

jueves, 15 de noviembre de 2012

Gestión de corpus multilingües


Alineación de textos paralelos

Llegados a este punto, tenemos que hablar de un apartado fundamental de la Informática Aplicada a la Traducción sobre la utilización de textos paralelos, corpus y memorias de traducción. De hecho, considero que es el verdadero fundamento de esta asignatura de la que venimos hablando desde el principio.

Para elaborar una memoria de traducción podemos recoger los textos mientras traducimos o después de acabar nuestras traducciones. En cualquier caso, la cuestión es incorporar textos originales con sus respectivas traducciones, ya que esto es en lo que consiste realmente el proceso de alineación de textos: comparación entre los textos originales y sus traducciones, haciendo coincidir todos los segmentos correspondientes y uniéndolos como unidades de una memoria de traducción. Por esta razón, un corpus paralelo se constituye como la base imprescindible para la elaboración de memorias de traducción. 

Para llevar a cabo la alineación de textos paralelos podemos recurrir directamente a hojas de cálculo de Excel, pero también tenemos a nuestra disposición algunas herramientas incluidas en los paquetes de memorias de traducción, entre las cuales destacan especialmente WinAlign (Trados) y el alineador propio del programa Déjà Vu Atril. Además, existen los llamados sistemas de código abierto, como Microsoft Bilingual Sentence Aligner o Bitext2tmx. Al utilizar estos sistemas de alineación de textos podemos encontrarnos con una serie de errores frecuentes como la incoherencia de formatos entre ambos textos o la falta de correspondencias, es decir, que un segmento del texto original se encuentre dividido en dos segmentos diferentes en la traducción, etc.

Por eso, siempre debemos revisar la alineación propuesta por el programa porque no deja de ser una máquina (tecnología informática) y puede cometer errores de puntuación y otros. Siempre debemos especificar el formato de entrada de los textos, así como las lenguas de origen y de llegada y, por supuesto, el conjunto de caracteres que queremos utilizar (por lo general, utilizaremos el sistema ISO). Y, finalmente, siempre debemos tener en cuenta que no todos los textos son susceptibles de ser utilizados en un programa de alineación de textos o de alimentar una memoria de traducción.

Para terminar, es interesante mencionar que los textos paralelos alineados no sólo se utilizan con estos fines, sino que también se pueden usar como sustitutos de diccionarios terminológicos (podemos comprobar con qué aparece asociado siempre un término y tener la traducción al alcance de la mano) o como herramientas para comprobar el índice de frecuencia de aparición de un término en un texto (resulta útil cuando queremos hacer análisis sobre textos y corpus). 

FUENTE: https://moodle.uam.es/file.php/9166/Alineacion_de_textos_paralelos.pdf 

miércoles, 14 de noviembre de 2012

Wikipedia y la terminología


Recursos para la traducción

Hasta ahora hemos visto algunos datos importantes sobre la Wikipedia, no sólo en cuanto a su historia y las posibilidades de traducción colaborativa que ofrece, sino también en cuanto a su capacidad de autocorrección. En esta entrada, sin embargo, vamos a ver cómo podemos utilizar la Wikipedia, así como otros recursos de Internet como Google, para llevar a cabo un ejercicio de terminología que nos pueda ayudar en nuestras traducciones de textos especializados.

Si vamos a empezar a traducir, lo primero que debemos hacer es una lectura rápida del texto para comprender el sentido global del mismo y sacar los términos que, a simple vista, no conocemos y de los que tendremos que buscar información. Imaginemos que nos encontramos el término “Garbage Collection”. Probablemente, nuestro primer impulso sería buscar en un diccionario especializado y, en caso de no encontrar la traducción, buscar en Google.

La Wikipedia nos puede ayudar en estos casos. Para ello, vamos a la Wikipedia de nuestro código de lengua (http://es.wikipedia.org) e introducimos el término en el recuadro de búsqueda. Cuando obtengamos el artículo correspondiente en inglés, debemos comprobar en el menú de la izquierda si existe un enlace a un artículo traducido en español. En este caso, sí existe y es un artículo titulado “Recolector de basura”: ya hemos conseguido saber cómo se traduce.

A partir de aquí, la definición proporcionada por la Wikipedia (Un recolector de basura, del inglés "garbage collector" es un mecanismo implícito de gestión de memoria implementado en algunos lenguajes de programación de tipo interpretado o semiinterpretado) nos puede servir para hacer búsquedas de Google. Podemos utilizar algunas palabras clave, como "gestión de memoria" o "lenguajes de programación", que nos ayudarán a acotar la búsqueda, puesto que ya sabemos que los resultados en buscadores pueden llegar a ser tan numerosos que no nos sirvan para nada. De esta forma, pondremos: 

          1. "Recolector de basura" + "Gestión de memoria" 
          2. Define: "Garbage collection" 

En definitiva, como hemos podido comprobar después de llevar a cabo estas operaciones, Internet y en concreto Google y la Wikipedia nos pueden ayudar a llevar a cabo una labor terminológica muy necesaria, sobre todo cuando tenemos que hacer traducciones de textos especializados, como ya dijimos al principio. Siendo sincera, a mí me resulta una labor soporífera y aburrida, muchísimo más cuando tienes delante un texto repleto de términos y pierdes más tiempo en buscarlos que en el hecho de traducir en sí mismo. Es por eso por lo que me parece tan interesante la opción de la Wikipedia, ya que permite optimizar el tiempo invertido, aunque siempre tenemos que tener cuidado con los resultados. 

martes, 13 de noviembre de 2012

La capacidad de autocorrección de la Wikipedia


Por Álvaro Ibáñez

Para esta entrada del blog y a modo de explicación definitiva al procedimiento de corrección y revisión de la Wikipedia, paso a copiar un resumen por fragmentos del artículo “La capacidad de autocorrección de la Wikipedia”, de Álvaro Ibáñez. Se trata de un artículo escrito por uno de los editores del blog Microsiervos (www.microsiervos.com), que trata de divulgar entradas sobre temas tecnológicos y científicos aunque, como en todos los blogs, de una forma muy personal y más cercana al lector que si se tratase de cualquier publicación en una revista. 

En un día típico de la Wikipedia muchas personas leen alguno de sus millones de artículos: si ven una errata pueden corregirla rápidamente; si ven un error de concepto o tienen algún dato que convenga añadir, editan la página y la corrigen o amplían. Si descubren que un tema interesante todavía no existe, pueden comenzar un nuevo artículo que poco a poco se irá ampliando con ayuda del resto de la comunidad. Se podría dudar de que esta forma de «caos organizado» fuera realmente funcional, pero el hecho es que el resultado tras algunos años ha sido excelente y está a la vista de cualquiera: Wikipedia es uno de los sitios más admirados por la comunidad de Internet y sus artículos figuran entre los más enlazados desde otras páginas de la Red.

El hecho de que cualquiera pueda editar las páginas de la Wikipedia no está exento de problemas. Con el tiempo la comunidad vio que los artículos que creaba pasaban por todo tipo de situaciones incómodas, algunas de mayor importancia que otras: textos con erratas, gente que editaba artículos sin un conocimiento real de los temas, incluyendo en ellos opiniones en vez de hechos comprobados, ediciones incorrectas por parte de usuarios que no conocían bien el sistema, vandalismo por parte de individuos que modificaban los artículos por diversión y manipulación y sabotajes por parte de personas, grupos, organizaciones o empresas interesadas en mostrar un punto de vista concreto en ciertos artículos, etc. Hay un buen número de soluciones técnicas en la Wikipedia que, aunque no son demasiado conocidas, están al alcance de sus usuarios y facilitan el seguimiento de los artículos y su corrección.

Entre estas destacarían: el historial de ediciones (se pueden ver todos los cambios que los artículos han sufrido con el paso del tiempo), la función para deshacer cambios (permite revertir los cambios hechos a un artículo en caso de problemas), la vigilancia de artículos (los artículos de la lista de favoritos se pueden ver agrupados en la llamada Lista de seguimiento y hacer un seguimiento de cómo van siendo modificados), el seguimiento de cambios por RSS (permite a las personas que acostumbran a utilizar programas agregadores añadir los cambios de las páginas de Wikipedia), los robots que detectan vandalismos (“programas robot”, como AVBOT, que detectan cambios de tipo vandálico y a veces reponen las páginas originales y otras veces avisan a los “bibliotecarios”) y la reputación de los usuarios (el peso de la reputación de un usuario de la Wikipedia tiene un valor incalculable; los cambios de un usuario que lleva años participando serán sin duda respetados). 

FUENTE: https://moodle.uam.es/file.php/9166/Capacidad_correccion_Wikipedia.pdf

lunes, 12 de noviembre de 2012

La traducción e Internet


Wikipedia

En este segundo gran apartado de la asignatura de Informática Aplicada a la Traducción ha llegado el momento de hablar de la famosa Wikipedia, que en los últimos tiempos se ha convertido en una herramienta de información de gran utilidad para cualquier persona que quiera consultar un tema, un dato, etc. Eso sí, es importante tener en cuenta que, puesto que los artículos de la Wikipedia puede escribirlos todo el mundo, no siempre son fuentes o datos fiables.

De hecho, el nombre de Wikipedia proviene del concepto “wiki”, que significa que cualquier usuario puede participar y modificar el contenido de un artículo, además de que estos se publican con una licencia libre para que todos podamos reutilizar los contenidos que aquí se exponen. En la actualidad, la Wikipedia ya cuenta con más de 12 millones de artículos en más de 200 idiomas, entre los cuales hay 800.000 artículos escritos en español. Esto es algo muy destacable si tenemos en consideración que lleva operativa desde el 2001 y que sólo tardó cinco años en igualar a la famosa Encyclopaedia Britannica en lo que a material se refiere.

Respecto a las opciones de colaboración, muchos de los artículos destacados de la Wikipedia necesitan ser traducidos y es aquí donde encontramos el filón más interesante desde nuestro punto de vista como traductores. Si queremos participar desempeñando nuestra labor, la Enciclopedia nos indica los pasos que debemos seguir: primero, tenemos que localizar el texto de trabajo desde el Portal de la Comunidad, en Cosas por Hacer (los artículos que no existen en español suelen aparecer con un enlace rojo) y luego, debemos buscar el artículo original en la Wikipedia de nuestro código de lengua; nos dirá que no existe y, por tanto, nos dará la opción de Editar Página.

A continuación, creamos una página de usuario para evitar intervenciones mientras trabajamos y después, editamos la página (no debemos olvidarnos de grabar la página después de cada intervención para no perder información). Por último, cuando le demos al artículo y nos diga que no existe, seguiremos los pasos correspondientes para crearlo nosotros mismos y es ahí donde publicaremos nuestra traducción.

Como no podía ser menos, esta enciclopedia cuenta también con un Control de Problemas gracias a una serie de “robots” que corrigen automáticamente erratas simples. Además, los propios usuarios pueden insertar carteles advirtiendo sobre la calidad de estilo, sobre artículos incompletos o en fase de traducción, etc. Pero no sólo se trata de robots o usuarios, sino que también existen los llamados “bibliotecarios” o administradores, que son aquellas personas que velan porque se cumplan las normas de la Wikipedia y tienen capacidad para congelar la publicación de artículos. 

FUENTE: https://moodle.uam.es/file.php/9166/Pautas_para_trabajar_con_la_wiki.pdf 

sábado, 10 de noviembre de 2012

Continuación 2


Explotación de textos

Para terminar con estas entradas dedicadas a la explotación de textos electrónicos, vamos a hablar hoy de los distintos tipos de archivos y su conversión:

Conversión de archivos: los archivos de texto pueden contener una gran cantidad de información sin tener que llegar por ello a ser demasiado grandes. Podemos abrirlos y leerlos en casi todas las plataformas y, sobre todo, se usan con frecuencia cuando se importan o exportan datos de una aplicación de software a otra. Nosotros, como traductores, debemos saber cómo convertir distintos tipos de archivos para hacer bien nuestro trabajo: si un cliente nos da un documento original en un formato que no podemos leer, saber cómo convertirlo a otro formato que nos permita trabajar con ello es muy conveniente. Así podríamos utilizar con bases de datos, memorias de traducción, etc.

Archivos en formato .pdf: los archivos PDF son un tipo de archivo muy especial, puesto que no se pueden modificar (están pensados para ser leídos online o impresos directamente) y son de los archivos más utilizados, sobre todo en Internet. Por eso es importante saber convertirlos en formato de texto que podamos editar, ya que la mayoría de los encargos que se hacen hoy en día están en PDF y, sobre todo, se entregan así para asegurar la autoría del documento. Para convertir un PDF a Word tenemos que descargarlo primero a nuestro ordenador, abrirlo y seleccionar la opción “Guardar como” y en el tipo de archivo en el que lo queremos guardar le damos a “documento Word: .doc”.

Otras extensiones: hemos visto que existen archivos con las extensiones .pdf y .doc que son documentos que no se pueden modificar y documentos de Word, respectivamente. Pero también podemos encontrarnos con archivos del tipo .txt para documentos de texto sin formato, .xls para documentos de Excel, .ppt para documentos de Power Point y .rtf para documentos de texto enriquecido (estos últimos son muy importantes porque si nos dan a traducir un documento que no podemos abrir, pasándolo a formato de texto enriquecido podremos verlo con el Wordpad, con el Word o con el Bloc de notas).

Por último, es interesante comentar un artículo de Internet llamado “Using MS Word’s Advanced Find and Replace Function”, de Tibor Körney. Se trata de un análisis de la función de Buscar y reemplazar de Word, con la que podemos efectuar cambios en el documento de forma rápida y relativamente sencilla sin tener que hacerlo a mano en todos los casos en los que se dé ese aspecto que queremos cambiar. Por ejemplo, en el caso de las cifras, los distintos idiomas utilizan puntos, comas o espacios y además en cada caso pueden existir divisas diferentes y estas pueden colocarse en posiciones distintas respecto a la cifra: podemos encontrarlas antes o después del número en cuestión. 

FUENTE: https://moodle.uam.es/file.php/9166/TIC_para_traductores_v_2007.pdf 
FUENTE: http://translationjournal.net/journal//15msw.htm 

viernes, 9 de noviembre de 2012

Continuación 1


Explotación de textos 

En esta entrada, continuaremos tratando el apartado de la edición de textos en cuanto a opciones de corrección y revisión en los documentos de Word:

Revisión ortográfica y gramatical: cuando se trata de corregir y revisar documentos de Word, la llamada “Revisión ortográfica y gramatical” es una de las fases más importantes de todo proceso de traducción, ya que muchas veces cometemos errores orto-tipográficos, faltas de puntuación, etc. Sin embargo, no podemos fiarnos al 100% de esta función de Word porque a veces corrige cosas que no son errores propiamente dichos y acaba siendo peor el remedio que la enfermedad; por lo tanto, la revisión humana es imprescindible. También podemos agregar diccionarios personalizados para que las correcciones se efectúen adecuadamente y se nos facilite el trabajo.

Control de cambios y revisiones de un documento: esta función es especialmente interesante porque tiene que ver con el punto de vista técnico y lingüístico. El corrector de un documento traducido por nosotros debe revisarlo y sugerir cambios que después aceptaremos o no. Dichos cambios se pueden visualizar con herramientas de Word, pero existen algunos programas, como Déjà Vu, que tienen un sistema especializado y mucho más elaborado para estos casos. Además, podemos insertar o visualizar comentarios sobre el texto, que se pueden imprimir u ocultar.

Comparación de dos versiones de un documento: a la hora de traducir un documento, nos puede ser muy útil la posibilidad de comparar dos versiones, dado que nos proporciona ayuda para averiguar qué aspectos fueron cambiados respecto al documento original o qué cambios hizo el corrector de la traducción, siempre y cuando haya utilizado la función de control de cambios de la que hablábamos antes.

Recuento de palabras de un texto: se trata de una función particularmente interesante porque las traducciones suelen cobrarse de acuerdo al número de palabras, caracteres o líneas traducidas (aunque también hay quien cobra por página o documento entero). De hecho, es tan importante para el traductor que en la actualidad existen programas especialmente diseñados para ello.

Finalmente, hablaremos de los caracteres especiales que a veces hay que incluir en un texto y que no figuran en nuestro teclado. Cada idioma utiliza una codificación de caracteres específica y puede ser que se lea en vertical u horizontal. Así, cuando tenemos que trabajar con distintos alfabetos, es necesario que sepamos convertir la codificación utilizada en el documento original. Una de las codificaciones más usadas es Unicode, ya que con ella es posible representar todos los idiomas y eso es algo muy a tener en cuenta, sobre todo cuando se traducen páginas web. 

FUENTE: https://moodle.uam.es/file.php/9166/TIC_para_traductores_v_2007.pdf 

jueves, 8 de noviembre de 2012

TIC para traductores


Explotación de textos electrónicos

A modo de continuación de lo que venimos hablando en las anteriores entradas del blog, esta vez vamos a analizar algunas funciones específicas de Word de gran utilidad para la traducción: edición de textos, búsquedas y sustituciones, gestión de caracteres especiales y fuentes, etc. Empezaremos tratando el tema de las opciones de formato: formateado, control de calidad de documentos, caracteres disponibles y archivos de impresión.

Un traductor de la era tecnológica debe saber cómo trabajar con plantillas de formato, ya que los clientes suelen pedir que su documentación sea consistente y a menudo son ellos los que solicitan que se utilice una fuente, tamaño o estilo determinado, en ocasiones diferente a la del documento original. También es importante que sepamos que las propiedades de las fuentes más usadas se pueden cambiar y modificar y que sepamos cómo hacerlo.

Instalación de fuentes True Type: a veces, los clientes pueden emplear fuentes que no tengamos instaladas en nuestro ordenador, de modo que si no sabemos cómo incrustar dichas fuentes no podremos visualizar los documentos tal y como estos fueron diseñados. Una solución es instalar las llamadas fuentes True Type para evitar que el cliente intervenga en el formato del documento final.

Insertar imágenes y objetos en un documento: puede ocurrir que recibamos encargos que contengan documentos con imágenes u otros objetos (como gráficos o tablas de Excel). En ese caso, debemos exportarlos, editarlos para la traducción y, finalmente, importarlos nuevamente en el texto de destino. También puede ser que el cliente nos envíe el documento y las imágenes por separado.

Inserción y mantenimiento de índices y tablas de contenido: se trata de una de las funciones más valiosas que los procesadores de texto nos pueden ofrecer cuando trabajamos con textos extensos en los que tenemos que llevar a cabo distintas manipulaciones. Para ello, es conveniente saber crear tablas de contenido y actualizarlas para reflejar las modificaciones y crear índices.

Convertir tablas en texto: una de las características más ineludibles de nuestro trabajo como traductores es la creación y constante utilización de glosarios y listas terminológicas en varios idiomas que, por lo general, hacemos en forma de tabla. Dado que las bases de datos terminológicas y las memorias de traducción no pueden ser “alimentadas” con tablas, primero hay que eliminar la tabla en cuestión y extraer el texto. Es importante saber ordenar los datos contenidos en una tabla. 

FUENTE: https://moodle.uam.es/file.php/9166/TIC_para_traductores_v_2007.pdf 

miércoles, 7 de noviembre de 2012

Profesional en el mundo del business


Organizar tu propio negocio

En lo que al mundo de los negocios se refiere, un buen traductor de hoy en día no sólo debe ser capaz de utilizar todas estas herramientas tecnológicas con propiedad, sino que también tiene que saber sacar su propio negocio adelante. Pero este mundo no es, ni mucho menos, lo que algunos traductores freelance quieren creer cuando piensan que se trata sólo de traducir, ya que buena parte del éxito de un negocio consiste en saber llevarlo correctamente. Un traductor por cuenta propia tiene muchas facetas: es su propio jefe y empleados, director, subdirector, encargado de marketing, supervisor, etc.

Si estás pensando en montar tu propio negocio, debes tener en cuenta que pasarás gran parte de tu tiempo haciendo planes, calculando facturas, etc. El problema es que muchas veces a los traductores se les enseña la teoría sobre cómo gestionar un negocio, pero nunca acaban llevándolo a la práctica, de modo que cuando tienen que enfrentarse a la vida real no saben hacerlo. Insistimos en que el éxito de un determinado negocio viene dado por una correcta organización previa y un cálculo adecuado del tiempo a emplear, de las inversiones que vamos a tener que realizar y de los beneficios a obtener. 

Para ello, es necesario investigar en Internet y averiguar qué es lo que podemos ofrecer de nuevo o de especial a nuestros clientes o cómo resultar más atractivos en un mercado internacional. Una correcta organización debe contar con un soporte tecnológico adecuado; de hecho, los clientes exigen un conocimiento exhaustivo de las nuevas tecnologías por parte de los traductores a los que contratan, de modo que para llegar a la gente es importante contar con una página web, disponible en distintas lenguas y con una distribución que facilite el acceso de los clientes. La información personal debe ser clara y estar bien a la vista, en un intento de ponerte en contacto emocionalmente con el cliente.

Sin embargo, puede que después de leer todas estas indicaciones, no sepas cómo salir adelante en la creación de tu propio negocio si ya hay tantos otros traductores experimentados y con trabajos previos con los que atraer clientes en la red. En ese caso, no desesperes, ya que lo puedes compensar con un ofrecimiento de tasas menores por traducción que lo que cobran los traductores más experimentados, por ejemplo. Y, por supuesto, insiste en el hecho de que es importante establecer una relación cerrada con los clientes: el cliente que obtiene un resultado satisfactorio en una traducción, suele repetir con un mismo traductor.

Métete en las redes sociales y date a conocer entre los demás traductores del sector que trabajes: el cliente que busca un traductor siempre acude a otro traductor ya conocido para él para que le recomiende a alguien. 

Y ese alguien podrías ser tú. 

martes, 6 de noviembre de 2012

The making of a professional translator


El antes y el después de la traducción automática 

Ahora que vamos a profundizar en el desarrollo de las herramientas dedicadas a la traducción automática, conviene echar la vista atrás y pararse a pensar en sus orígenes. No fue hasta mediados del siglo XVII cuando Johannes Becher escribió sobre la invención de un metalenguaje matemático diseñado para describir el significado de las frases escritas en cualquier idioma. De esta forma, las primeras máquinas de traducción fueron inventadas en 1930 y en 1940 por G. Astruni y P. Trojanskij y la primera demostración exitosa sobre una de las máquinas tuvo lugar el 7 de enero de 1954 en la Universidad de Georgetown, Washington. 

Después de aquello, el llamado Comité de Procesamiento Automático del Lenguaje publicó el ALPAC-Report, según el cual los editores de los sistemas de procesamiento de palabras debían ofrecer la posibilidad de editar e introducir textos en todas las lenguas, algo verdaderamente relevante desde la perspectiva del traductor. Desde entonces, el sistema de caracteres ASCII o ANSI ha supuesto la posibilidad de introducir textos en distintos alfabetos (no solamente el latino que utilizamos nosotros) y las "Memorias de Traducción" se han acabado convirtiendo en una herramienta fundamental para todo traductor: permiten organizar nuestras traducciones y, de esta manera, acceder a textos paralelos. 

Así, dando un salto a la actualidad, Emmanuel Margetic nos habla en uno de sus artículos de la combinación entre automatización y factor humano en la traducción. Afirma que hay verdaderos profesionales que han sido formados para ser traductores con distintas especialidades, pero que también hay demasiados “profesionales incompetentes”, que sólo por ser bilingües consideran que ya saben todo lo necesario para hacer una traducción adecuada. En mi opinión, no deberíamos ser tan radicales; para realizar el trabajo de un traductor es necesario tener una serie de conocimientos lingüísticos y culturales que, tanto el que se ha formado como traductor propiamente dicho como el que es bilingüe, pueden tener. Todo depende de la formación y experiencia personal de cada uno. 

Según Margetic, la traducción implica “pasión” por las lenguas y las culturas. Esa “pasión” de la que hablamos será, probablemente, el fundamento más sólido de la traducción durante los próximos años. Esto es así porque, pese a que la incursión de las nuevas tecnologías en el mundo de la traducción tendrá como resultado una menor presencia del traductor en el proceso, Margetic asegura que precisamente esa mezcla entre el aporte humano y el electrónico será el que dominará las siguientes generaciones de traductores. El ámbito cultural de todo texto es uno de sus elementos más importantes y, por así decirlo, el más “humano”. 

No obstante, no podemos olvidar que todas estas herramientas deben utilizarse correctamente o, de lo contrario, no nos proporcionarán la ayuda que esperamos. 

lunes, 5 de noviembre de 2012

Introducción


La automatización del proceso de traducción

¡Muy buenas! Si has entrado en este blog es porque te interesan los contenidos relacionados con el mundo de la traducción y, en concreto, con la Informática Aplicada a la Traducción (IAT), asignatura que se imparte en la UAM. Por eso, empezaremos hablando del entorno laboral del traductor y de las tecnologías de la información y la comunicación al servicio de la traducción.

En ese sentido, es importante hablar del porqué de estas nuevas tecnologías, ya que, como consecuencia de la globalización, las lenguas y su uso han cambiado. Dentro de la ley de la oferta y la demanda, es un requisito casi imprescindible saber hablar la lengua del cliente para poder venderle un producto (en términos de localización, está demostrado que los clientes compran lo que pueden entender).

Es cierto que el inglés ha acabado convirtiéndose en la lingua franca de nuestro tiempo y que su conocimiento es obligatorio en el mundo de los negocios, pero eso no significa que sea la única lengua que se utiliza en Internet, ni mucho menos. De hecho, el número de hablantes franceses, rusos, chinos, portugueses y, por supuesto, españoles ha crecido de forma importante en los últimos años y representa una cifra a tener en cuenta. Además, el lenguaje informal característico de algunas plataformas cibernéticas, como este blog, juega un papel muy importante para traductores y empresas de traducción, dado que cada vez se traducen más contenidos de este tipo.

Como ya sabes, toda traducción cuenta con una primera transferencia cultural y lingüística, después de la cual se produce la automatización del proceso de traducción a la que hacemos referencia: creación de diccionarios y bases terminológicas, traducción automática y memorias de traducción. Pero claro, si la traducción se convierte en un proceso automático, ¿dónde queda la labor del traductor como persona? De momento no tenemos por qué alarmarnos ante la posibilidad de perder nuestro trabajo, puesto que el traductor es quien realiza esa primera e importantísima transferencia cultural, un conocimiento que requiere de subjetividad y, por tanto, menos automatizable. 

En conclusión, la presencia de Internet y los archivos informáticos en la Traducción ha ido creciendo hasta acabar siendo un requisito indispensable para las empresas que requieran de los servicios de un traductor y, por supuesto, para todo traductor que se precie en estos tiempos. Ello producirá un cambio en la orientación de la profesión del traductor, pero el factor humano seguirá siendo necesario dentro del proceso comunicativo, a pesar de que en Internet se ofrezcan muchas herramientas gratuitas para la realización de traducciones de “andar por casa”. Eso sí, puede que las facturas que se pagan actualmente por una traducción no vuelvan a ser las mismas.