Ordenadores “con dolores” y otras traducciones incorrectas


Los profesores de la Universidad de Málaga, Gloria Corpas y Ruslan Mitkov  están dando los últimos toques al proyectos de investigación Advanced LAnguage TEchnology Platform forTranSlaTors (LATEST), perteneciente al Programa Marie Curie de la Unión Europea 327197.

El proyecto LATEST busca ofrecer a los traductores  e investigadores en general la posibilidad de traducir frases completas a través de un programa informático que busca comprender el sentido de las unidades fraseológicas. Así, estos investigadores han logrado crear una metodología para traducir más allá de las simples palabras buscando el sentido que les damos a frases hechas o a refranes de uso cotidiano. Tal y como ha señalado el profesor Ruslan Mitkov, investigador Marie Curie del proyecto,  “no se trata solo de traducción,  esta es solo una aplicación posible, también se puede aplicar a la simplificación de textos  para personas con autismo”. El profesor del Máster de Traducción e investigador Marie Curie, Ruslan Mitkov.

Frases tan recurrentes como “paño de lágrimas”, “de perdidos al río”, “ponerse el mundo por montera”, no cuentan con traducciones directas de un idioma a otro, por lo que no solo se debe buscar un posible equivalente en la lengua de destino, sino que se precisa establecer el sentido transmitido por dicha frase en la lengua de origen para luego poder trasvasarla de forma adecuada.

Bajo el concepto de “real pain in the neck for computer” (literalmente “dolor de cuello de los ordenadores”) se busca presentar una metodología que ofrezca una traducción real y con sentido para los textos científicos y técnicos. La hipótesis de la que parten estos investigadores señala que una frase y su traducción suelen presentar contextos similares en ambos idiomas, por lo que la traducción es más eficaz si se parte del entorno contextual, que si únicamente se realiza una simple operación de búsqueda y sustitución de la unidad fraseológica original por su posible equivalente en el otro idioma. Es decir, parten de la idea de que la traducción por contextos es más efectiva que la simple translación de palabras independientes. Desde la fraseología, el proyecto LATEST estudia las secuencias de palabras que presentan un significado unitario de tipo idiomático o no literal. Un ejemplo ofrecido por el profesor Mitkov sería el uso de la unidad lingüística “escalera de caracol”, cuyo sentido nos remite a la forma de la estructura sin referir necesariamente al molusco. En la traducción a otro idioma de este tipo de frases los programas automáticos no dan resultados fiables, ofreciendo la traducción directa de cada palabra de forma independiente. La profesora de traducción de la Universidad de Málaga y encargada del proyecto LATEST, Gloria Corpas.

La propuesta de Mitkov y Corpas se desarrolla a través de una metodología basada en la interpretación de conceptos mediante el uso de corpus comparables, equiparables en cuanto a las temáticas, los tipos textuales, etc. Las formas lingüístico-textuales empleadas para la expresión de conceptos similares en ambas lenguas fija las pautas que permitirán una traducción basada en contextos y no palabras, señalando que “una vez se encuentran dos contextos probables se intentan alinear las palabras y las frases” ofreciendo un acercamiento a la lengua más allá de la propia traslación del significado de los vocablos.

Mitkov aclara que “no utilizamos recursos ni semánticos ni de traducción, solo el corpus comparable, del cual se extraen las posibles candidatos a equivalentes a fin de identificar el más adecuado en cada caso”. De esta forma se construye un sistema de traducción independiente del idioma y solo basado en los conceptos e ideas que se buscan entender. Con este proyecto ambos investigadores buscan dar un paso más en la traducción automática, para centrarse en el sentido de las frases más allá de las palabras aisladas. La metodología desarrollada puede ser de aplicación inmediata también para la enseñanza-aprendizaje de idiomas y la traducción profesional.

Contextos por encima de palabras

La metodología de este proyecto de investigación se basa en la identificación de contextos similares como base de extracción de candidatos a equivalentes. La incorporación del contexto permite desarrollar sistemas de extracción automática de candidatos a equivalentes (palabras y unidades fraseológicas) de base estadística e independientes del idioma. Esta metodología puede ser de aplicación inmediata también para la enseñanza-aprendizaje de idiomas y la traducción profesional. Partiendo del uso de corpus comparables (constituidos por textos no traducidos y equiparables en varios idiomas), la extracción por contexto permite traducir de forma más eficaz las ideas expresadas en los textos, sin quedarse en la literalidad superficial y superar la ambigüedad de la posible polisemia de las unidades fraseológicas.

*Fe de erratas: en la edición papel, el nombre del profesor Ruslan Mitkov aparece como “Rusian”, señalamos el error y subrayamos la correción como Ruslan Mitkov.


Compartir

Su email no será mostrado en los comentarios. Los campos requeridos son marcados con *