Evaluan la calidad de diferentes métodos de traducción automática

El estudio evalúa tres motores de traducción automática del francés al español y al italiano / UPF

La traducción automática es el proceso en el que un software convierte un texto de un idioma a otro. La post-edición consiste en la corrección de traducciones automáticas para asegurar su calidad. Entre las expectativas de la post-edición está la de conseguir una calidad similar a la traducción humana.

 

UPF / A medida que más proveedores de servicios lingüísticos incluyen la post-edición de traducción automática en su flujo de trabajo, “vemos como los estudios sobre evaluación de la calidad de la traducción automática se vuelven cada vez más importantes”, afirma Clara Ginovart, autora de un trabajo recientemente publicado en Translating and the Computer 40 que reúne las ponencias presentadas en el congreso The International Association for Advancement in Language Tehcnology (AsLing) celebrado los días 15 y 16 de noviembre en Londres (Reino Unido).

Los estudios sobre evaluación de la calidad de la traducción automática se vuelven cada vez más importantes

Clara Ginovart está llevando a cabo un Doctorado Industrial en la empresa Datawords, en París (Francia), bajo la supervisión de Carme Colominas, investigadora del Grupo de Investigación en Lingüística Computacional GLiCom (UR-LING), en el Departamento de Traducción y Ciencias del Lenguaje (DTCL) de la UPF, y de Antoni Oliver (UOC), dentro del programa de doctorado en Traducción y Ciencias del Lenguaje de la UPF.

La investigación de Clara Ginovart ha consistido en el análisis del resultado de un estudio de caso que evalúa tres motores de traducción automática del francés al español y al italiano, dos de ellos métodos estadísticos y un tercero un método neuronal, una tecnología novedosa en el mundo de la traducción automática por basarse en la inteligencia artificial (deep learningrecurrente neural networks, etc.) y que ha demostrado en publicaciones recientes acercarse más a la calidad de traducción humana. Pero, ¿en todos los casos? se pregunta Guinovart.

El trabajo concluye que los corpus paralelos son insuficientes para que los nuevos sistemas lleguen a igualar la calidad de los estadísticos

El trabajo que ha sido recientemente publicado describe los resultados de la traducción automática en dos tipos de texto de una web dedicada al motociclismo que fue traducida por Datawords.

En definitiva, la investigación concluye que, para algunos pares de lenguas y ámbitos de especialización, los corpus paralelos son insuficientes para que los nuevos sistemas neuronales lleguen a igualar la calidad de los estadísticos; por tanto, a la luz de los resultados, “tendremos que ser prudentes y precisos al hablar de calidad de traducción automática para no crear falsas esperanzas”, alerta la autora de la investigación.

Referencia bibliográfica: 
Clara Ginovart Cid (2018), “Statistical & Neural MT Systems in the Motorcycling Domain for Less Frequent Language Pairs – How Do Professional Post-editors Perform?”,  Translating and the Computer 40Proceedings 15-16 November 2018, One Birdcage Walk, London, pp. 66-78.

Dejar comentario

Deja tu comentario
Pon tu nombre aquí