GL | ES | CA | EU | EN | PT | FR

Eleka ha desarrollado una versión mejorada de Matxin, el traductor automático para el par de lenguas castellano-euskera

15/12/2009

News:Eleka ha desarrollado una versión mejorada de Matxin, el traductor automático para el par de lenguas castellano-euskera

El desarrollo de la versión mejorada del traductor automático para el par de lenguas castellano-euskera ha sido realizado en colaboración con la Fundación Elhuyar y el grupo IXA de la UPV/EHU. 

Han pasado cinco años desde que Eleka Ingeniaritza Linguistikoa, SL comenzara a desarrollar la plataforma Opentrad de traducción automática en código abierto junto con empresas y universidades de Galicia y de los Países Catalanes. (www.opentrad.com). La versión mejorada de Matxin (castellano-euskera) forma parte de la plataforma Opentrad, donde se han utilizado diversas técnicas de traducción.

La presentación realizada hoy en el Koldo Mitxelena Kulturunea ha contado con la participación de Inaki Irazabalbeitia (gerente de Eleka), de Josu Waliño (director de proyectos de la Fundación Elhuyar) y de Iñaki Alegria (del grupo IXA de la UPV-EHU). Tal y como se ha mencionado, la versión que se ha mostrado hoy es la evolución de la versión anterior del traductor automático para el par castellano-euskera.

Matxin es una aplicación de código abierto, y forma parte de la plataforma Opentrad. La versión renovada que se ha presentado hoy muestra dos características particulares. Por una parte, se ha mejorado el traductor de castellano a euskera. Es decir, esta es una versión renovada del prototipo que se presentó en 2006, y cabe destacar que ha mejorado notablemente su calidad en la traducción. Por otra parte, se ha creado el primer prototipo del traductor Matxin para la dirección euskera-castellano. Los dos traductores pueden ser utilizados de forma gratuita en la página web www.opentrad.com.

En el mundo de la traducción automática se utilizan dos métodos para la traducción: el que está basado en las reglas sintácticas y el estadístico. El sistema basado en reglas funciona con información lingüística, es decir, se crean reglas según la estructura sintáctica del idioma. Por el contrario, el sistema estadístico se basa en traducciones ya realizadas con anterioridad, y utiliza esos datos a la hora de realizar las traducciones. En el caso de Matxin se han desarrollado e integrado las dos técnicas para la combinación castellano-euskera; y  solo se ha utilizado el método estadístico para la combinación euskera-castellano.

El valor añadido más importante de Matxin para el par castellano-euskera es que forma parte del sistema de código abierto Opentrad. Por lo tanto, el motor de traducción castellano-euskera queda al servicio de la comunidad después de su desarrollo. Así, cualquier usuario podrá adaptarlo a sus necesidades, sin tener que pagar ninguna licencia.

Se puede acceder al motor desarrollado por Eleka en la página web www.opentrad.com.

Se han expresado muestras de agradecimiento a los ayuntamientos de Donostia-San Sebastián, de Vitoria-Gasteiz y de Arrasate, a IVAP, a Eroski, a EiTBNET y a la revista Aldaketa 16, por las memorias de traducción que prestaron, puesto que han sido de gran utilidad para el entrenamiento del sistema estadístico.

Esta iniciativa ha sido subvencionada por el Departamento de Industria, Comercio y Turismo del Gobierno Vasco, y por el Ministerio de Industria, Turismo y Comercio, con los programas Gaitek y Profit, respectivamente.

 

invasión