Choose your language
Eleka Il a développé une version améliorée de Matxin, le traducteur automatique pour la paire de langues castillan-basques
15/12/2009
Le développement de la version améliorée du traducteur automatique pour la paire de langues espagnol-basque a été réalisé en collaboration avec la Fondation Elhuyar et le groupe IXA de l'Université du Pays basque.
Cela fait cinq ans depuis qu'Eleka Ingeniaritza Linguistikoa, SL a commencé à développer la plate-forme Opentrad de traduction automatique en code source libre avec des entreprises et des universités de la Galice et des Pays catalans (www.opentrad.com). La version améliorée de Matxin (espagnol-basque) fait partie de la plate-forme Opentrad, où on a utilisé diverses technicques de traduction.
La présentation réalisée aujourd'hui en le Koldo Mitxelena Kulturunea a raconté avec la participation d'Inaki Irazabalbeitia (gérente d'Eleka), de Josu Waliño (directeur projets de la Fondation Elhuyar) et d'Iñaki Alegria (du groupe IXA de l'UPV-EHU). Ainsi qu'il s'est mentionné, la version qui s'est aujourd'hui montré est l'évolution de la version antérieure du traducteur automatique pour la paire castillane-basque.
Matxin est une application en code source libre, et fait partie de la plate-forme Opentrad. La version renouvelée que l'on a aujourd'hui présenté montre deux caractéristiques particuliers. D'un côté, on a amélioré le traducteur dans la combinaison espagnol-basque. C'est-à-dire, celle-ci est une version renouvelée du prototype que l'on a présenté en 2006, et on peut signaler qu'il a notablement amélioré sa qualité dans la traduction. Par ailleurs, on a créé le premier prototype du traducteur Matxin pour la direction basque-espagnol. Les deux traducteurs peuvent être utilisés de façon gratuite dans la page web www.opentrad.com.
Dans le monde de la traduction automatique on utilise deux méthodes de traduction: celui qui est basé sur les règles syntaxiques et le statistique. Le système basé sur des règles fonctionne avec de l'information linguistique, c'est-à-dire, on créé des règles selon la structure syntaxique de la langue. Au contraire, le système statistique se base sur des traductions déjà réalisées avec antériorité, et il utilise ces données au moment de réaliser les traductions. Dans le cas de Matxin on a développé et intégré les deux techniques dans la combinaison espagnol-basque; et on a seulement utilisé le méthode statistique pour la combinaison basque-espagnol.
La valeur ajoutée la plus importante de Matxin pour la paire espagnol-basque est qu'il fait partie du système en code source libre Opentrad. Donc, le moteur de traduction espagnol-basque restera au service de la communauté après son développement. Ainsi, n'importe quel utilisateur pourra adapter le traducteur à ses besoins, sans avoir à payer aucune licence.
On peut accéder au moteur développé par Eleka dans la page web www.opentrad.com.
On a manifesté de la reconnaissance aux mairies de Saint-Sébastien, de Vitoria-Gasteiz et d'Arrasate, à IVAP, à Eroski, à EiTBNET et au magazine Aldaketa 16, par les mémoires de traduction qu'ils ont prêté, puisqu'ils ont été très utiles pour l'entraînement du système statistique.
Cette initiative a été subventionnée par le Département d'Industrie, Commerce et Tourisme du Gouvernement basque, et par le Ministère d'Industrie, Tourisme et Commerce, avec les programmes Gaitek et Profit, respectivement.


