Crego Josep Maria
LIMSI-CNRS, France
- Article 100 : Plusieurs langues (bien choisies) valent mieux qu'une : traduction statistique multisource par renforcement lexical
- Auteurs :
Crego Josep Maria (LIMSI-CNRS, France)
Max Aurélien (LIMSI-CNRS & Université Paris-Sud, France)
Yvon François (LIMSI-CNRS & Université Paris-Sud, France)
- Conférence : TALN
- Type : Poster
- Résumé : Les systèmes de traduction statistiques actuels intègrent différents modèles qui mettent en jeu, lors du décodage, le plus d'informations disponibles afin de produire les meilleures traductions possibles. Traduire correctement des mots polysémiques, comme par exemple le mot avocat du français vers l'anglais (lawyer ou avocado), requiert l'intégration de modèles complexes. Or, cette difficulté inhérente à la polysémie n'est pas la même en fonction des langues sources considérées. Si l'on dispose, par exemple, d'un document en espagnol dans lequel avocat a été traduit par aguacate, alors la traduction de ce mot vers l'anglais n'est pas ambiguë et permet donc de renforcer la sélection de la traduction avocado pour le système français->anglais. Dans cet article, nous proposons tout d'abord d'utiliser des documents en plusieurs langues pour renforcer par pivot les choix lexicaux faits par un système de traduction automatique. L'objectif général est d'améliorer un système pour une paire de langues L1->L2 en exploitant conjointement des traductions disponibles dans d'autres langues Li (avec i>2) et les sorties de systèmes automatiques Li->L2. Nous présentons ici deux manières d'aborder ce problème: 1) en exploitant des traductions humaines disponibles entre les langues L1 et Li, et 2) en exploitant des traductions automatiques entre les langues L1 et Li.
- Format PDF