Langlais Philippe
DIRO - Université de Montréal, Canada
- Article 44 : Intégration de l'alignement de mots dans le concordancier bilingue TransSearch
- Auteurs :
Huet Stéphane (DIRO - Université de Montréal, Canada)
Bourdaillet Julien (DIRO - Université de Montréal, Canada)
Langlais Philippe (DIRO - Université de Montréal, Canada)
- Conférence : TALN
- Type : Communication orale
- Résumé : Malgré les nombreuses études visant à améliorer la traduction automatique, la traduction assistée par ordinateur reste la solution préférée des traducteurs lorsqu'une sortie de qualité est recherchée. Dans cet article, nous présentons nos travaux menés dans le but d'améliorer le concordancier bilingue TransSearch. Ce service, accessible sur le Web, repose principalement sur un alignement au niveau des phrases. Dans cette étude, nous discutons et évaluons l'intégration d'un alignement statistique au niveau des mots. Nous présentons deux nouvelles problématiques essentielles au succès de notre nouveau prototype : la détection des traductions erronées et le regroupement des variantes de traduction similaires.
- Format PDF
- Article 92 : Étude quantitative de liens entre l'analogie formelle et la morphologie constructionnelle
-
Auteur :
Langlais Philippe (Université de Montréal, Canada)
- Conférence : TALN
- Type : Communication orale
- Résumé : Plusieurs travaux ont récemment étudié l'apport de l'apprentissage analogique dans des applications du traitement automatique des langues comme la
traduction automatique, ou la recherche d'information. Il est souvent admis que
les relations analogiques de forme entre les mots capturent des informations de
nature morphologique. Le but de cette étude est de présenter une analyse des
points de rencontres entre l'analyse morphologique et les analogies de forme.
C'est à notre connaissance la première étude de ce type portant sur des corpus de
grande taille et sur plusieurs langues.
- Format PDF
- Article 93 : Prise en compte de dépendances syntaxiques pour la traduction contextuelle de segments
- Auteurs :
Max Aurélien (LIMSI / Université Paris Sud XI, France)
Malhoufi Rafik (Université de Technologie de Troyes, France)
Langlais Philippe (Université de Montréal, Canada)
- Conférence : TALN
- Type : Communication orale
- Résumé : Dans un système standard de traduction statistique basé sur les segments, le score attribué aux différentes traductions d'un segment ne dépend pas du
contexte dans lequel il apparaît. Plusieurs travaux récents tendent à montrer
l'intérêt de prendre en compte le contexte source lors de la traduction, mais ces
études portent sur des systèmes traduisant vers l'anglais, une langue faiblement
fléchie. Dans cet article, nous décrivons nos expériences sur la prise en compte
du contexte source dans un système statistique traduisant de l'anglais vers le
français, basé sur l'approche proposée par Stroppa et al. (2007). Nous
étudions l'impact de différents types d'indices capturant l'information
contextuelle, notamment des dépendances syntaxiques typées.
Si les mesures automatiques d'évaluation de la qualité d'une traduction ne
révèlent pas de gains significatifs de notre système par rapport à un système à
l'état de l'art ne faisant pas usage du contexte, une évaluation manuelle
conduite sur 100 phrases choisies aléatoirement est en faveur de notre système.
Cette évaluation fait également ressortir que la prise en compte de certaines
dépendances syntaxiques est bénéfique à notre système.
- Format PDF