Nakamura Takuya
IGM-LabInfo Université Paris-Est, France
- Article 24 : Une expérience de fusion pour l'annotation d'entités nommées
- Auteurs :
Brun Caroline (XRCE, France)
Dessaigne Nicolas (Arisem, France)
Ehrmann Maud (XRCE, France)
Gaillard Baptiste (Thalès, France)
Guillemin-Lanne Sylvie (Temis, France)
Jacquet Guillaume (XRCE, France)
Kaplan Aaron (XRCE, France)
Kucharski Marianna (Temis, France)
Martineau Claude (IGM-LabInfo Université Paris-Est, France)
Migeotte Aurélie (Arisem, France)
Nakamura Takuya (IGM-LabInfo Université Paris-Est, France)
Voyatzi Stavroula (IGM-LabInfo Université Paris-Est, France)
- Conférence : TALN
- Type : Communication orale
- Résumé : Nous présentons une expérience de fusion d'annotations d'entités nommées provenant de différents annotateurs. Ce travail a été réalisé dans le cadre du projet Infom@gic, projet visant à l'intégration et à la validation d'applications opérationnelles autour de l'ingénierie des connaissances et de l'analyse de l'information et soutenu par le pôle de compétitivité Cap Digital « Image, MultiMédia et Vie Numérique ». Nous décrivons tout d'abord les quatre annotateurs d'entités nommées à l'origine de cette expérience. Chacun d'entre eux fournit des annotations d'entités conformes à une norme développée dans le cadre du projet Infom@gic. L'algorithme de fusion des annotations est ensuite présenté ; il permet de gérer la compatibilité entre annotations et de mettre en évidence les conflits, et ainsi de fournir des informations plus fiables. Nous concluons en présentant et interprétant les résultats de la fusion, obtenus sur un corpus de référence annoté manuellement.
- Format PDF
- Article 62 : La complémentarité des approches manuelle et automatique en acquisition lexicale
- Auteurs :
Messiant Cédric (Université Paris-Nord, LIPN, France)
Nakamura Takuya (Université Paris-Est, Laboratoire d'informatique Gaspard Monge, France)
Voyatzi Stavroula (Université Paris-Est, Laboratoire d'informatique Gaspard Monge, France)
- Conférence : TALN
- Type : Poster
- Résumé : Les ressources lexicales sont essentielles pour obtenir des systèmes de traitement des langues performants. Ces ressources peuvent être soit construites à la main, soit acquises automatiquement à partir de corpus. Nous essaierons dans cet article de montrer la complémentarité de ces deux approches. Pour ce faire, nous utiliserons l'exemple de la sous-catégorisation verbale en comparant un lexique acquis par des méthodes automatiques (LexSchem) avec un lexique construit manuellement (Le Lexique-Grammaire). Nous montrerons que les informations acquises par ces deux méthodes sont bien distinctes et qu'elles peuvent s'enrichir mutuellement.
- Format PDF