Combinaison de contenu encyclopédique et d'automates à états finis pour une reconnaissance d'entités nommées robuste
RECITAL (Poster)
-
Auteur :
Charton Eric (Laboratoire Informatique d'Avignon - Université d'Avignon, France)
- Résumé : Dans cet article, nous présentons une méthode pour combiner l'utilisation de Wikipédia en tant que ressources d'information externe et des automates à états finis pour détecter et désambigüiser des entités nommées, en milieu ouvert, et sans apprentissage spécifique. Nous expliquons comment nous construisons notre système en utilisant cinq éditions linguistiques de Wikipédia. Pour fini nous réalisons une évaluation complète des performances du système sur une tâche d'extraction d'entités nommées appliquée à un corpus d'articles journalistiques, et à des transcriptions radiophoniques.
- Format PDF