Charton Eric
Laboratoire Informatique d'Avignon - Université d'Avignon, France
- Article 12 : Combinaison de contenu encyclopédique et d'automates à états finis pour une reconnaissance d'entités nommées robuste
-
Auteur :
Charton Eric (Laboratoire Informatique d'Avignon - Université d'Avignon, France)
- Conférence : RECITAL
- Type : Poster
- Résumé : Dans cet article, nous présentons une méthode pour combiner l'utilisation de Wikipédia en tant que ressources d'information externe et des automates à états finis pour détecter et désambigüiser des entités nommées, en milieu ouvert, et sans apprentissage spécifique. Nous expliquons comment nous construisons notre système en utilisant cinq éditions linguistiques de Wikipédia. Pour fini nous réalisons une évaluation complète des performances du système sur une tâche d'extraction d'entités nommées appliquée à un corpus d'articles journalistiques, et à des transcriptions radiophoniques.
- Format PDF
- Article 112 : Classification encyclopédique en vue d'un étiquetage par entités nommées
- Auteurs :
Charton Eric (Laboratoire Informatique d'Avignon - Université d'Avignon, France)
Torres-Moreno Juan-Manuel (Laboratoire Informatique d'Avignon - Université d'Avignon, France)
- Conférence : TALN
- Type : Communication orale
- Résumé : L'étiquetage par entités nommées recourant à des ressources d'étiquetage externes, fait l'objet d'un regain d'intérêt avec l'apparition de Wikipédia ou Wordnet. La disponibilité de ces corpus encyclopédiques numériques de grande taille, multilingues, exhaustifs et ouverts, conduit à proposer des solutions de labellisation qui exploitent les connaissances qu'ils contiennent.
La mise en correspondance d'une séquence de mot avec un document encyclopédique est possible, mais la classification des étiquettes et des entités encyclopédiques mises en relation n'est pas encore complètement résolue.
Le corpus encyclopédique ouvert tel que Wikipédia est en effet classé de manière anarchique, et sa consistance rend parfois difficile la mise relation des ses entités avec un système taxonomique contraint.
Dans cet article nous explorons cette difficulté et proposons un système complet pour répondre à ce besoin.
- Format PDF