Fort Karën
INIST, France
- Article 76 : Vers une méthodologie d'annotation des entités nommées en corpus ?
- Auteurs :
Fort Karën (INIST, France)
Ehrmann Maud (XRCE, France)
Nazarenko Adeline (LIPN, France)
- Conférence : TALN
- Type : Communication orale
- Résumé : La tâche, aujourd'hui considérée comme fondamentale, de reconnaissance d'entités nommées présente des difficultés spécifiques en matière d'annotation. Nous les précisons ici, en les illustrant par des expériences d'annotation manuelle menées dans le cadre du projet Quaero dans le domaine de la microbiologie. Ces problèmes nous amènent à reposer la question fondamentale de ce que les annotateurs doivent annoter et surtout, pour quoi faire. Nous identifions pour cela les applications nécessitant l'extraction d'entités nommées, puis, en fonction des besoins de ces applications, nous proposons de définir sémantiquement les éléments à annoter. Nous proposons ensuite un certain nombre de recommandations méthodologiques permettant d'assurer un cadre d'annotation cohérent et évaluable.
- Format PDF