Nazarenko Adeline
LIPN, France
- Article 76 : Vers une méthodologie d'annotation des entités nommées en corpus ?
- Auteurs :
Fort Karën (INIST, France)
Ehrmann Maud (XRCE, France)
Nazarenko Adeline (LIPN, France)
- Conférence : TALN
- Type : Communication orale
- Résumé : La tâche, aujourd'hui considérée comme fondamentale, de reconnaissance d'entités nommées présente des difficultés spécifiques en matière d'annotation. Nous les précisons ici, en les illustrant par des expériences d'annotation manuelle menées dans le cadre du projet Quaero dans le domaine de la microbiologie. Ces problèmes nous amènent à reposer la question fondamentale de ce que les annotateurs doivent annoter et surtout, pour quoi faire. Nous identifions pour cela les applications nécessitant l'extraction d'entités nommées, puis, en fonction des besoins de ces applications, nous proposons de définir sémantiquement les éléments à annoter. Nous proposons ensuite un certain nombre de recommandations méthodologiques permettant d'assurer un cadre d'annotation cohérent et évaluable.
- Format PDF
- Article 164 : Apport des outils de TAL à la construction d'ontologies : propositions au sein de la plateforme DAFOE
- Auteurs :
Charlet Jean (INSERM, France)
Szulman Sylvie (Université Paris XIII, LIPN, France)
Aussenac-Gilles Nathalie (Université Paul Sabatier, IRIT, France)
Nazarenko Adeline (Université Paris XIII, LIPN, France)
Hernandez Nathalie (Université Paul Sabatier, IRIT, France)
Nadah Nadia (Heudiasyc CNRS/UMR 6599, Université de Technologie de Compiègne, France)
Sardet Éric (LISI-ENSMA et CRITT-Informatique, Poitiers, France)
Delahousse Jean (MONDECA, Paris, France)
Pierra Guy (LISI-ENSMA et CRITT-Informatique, Poitiers, France)
- Conférence : TALN
- Type : Démonstration
- Résumé : La construction d'ontologie à partir de textes fait l'objet d'études depuis plusieurs années dans le domaine de l'ingénierie des
ontologies. Un cadre méthodologique en quatre étapes (constitution
d'un corpus de documents, analyse linguistique du corpus,
conceptualisation, opérationnalisation de l'ontologie) est commun à
la plupart des méthodes de construction d'ontologies à partir de
textes. S'il existe plusieurs plateformes de traitement automatique de la
langue (TAL) permettant d'analyser automatiquement les corpus et de
les annoter tant du point de vue syntaxique que statistique, il
n'existe actuellement aucune procédure généralement acceptée, ni a
fortiori aucun ensemble cohérent d'outils supports, permettant de
concevoir de façon progressive, explicite et traçable une ontologie
de domaine à partir d'un ensemble de ressources informationnelles
relevant de ce domaine. Le but de ce court article est de présenter
les propositions développées, au sein du projet ANR DAFOE4App, pour
favoriser l'émergence d'un tel ensemble d'outils.
- Format PDF