Guérin François
INRIA, France
- Article 119 : Analyse syntaxique statistique du Français : des constituants aux dépendances
- Auteurs :
Crabbé Benoit (Paris 7 / Inria, France)
Candito Marie (Paris 7 / Inria, France)
Denis Pascal (Inria, France)
Guérin François (INRIA, France)
- Conférence : TALN
- Type : Communication orale
- Résumé : Cet article présente une technique d'analyse syntaxique statistique à la fois en constituants et en dépendances.
L'analyse procède en ajoutant des étiquettes fonctionnelles aux sorties d'un analyseur en constituants, entraîné sur le French Treebank, pour permettre l'extraction de dépendances
typées.
D'une part, nous spécifions d'un point de vue formel et
linguistique les structures de dépendances à produire, ainsi que la
procédure de conversion du corpus en constituants (le French
Treebank) vers un corpus cible annoté en dépendances, et partiellement validé.
D'autre part, nous décrivons l'approche algorithmique qui permet de réaliser automatiquement le typage des dépendances en sortie d'analyse. En particulier, nous nous focalisons sur les méthodes d'apprentissage discriminantes d'étiquetage en fonctions grammaticales.
- Format PDF