Trouilleux François
Université Blaise-Pascal, France
- Article 6 : Un analyseur de surface non déterministe pour le français
-
Auteur :
Trouilleux François (Université Blaise-Pascal, France)
- Conférence : TALN
- Type : Communication orale
- Résumé : Les analyseurs syntaxiques de surface à base de règles se caractérisent par un processus en deux temps: désambiguïsation lexicale, puis reconnaisance de patrons. Considérant que ces deux étapes introduisent une certaine redondance dans la description linguistique et une dilution des heuristiques dans les différents processus, nous proposons de définir un analyseur de surface qui fonctionne sur une entrée non désambiguïsée, et produise l'ensemble des analyses possibles en termes de syntagmes noyau ({it chunks}). L'analyseur, implanté avec NooJ, repose sur la définition de patrons {it étendus} qui annotent des {it séquences} de syntagmes noyau. Les résultats obtenus sur un corpus de développement d'environ 22500 mots, avec un rappel proche de 100~%, montrent la faisabilité de l'approche, et signalent quelques points d'ambiguïté à étudier plus particulièrement pour améliorer la précision.
- Format PDF