Résumé automatique multi-document et indépendance de la langue : une première évaluation en français
TALN (Poster)
- Auteurs :
Boudin Florian (Laboratoire Informatique d'Avignon / Université d'Avignon, France)
Torres-Moreno Juan-Manuel (Laboratoire Informatique d'Avignon / Université d'Avignon, France)
- Résumé : Le résumé automatique de texte est une problématique difficile, fortement dépendante de la langue et qui peut nécessiter un ensemble de données d'apprentissage conséquent. L'approche par extraction peut aider a surmonter ces difficultés. (Mihalcea, 2004) a démontré l'intérêt des approches à base de graphes pour l'extraction de segments de texte importants. Dans cette étude, nous décrivons une approche indépendante de la langue pour la problématique du résumé automatique multi-documents. L'originalité de notre méthode repose sur l'utilisation d'une mesure de similarité permettant le rapprochement de segments morphologiquement proches. De plus, c'est à notre connaissance la première fois que l'évaluation d'une approche de résumé automatique multi-document est conduite sur des textes en français.
- Format PDF