Une approche mixte -statistique et structurelle- pour le résumé automatique de dépêches
TALN (Communication orale)
-
Auteur :
Bossard Aurélien (LIPN, France)
- Résumé : Les techniques de résumé automatique multi-document par extraction ont récemment évolué vers des méthodes statistiques pour la sélection des phrases à extraire, délaissant de plus en plus l'analyse structurelle et linguistique des documents. Dans cet article, nous montrons l'intérêt de telles analyses et présentons un système conforme à l'état de l'art -- CBSEAS -- que nous avons développé pour la tâche Update (résumés de dépêches et mise à jour du résumé à parti de nouvelles dépêches sur le même événement) de la campagne d'évaluation TAC 2008. Nous présenterons également notre étude sur la structure des dépêches et l'impact de son intégration à CBSEAS.
Nous finirons par une discussion sur notre système et une présentation de nos perspectives.
- Format PDF