Sémantique linguistique, TAL et ingénierie des connaissances : le cas de la temporalité
Monday 7 May 2012 at 11.00 AM by rozenknop
Oratrice : Delphine Battistelli, MdC HDR, Université Paris Sorbonne, UFR ISHA (Institut des Sciences Humaines Appliquées), équipe STIH (Sens, Texte, Informatique, Histoire), membre associé du laboratoire MoDyCo (Modèles, Dynamiques, Corpus)
Résumé :
Je présenterai lors de cet exposé la manière dont j’envisage une articulation plus explicite entre sémantique linguistique, TAL et IC pour ce qui concerne en particulier la temporalité.
Il convient en effet selon moi d’opérer une distinction claire entre :
(i) l’analyse de la temporalité linguistique en tant que telle (c’est-à-dire en tant que catégorie sémantique langagière telle qu’elle est circonscrite et analysée dans les travaux de linguistique) ;
(ii) des visées de traitement (intuitives et applicatives) qui peuvent lui être associées (généralement, ce sont l’ordonnancement temporel et l’ancrage calendaire de situations factuelles) ;
(iii) en relation avec des besoins (en une analyse temporelle) de communautés d’utilisateurs données.
Souligner cette distinction, c’est pour moi faire mieux ressortir la complémentarité de ces points de vue. Il ressort en effet de (i) que l’ensemble (ii) peut alors être étendu (au calcul du degré de factualité des évènements par exemple) et que (ii) et (iii) fournissent des outils d’évaluation empirique de la pertinence de (i).
Ce point de vue méthodologique exploite le rapprochement manifeste ces dernières années entre les domaines du TAL et de la recherche d’information pour ce qui concerne la fouille et l’analyse sémantique de données textuelles. L’enjeu se situe bien sûr à l’aune d’une masse croissante de documents textuels de types très divers qui, si l’on y regarde de plus près, invitent à des angles d’analyse eux-mêmes très variés de la temporalité linguistique (on abordera par exemple plus facilement la question de la modalité dans des textes scientifiques que celle du temps, qui lui sera plutôt étudié dans des textes narratifs ou historiques, les marques énonciatives de points de vue étant elles l’objet de travaux sur des textes plutôt journalistiques et vecteurs d’opinions, etc.). Ce constat empirique reflète au demeurant une conception déjà inscrite dans l’analyse strictement linguistique de la temporalité qui met l’accent traditionnellement sur l’étroite interaction entre quatre dimensions sémantiques : l’aspect, le temps, la modalité et l’énonciation.
Je présenterai ici deux cas d’usage (développés au sein de deux projets de recherche distincts) qui me semblent particulièrement illustratifs : l’un accès sur la visualisation de chronologies évènementielles à partir d’un corpus de dépêches AFP ; l’autre accès sur l’analyse de la modalité dans des textes du domaine de la biologie. Dans les deux cas, il s’agit de montrer que des informations repérées dans les textes sont susceptibles d’être constituées en connaissances en regard des quatre dimensions sus-mentionnées – combinées ou non entre elles – par des experts d’un domaine donné et donc de participer à une ingénierie des connaissances textuelles.
![[LIPN]](/blog-themes/lipn-automne/img/logo_lipn.png)
![[CNRS]](/blog-themes/lipn-automne/img/logo_cnrs.png)
![[Université Paris 13]](/blog-themes/lipn-automne/img/logo_paris13.png)
About the ICS format