Actualités du LIPN

[LIPN] [CNRS] [Université Paris 13]

To content | To menu | To search

Future posts

Thursday 31 May 2012

Systèmes de recommandation appliqués aux offres d'emploi diffusées sur le web

fr 

Nous accueillerons Julie Séguéla de la Société Multiposting et du CNAM/ENSIIE - Centre d’Etude et De Recherche en Informatique et Communications.

Résumé:
Les entreprises disposent aujourd’hui de bases de données très volumineuses stockant les achats, notations ou usages de l’ensemble de leurs clients ou utilisateurs. Ces historiques peuvent être enrichis de variables descriptives des utilisateurs. Tirant profit de ces informations, les systèmes de recommandation ont pour objectif de fournir aux clients des suggestions personnalisées pour leurs prochaines utilisations ou consommations. Dans un contexte de démarrage à froid, le système ne dispose d’aucune information sur les préférences des utilisateurs, l’utilisation de données additionnelles est alors requise. Nous proposons une application innovante des systèmes de recommandation pour la prédiction du rendement d’une offre d’emploi publiée sur un site web dédié à l’emploi. Deux cas sont étudiés : l’offre n’a jamais été publiée (démarrage à froid), ou celle-ci a déjà été publiée par le passé sur un ou plusieurs sites d’emploi. Les offres sont décrites simultanément par des données textuelles et des données structurées. Nous introduisons un système hybride de recommandation, basé sur une mesure de similarité entre offres, permettant de gérer des données hétérogènes et de grande dimension. Ce système montre des résultats supérieurs à ceux obtenus avec des approches classiques de modélisation multivariée.

Past posts

Tuesday 15 May 2012

Séminaire "Emotions !" 2

 

Séminaire ISCN - SAM - LITIS

L'ISCN (Institut des Systèmes Complexes), SAM (Séminaire l'Art de la Modélisation) et le LITIS vous convient à la seconde 1/2 journée séminaire Émotions !

Mardi 15 Mai 2012

INSA de Rouen (Bâtiment D'Umont d'Urville - amphi DU.B.RJ.06)

Programme

   14h-15h - Magalie Ochs : "Vers des agents virtuels et physiques dotés d’une intelligence socio-émotionnelle"
   15h-16h - Émilie Chanoni : "Narration d'émotions entre parents et enfants âgés de 3 - 5 ans : Intérêts d'une collaboration pychologie-informatique"
   16h-17h - Sophie Baudic : "Douleur et émotions : des interactions constantes et complexes

Résumés :

Magalie Ochs : "Vers des agents virtuels et physiques dotés d’une intelligence socio-émotionnelle" Les interactions humain-machine sont aujourd’hui intrinsèquement sociales et émotionnelles, impliquant souvent une expérience affective dans un contexte social particulier. Doter une machine d’une intelligence socio-émotionnelle signifie lui donner la capacité de sociabiliser aisément avec l’utilisateur et de gérer ses propres émotions et celles de son interlocuteur. Dans cette présentation, nous nous intéresserons à la place de l’intelligence sociale et émotionnelle dans l'interaction humain-machine. Différentes problématiques sous-jacentes à la création d’agents virtuels ou physiques dotés d’une telle intelligence seront introduites. Pour déterminer le comportement socio-émotionnel d’agents durant une interaction avec un utilisateur, des modèles computationnels, construits principalement à partir d’une approche centrée utilisateur, seront présentés.

Émilie Chanoni : "Narration d'émotions entre parents et enfants âgés de 3 - 5 ans" Il est établi en psychologie du développement de l’enfant que la compréhension des états mentaux est graduelle et qu’elle se construit à travers les régularités repérées lors des interactions (Milligan et al. 2007 ; Lewis & Carpendale 2002 ; Deleau et al. 1999 ; Siegal & Peterson 1994). Aussi nous cherchons à saisir le processus par lequel les parents articulent leur discours pour développer chez l’enfant la compréhension des états émotionnels d’autrui. Dans cette étude, une trentaine de dialogues entre parent et enfant (âgés entre 3 et 5ans) en situation de lecture d’histoire à contenu émotionnel ont été enregistrés. Ces enregistrements ont été retranscrits puis codés à l’aide d’une grille centrée sur les états mentaux (Chanoni, 2004, 2009). Les résultats de ce codage ont fait l’objet de deux méthodes 1/ une fouille de données (Rioult, 2010) dont l’objectif est de prédire les interventions de l’enfant 2/ une recherche de motifs approchés récurrents au sein des échanges (Chanoni et al., 2008, 2009 ; Lecroq et al., sous presse). Dans ce séminaire, nous aborderons les premiers résultats de ces deux méthodes et leur intérêt vers une modélisation de dialogues asymétriques parent- jeune enfant. Cette recherche est issue de la première partie d’une étude financée (PEPS, ACAMODIA). Un deuxième temps sera d’implémenter ces motifs au sein d’un agent conversationnel et de tester leur fonctionnalité en retour.

Sophie Baudic : "Douleur et émotions : des interactions constantes et complexes" La douleur induit des émotions négatives passagères (affect primaire) et des troubles émotionnels persistants tels que l’anxiété ou la dépression (affect secondaire). De ce fait, la prise en charge de la douleur n’est pas adaptée si elle ne tient pas compte des émotions qui lui sont associées. De récentes études ont montré que les émotions négatives (peur, colère, anxiété...) exacerbaient généralement la douleur alors que les émotions positives la réduisaient. Les mécanismes de régulation centraux qui modulent ces interactions complexes sont encore très largement méconnus. Une meilleure compréhension de ces mécanismes nous permettrait de développer de nouvelles thérapies.

Monday 14 May 2012

Explicit substitutions at a distance, rewriting, and applications to the theory of lambda calculus

fr 

Le 14 mai 2012, à 14h en salle B311, le séminaire LCR accueille Beniamino Accattoli (LIX).

In some works in collaboration with Stefano Guerrini and Delia Kesner I developed a new approach to explicit substitutions, arising from Linear Logic proof-nets. The idea is to design calculi mimicking closely the dynamics of the graphical cut-elimination rules. Proof-nets and terms have very different notions of locality: this fact induce non-local, "at a distance" rewriting rules on terms. Substitution calculi at a distance are half-way lambda calculus and typical explicit substitution calculi: they retain most of the simplicity of lambda calculus, keeping the subtleties and the finer evaluation of explicit substitutions. In a series of recent works (some of which are joint works with Delia Kesner, Luca Paolini or Ugo Dal Lago) I explored systematically the rewriting theory of these calculi. In the talk I will survey the problems I studied (confluence, preservation of strong normalization, sigma-equivalence, developments, solvability, factorization, standardization, residuals) and the results I obtained, showing how they provide new understandings of classical notions and results - and sometimes even new results - in the theory of lambda-calculus.

Monday 7 May 2012

Sémantique linguistique, TAL et ingénierie des connaissances : le cas de la temporalité

fr 

Oratrice : Delphine Battistelli, MdC HDR, Université Paris Sorbonne, UFR ISHA (Institut des Sciences Humaines Appliquées), équipe STIH (Sens, Texte, Informatique, Histoire), membre associé du laboratoire  MoDyCo (Modèles, Dynamiques, Corpus)

Résumé : 

Je présenterai lors de cet exposé la manière dont j’envisage une articulation plus explicite entre sémantique linguistique, TAL et IC pour ce qui concerne en particulier la temporalité. 

Il convient en effet selon moi d’opérer une distinction claire entre : 
(i) l’analyse de la temporalité linguistique en tant que telle (c’est-à-dire en tant que catégorie sémantique langagière telle qu’elle est circonscrite et analysée dans les travaux de linguistique) ; 
(ii) des visées de traitement (intuitives et applicatives) qui peuvent lui être associées (généralement, ce sont l’ordonnancement temporel et l’ancrage calendaire de situations factuelles) ;
(iii) en relation avec des besoins (en une analyse temporelle) de communautés d’utilisateurs données. 

Souligner cette distinction, c’est pour moi faire mieux ressortir la complémentarité de ces points de vue. Il ressort en effet de (i) que l’ensemble (ii) peut alors être étendu (au calcul du degré de factualité des évènements par exemple) et que (ii) et (iii) fournissent des outils d’évaluation empirique de la pertinence de (i). 

Ce point de vue méthodologique exploite le rapprochement manifeste ces dernières années entre les domaines du TAL et de la recherche d’information pour ce qui concerne la fouille et l’analyse sémantique de données textuelles. L’enjeu se situe bien sûr à l’aune d’une masse croissante de documents textuels de types très divers qui, si l’on y regarde de plus près, invitent à des angles d’analyse eux-mêmes très variés de la temporalité linguistique (on abordera par exemple plus facilement la question de la modalité dans des textes scientifiques que celle du temps, qui lui sera plutôt étudié dans des textes narratifs ou historiques, les marques énonciatives de points de vue étant elles l’objet de travaux sur des textes plutôt journalistiques et vecteurs d’opinions, etc.). Ce constat empirique reflète au demeurant une conception déjà inscrite dans l’analyse strictement linguistique de la temporalité qui met l’accent traditionnellement sur l’étroite interaction entre quatre dimensions sémantiques : l’aspect, le temps, la modalité et l’énonciation. 

Je présenterai ici deux cas d’usage (développés au sein de deux projets de recherche distincts) qui me semblent particulièrement illustratifs : l’un accès sur la visualisation de chronologies évènementielles à partir d’un corpus de dépêches AFP ; l’autre accès sur l’analyse de la modalité dans des textes du domaine de la biologie. Dans les deux cas, il s’agit de montrer que des informations repérées dans les textes sont susceptibles d’être constituées en connaissances en regard des quatre dimensions sus-mentionnées – combinées ou non entre elles – par des experts d’un domaine donné et donc de participer à une ingénierie des connaissances textuelles.

Monday 30 April 2012

Toward a Bounded Linear Type system for PCF in Call-by-value

fr 

Le 30 avril 2012, à 14h en salle B311, le séminaire LCR accueille Barbara Petit (Bologne).

 

Monday 23 April 2012

An imperative characterization of probabilistic polynomial time

fr 

Le 23 avril 2012, à 14h en salle B311, le séminaire LCR accueille Paolo Parisen Toldin (Bologne).

Contrary to ICC standard approach, we present a small WHILE language characterizing the class PP.

The main problem concerning the imperative approach is to understand how informations/values flow throw variables in a program.

In literature are well known many works that have polytime soundness but just few of them (using the imperative paradigm) are able to give a polytime completeness.

Our system, MAL0 (Multiplied, Affine, Linear, 0 dependeces ), is sound and complete. Moreover, our system can be used also to check if a program is running in probabilistic polytime (can be easily restrict to just polytime soundness). We claim that, contrary to works found in literature, our system is able to certify a program in polytime.

This is a joint work in progress with Jean-Yves Moyen.

Friday 13 April 2012

Méthodes d'analyse multi-vues supervisées et non supervisées des données textuelles

fr 

Invité : Jean-Charles Lamirel, D. HDR, Equipe SYNALP, LORIA

Le paradigme MVDA (Multi-View Data Analysis) couvre à la fois le domaine de l’analyse de données et celui de la fouille de données. Il est plus spécifiquement dédié au traitement des données textuelles et multimédia, sans toutefois s’y limiter. Selon celui-ci, chaque analyse de données est considérée comme une vue différente sur les données. Le croisement entre les vues s’opère par l’intermédiaire d’un réseau bayésien construit, de manière non supervisée, à partir des données ou des propriétés partagées entre ces dernières. Le paradigme MDVA repose également sur l’exploitation de méthodes spécifiques de visualisation, comme la visualisation topographique ou la visualisation hyperbolique, qui permettant de gérer une interaction systémique entre les modèles obtenus et l’analyste. La mise en place de nouveaux estimateurs de qualité du clustering de type Rappel/Précision non supervisés basés sur l’analyse de la distribution des propriétés associées aux classes, et qui sont indépendants à la fois des méthodes de clustering et des changements relatifs à leur mode opératoire (initialisation, distances utilisées ...), nous a permis de démontrer objectivement les avantages de ce paradigme par rapport à l’approche globale, classique en analyse de données. Elle nous a également permis de comparer et d’intégrer dans le paradigme MVDA des méthodes de clustering neuronales, basées sur un nouveau principe de maximisation d’étiquetage, qui sont plus particulièrement adaptées à la gestion des données ultra-éparses et fortement multidimensionnelles, à l’image des données textuelles, ainsi que d’optimiser le mode opératoire de telles méthodes. Notre démarche a par ailleurs impliqué de développer la cohabitation entre le raisonnement neuronal et le raisonnement symbolique, ou entre des modèles de nature différente, de manière à couvrir l’ensemble des fonctions de recherche et d’analyse de l’information et à éliminer, sinon à réduire, les défauts inhérents à chacun des types d’approche.

A travers plusieurs applications, nous montrerons comment l’exploitation d’un tel paradigme peut permettre de résoudre des problèmes complexes d’analyse des données textuelles, comme ceux liés, en veille, à l’analyse sémantique de corpus de brevets, en scientométrie, à l’analyse diachronique à grande échelle des corpus bibliographiques, ou en TAL, à la classification et à l’étiquetage automatisés des catégories syntaxiques.

Nous aborderons dans un dernier temps le problème de la classification supervisée des données textuelles, et décrirons les travaux que nous avons menés en exploitant le principe de la détection de nouveauté, pour obtenir des méthodes de catégorisation à large champ, telle que la méthode ILoNDF, qui s’avèrent supérieures aux références usuelles du domaine, comme SVM, sur le texte. Nous montrerons finalement comment il est possible d’envisager l’intégration de ce type de méthode dans un contexte multi-vues.

Monday 2 April 2012

Améliorer l'interopérabilité sémantique : Applicabilité et utilité de l'alignement d'ontologie

fr 

Présenté par : Fayçal Hamdi, post-doctorant au laboratoire COGIT de l’IGN

Résumé :

Je présenterai tout d’abord les approches d’adaptation d’un processus d’alignement aux caractéristiques des ontologies alignées, qu’il s’agisse de caractéristiques quantitatives telles que leur volume ou de caractéristiques particulières liées par exemple à la façon dont les labels des concepts sont construits.

Concernant les caractéristiques quantitatives, je présenterai deux méthodes de partitionnement d’ontologies qui permettent l’alignement des ontologies très volumineuses. Ces deux méthodes génèrent, en entrée du processus d’alignement, des sous ensembles de taille raisonnable des deux ontologies à aligner en prenant en compte dès le départ l’objectif d’alignement dans le processus de partitionnement.

Concernant les caractéristiques particulières des ontologies alignées, je présenterai l’environnement TaxoMap Framework qui permet la spécification de traitements de raffinement à partir de primitives prédéfinies. Je présenterai le langage de patrons MPL (the Mapping Pattern Language) que j’ai proposé pour spécifier les traitements de raffinement.

En plus des approches d’adaptation aux caractéristiques des ontologies alignées, je présenterai les approches de réutilisation des résultats d’alignement pour l’ingénierie ontologique. Je me focaliserai plus particulièrement sur l’utilisation de l’alignement pour l’enrichissement d’ontologies. Je présenterai une étude de l’apport des techniques d’alignement pour l’enrichissement et l’impact des caractéristiques de la ressource externe utilisée comme source d’enrichissement.

Enfin, je présenterai la façon dont l’environnement TaxoMap Framework a été implémenté et les expérimentations réalisées : des tests sur le module d’alignement TaxoMap, sur l’approche de raffinement de mappings, sur les méthodes de partitionnement d’ontologies de très grande taille et sur l’approche d’enrichissement d’ontologies.

Monday 26 March 2012

Introduction to triposes and intuitionistic realizability toposes

fr 

Le 19 mars 2012, à 13h30 en salle B311, le séminaire LCR accueille Thomas Streicher (Darmstadt).

A gentle introduction to the theory of triposes, intuitionistic realizability toposes, and the motivations behind them.

Bringing together heterogeneous domain ontologies via the construction of a common fuzzy knowledge body

fr 

OrateurKonstantin Todorov, post-doctorant du Laboratoire de Mathématiques Appliquées aux Systèmes de l’Ecole Centrale Paris.

Résumé: In collaborative contexts, multiple independently created ontologies often need to be brought together in order to enable their interoperability. These ontologies have an impaired collaborative functionality, due to heterogeneities coming from the decentralized nature of their acquisition, differences in scopes and application purposes and mismatches in syntax and terminology. We present an approach to build a combined knowledge body for a set of domain ontologies, which captures and exposes various relations holding between the concepts of these ontologies, such as their relative generality or specificity, their shared commonality or complementarity. We situate our approach in a fuzzy framework, where every domain concept is represented as a fuzzy set of the concepts of a particular reference ontology. This can be seen as a projection of all domain source concepts onto a common semantic space, where distances and relations between any two concepts can be expressed under fixed criteria.

- page 1 of 23