Actualités du LIPN

[LIPN] [CNRS] [Université Paris 13]

To content | To menu | To search

Keyword - apprentissage

Past posts

Monday 18 June 2012

[Journées BigData] Appel à soumission, Big Data Mining and Visualization (Fouille et Visualisation de Données Massives), 18 et 19 juin à Tours

fr 
Appel à communication

Journées communes aux Groupes de Travail EGC et AFIHM


Fouille et Visualisation de Données Massives

Big Data Mining and Visualization

 

Le lundi  18 et  le mardi  19 juin 2012 à Tours

______________________________
Dates importantes
______________________________

Le  18 mai : soumission du résumé de 10 lignes

L’inscription est gratuite mais obligatoire avant le 04 juin 2012.

______________________________

Comment participer et s’inscrire

______________________________
_

Si vous êtes intéressé par faire une présentation nous vous prions de manifester votre intention en soumettant via easychair un résumé de 10 lignes au plus tard le 18 mai 2012. Les présentations pourront durer 30 min et concerner : vos travaux récents, une présentation de synthèse de votre équipe, les résultats d’une thèse en cours, des données sur lesquelles vous travaillez, des présentations de projets en cours, etc. Un intérêt particulier est porté aux travaux menés par les doctorants.

L’inscription est gratuite mais obligatoire avant le 04 juin 2012. Pour vous inscrire cela se passe ici


________________
Objectifs :
________________

Les groupes de travail de l’association EGC : "Fouille de Données Complexes" (GT-FDC), "Fouille de Grands Graphes" (GT-FGG) et "Visualisation d’informations, interaction et fouille de données" (GT-VIF, commun avec l’AFIHM) organisent conjointement deux journées thématiques visant d’une part à poursuivre les activités des groupes et d’autre part à développer des axes communs autour de la complexité liée à la fouille des données massives (big data). Dans ce contexte, les problématiques abordées lors de ces deux journées peuvent concerner les processus (acquisition, structuration, extraction d’information et de connaissances et la visualisation) ou les données elles-mêmes. L’objectif de ces journées est de rassembler l’ensemble des acteurs de la communauté scientifique intéressés par ces nouvelles approches de la fouille de données massives afin de susciter des interactions entre chercheurs du domaine et d’animer/de dynamiser cette communauté. Des conférenciers invités présenteront leurs travaux.

De façon non limitative, nous sollicitons des communications sur les thématiques suivantes :

 

  • Connaissances et classification d’objets complexes multi-sources
  • Structuration et organisation des données massives (big data)
  • Solutions émergentes en matière de traitements parallèles, décentralisés et/ou collaboratifs des données (cloud computing, GPU, ...)
  • Visualisation d’informations, fouille visuelle de données, visualisation analytique
  • Classification interactive, fouille et découverte interactive supervisée ou non supervisée,
  • Fouille et analyse des données de grands graphes
  • Dynamique des grands graphes
  • Architectures logicielles et matérielles pour la fouille et la visualisation de données massives
  • Applications et réalisations industrielles : données médicales et scientifiques, marketing, réseaux sociaux, ...
_______________________________

subventions pour participation  

_______________________________     

Des subventions seront accordées dans différentes conditions (voir procédure sur le site de l’organisation locale) :

  • le transport des orateurs étudiants pourra être pris en charge, sur la base des titres de transports de train 2ème classe,
  • pour les membres de l’AFIHM (Association Francophone d’Interface Homme-Machine), les déplacements peuvent être pris en charge.
Concernant votre venue à Tours, nous vous encourageons à consulter les informations d’hébergement sur la ville ainsi que la localisation de ces journées.

______________________________
Comité d’organisation
______________________________

GT - FDC (http://eric.univ-lyon2.fr/~gt-fdc/)
Guillaume Cleuziou (LIFO, Univ. Orléans)
Cyril de Runz (CReSTIC, Univ. de Reims)
Mustapha Lebbah (LIPN, Univ. Paris 13)
Cedric Wemmert (LSIIT, Univ. Strasbourg)

GT - FGG (http://www.polytech.univ-nantes.fr/GT-FGG/)
Hanene Azzag (LIPN, Univ. Paris 13)
Lydia Boudjeloud (LITA, Univ. Metz)
Rushed Kanawati (LIPN, Univ. Paris 13)
Fabien Picarougne (LINA, Univ. Nantes)
Bruno Pinaud (LABRI, Univ. Bordeaux)

GT - VIF (http://wiki.afihm.org/index.php?title=GT_VIF)
Monique Noirhomme (FUNDP, Namur, Belgique)
Pascale Kuntz (LINA, Univ. Nantes)
David Auber (LABRI, Univ.  Bordeaux)
Gilles Venturini (LI, Univ. Tours)

Organisateurs locaux :    Octavio Razafindramanana, Barthélémy Serres, Gilles Venturini

Thursday 6 October 2011

Graphs for Business Intelligence

fr 

Business Intelligence aims at supporting better business decision-making, by providing tools and methods for collecting, modeling and interacting with data. Users have to deal with big data from structured databases and unstructured content (emails, documents, social networks, etc). Moreover, these data are often distributed and highly dynamic. Social Media and mobile technologies have changed our way to access information, facilitating communication and data exchange/sharing. All these evolutions refer to Business Intelligence 2.0.

An adapted modeling and visualization technique of links and interactions between several objects (e.g. products and sites, customers and products, social network...) is a precious mean to permit a good understanding of a lot of situations in the enterprise context. In this latter context, most of the time, these objects and their relations are stored in relational databases. But extracting and modeling such heterogeneous graphs, with heterogeneous objects and relations, are outside of the classical graph models capabilities, moreover when each node contains a set of values. On the other hand, graph models can be a natural way to present these interactions and to facilitate their querying. In this way, we propose a graph model named SPIDER-Graph which is adapted to represent interactions between complex heterogeneous objects extracted from relational databases, used for heterogeneous objects graph extraction from a relational database. One of the steps involved in this approach consists in identifying automatically the enterprise objects. Since the enterprise ontology has been used for describing enterprise objects and processes, we propose to integrate it in the object identification process (identify objects to be able to transform a graph of heterogeneous objects according to the user choice). Finally, we introduce the main principles of an aggregation algorithm used for community detection and graph visualization.

Thursday 9 June 2011

Apprentissage de réseaux de Markov logiques

fr 

Depuis une dizaine d’années, un nouveau champ de recherches, appelé apprentissage relationnel statistique, à la frontière entre la Programmation Logique Inductive (PLI) et l’apprentissage statistique s’est développé. Plusieurs modèles ont été développés, comme les réseaux logiques bayésiens ou les modèles de Markov logiques. Dans cet exposé, nous nous intéresserons principalement à l’apprentissage de modèles de Markov logiques. Nous présenterons les réseaux logiques de Markov puis nous décrirons deux méthodes d’apprentissage, que nous avons développées pour apprendre la structure de tels réseaux. La première est fondée sur une technique classique en PLI, appelée propositionnalisation ; la seconde utilise une méthode de recherche descendante et s’appuie sur l’idée que les clauses potentiellement intéressantes sont celles fréquentes dans la base d’apprentissage.

Monday 23 May 2011

Pattern mining parallèle et générique avec ParaMiner

fr 

La découverte de motifs d’intérêt (pattern mining) dans les données est un des domaines majeurs du data mining. Son application la plus connue est la découverte d’itemsets fréquents dans des données transactionnelles, mais il en existe beaucoup d’autre pour le mining de patterns fréquents de type séquence, arbres ou graphes. Le problème de ces approches est que malgré des principes de base proches, toutes ces méthodes donnent lieu à des algorithmes spécifiques à un problème donné, ce qui rend difficile leur réutilisation et leur diffusion hors de la communauté des chercheurs en data mining.

Dans les travaux de thèse de Benjamin Négrevergne que nous présenterons à ce séminaire, un algorithme générique de mining de patterns d’intérêt est proposé. Cet algorithme se base sur le cadre théorique des "set systems" qui est à la base des problèmes de pattern mining. B. Négrevergne a pu formaliser et généraliser de nombreuses optimisations ad-hocs dans un algorithme générique et efficace appelé ParaMiner. Par ailleurs, cet algorithme est parallèle pour exploiter les processeurs multicoeurs. Le résultat est un algorithme efficace avec lequel il est possible de spécifier en peu de temps un nouveau problème de pattern mining, et qui a des temps d’exécution comparables voire parfois meilleurs à ceux des algorithmes ad-hocs de l’état de l’art.

Wednesday 4 May 2011

Apprentissage de politiques de simulations pour l'algorithme Monte-Carlo Tree Search

fr 

L’algorithme Monte-Carlo Tree Search (MCTS) est un algorithme d’exploration d’arbre basé sur une évaluation par simulations Monte-Carlo. Il a notamment permis une forte progression dans le domaine du Computer Go mais est également efficace dans de nombreux problèmes ne disposant pas de fonction d’évaluation efficace. Les performances de l’algorithme dépendent fortement des simulations Monte-Carlo. L’ajout de connaissances expertes permet des les améliorer considérablement mais rend l’algorithme très dépendant du domaine. Je propose ici plusieurs méthodes pour améliorer l’efficacité des simulations Monte-Carlo en apprenant une nouvelle politique en fonction des résultats des simulations précédentes. J’obtiens ainsi une amélioration significative des performances tout en conservant la généricité de l’algorithme

Saturday 30 April 2011

ARIPSO et ARLIUS – deux approches orientées utilisateur pour le post-traitement et la fouille locale de règles d’association

fr 
Mes travaux s’inscrivent à la confluence de deux domaines actifs de recherche: l’Extraction de Connaissances à partir des Données - la fouille de Règles d’Association, et l’Ingénierie des Connaissances - les langages de représentation du Web Sémantique. L’usage de la technique de fouille de règles d’association est limité par les grands volumes de règles découvertes, ainsi que par leur faible qualité. Ainsi, plusieurs méthodes de réduction ont été proposées dans la littérature comme les représentations concises de motifs, la réduction de la redondance, le filtrage, le ranking et le post-traitement, et la plupart sont basées sur la structure des données. Toutefois, l’intérêt des règles dépend fortement des connaissances et des objectifs de l’utilisateur. Dans ce contexte, il est essentiel d’aider le décideur avec une technique efficace de réduction du nombre de règles tout en gardant les règles intéressantes. Mon travail aborde deux problèmes essentiels: l’intégration des connaissances de l’utilisateur dans le processus de fouille, et l’interactivité avec l’utilisateur. Le premier problème exige un formalisme précis et flexible pour représenter les connaissances, comme les ontologies du Web Sémantique. Le second propose un processus d’exploration plus itératif permettant à l’utilisateur de fouiller l’espace de règles progressivement en se concentrant sur les règles intéressantes.

Thursday 28 April 2011

Division du travail par l'émergence de synchronie pour l'intelligence en essaim : auto-organisation à partir d'un réseau de neurones impulsionnels

fr 

L’intelligence collective dont font preuve de nombreux systèmes biologiques donne lieu à des comportements complexes, sans requérir un contrôle centralisé. L’adaptation in-silico de ces comportements est un enjeu de la robotique en essaim. Ce travail présente un modèle de décision individuel simple, s’appuyant sur une compétition neuronale, qui dote la population d’un mécanisme de synchronisation permettant une division du travail efficace." Vous pourrez trouver plus d’informations sur ce travail et sur les recherches que j’ai mené précédemment sur ma page web : http://sites.google.com/site/sylvchev/

Thursday 17 February 2011

Analyse de Concepts Formels par Similarité : Fondements et Applications

fr 

Résumé : L’Analyse de Concepts Formels par Similarité (ACFS) est une façon d’étendre l’Analyse de Concepts Formels (ACF) à des données complexes qui ne se présentent pas sous la forme de contextes binaires (le format d’entrée de l’ACF) mais sous la forme de contextes multivalués. L’ACFS s’appuie sur la définition d’une mesure de similarité sur les données complexes considérées. Cette mesure similarité peut s’appuyer à son tours sur les connaissances relatives aux données et disponibles sous la forme d’ontologies de domaines, d’avis d’experts, etc. Par analogie avec l’ACF, les données similaires sont regroupées ensemble pour former des concepts dits multivalués. Ces concepts sont organisés pour former un treillis de concepts multivalués. L’aspect original de l’ACFS est qu’il est possible d’obtenir, pour un même jeu de donnée, des treillis de différents niveaux de granularité. Cet aspect est particulièrement intéressant dans le cas de l’interaction avec les treillis et permet, entre autres, d’effectuer des zooms avant/arrière sur les concepts selon le besoin en précision ou en abstraction qu’on souhaite avoir sur les données. Une première application de l’ACFS sur un corpus réel a été faite sur les données de BioRegistry où il était question d’explorer l’ensemble des sources de données biologiques sur le Web et de sélectionner les sources pertinentes pour une répondre à une besoin exprimé. D’autres applications de l’ACFS dans la cadre de la visualisation décisionnelle dans un contexte industriel et dans le cadre de l’aide à la décision en médecine seront brièvement présentées.

Monday 18 October 2010

Apprendre à satisfaire des utilisateurs: Modélisation des préférences et renforcement

fr 

Orateur : Yann Chevaleyre Date : jeudi 21 octobre à 10h15 Lieu : B311

Un agent logiciel cherchant à répondre au besoin d’un utilisateur fait face à deux problèmes majeurs: d’abord, pour satisfaire l’utilisateur, il faut connaitre ses préférences. Pour ce faire, l’agent logiciel peut par exemple observer le comportement de l’utilisateur pour apprendre ses préférences. Ensuite, une fois qu’on dispose d’un modèle des préférences de l’utilisateur, il s’agit de chercher la séquence d’actions qui le satisfasse au mieux. Lorsque l’environnement est inconnu du logiciel, il s’agit d’un problème d’apprentissage par renforcement, dans lequel les récompenses associées à chaque état sont calculées à partir des préférences de l’utilisateur.

Ce séminaire est structuré en trois parties. Dans la première partie, nous aborderons le problème de l’apprentissage des préférences. Nous montrerons d’abord les liens étroits de ce problème avec le cadre plus classique de l’apprentissage supervisé. Ensuite, nous distinguerons l’apprentissage de modèles symboliques et numériques. Parmi les modèles symboliques, nous présenterons quelques résultats concernant les modèles basés sur l’hypothèse "ceteris partibus", et nous montrerons la complexité algorithmique prohibitive de leur apprentissage. Nous montrerons de plus qu’avec des modèles numériques adéquats, on obtient des langages tout aussi expressifs, mais de complexité algorithmique moindre.

Dans la seconde partie, nous traiterons d’apprentissage par renforcement dans des environnements de grande taille. Lorsque le nombre d’états constituant l’environnement est très grand, le temps d’apprentissage devient prohibitif, et il est alors nécessaire d’employer des méthodes approchées. Si l’on a à disposition des connaissances d’un expert du domaine, on peut les utiliser pour guider l’exploration de l’agent apprenant et accélérer l’apprentissage. Nous montrerons comment exploiter ces connaissances de façon presque optimales. En particulier, nous montrerons que déterminer à quel moment utiliser les connaissances de l’expert se ramène au problème des "bandits-manchots", pour lequel des algorithmes à garantie de performance existent. Nous détaillerons enfin une application de ces recherches au domaine de la simulation du jeu de football.

Si plusieurs utilisateurs sont concernés par les décisions prises par l’agent logiciel, ce dernier doit prendre en compte les préférences de chacun, et les agréger d’une façon à la fois efficace et équitable. Dans cette troisième et dernière partie, j’effectuerai un survol rapide d’un autre aspect de mes recherches: les problèmes de décision collective. Je montrerai certains des résultats que j’ai obtenu en théorie du vote, dans les problèmes d’allocation de ressource et en négociation automatique.

Thursday 14 October 2010

De l'Apprentissage Artificiel à une logique modale pour l'Abstraction (de domaines)

fr 

Orateur : Henry Soldano Date : jeudi 14 octobre à 12h15 Lieu : B311

En analyse de concepts formels (FCA) la relation entre d’une part, les énoncés d’un langage $\cal L$ formant un treillis pour la relation de généralité, et, d’autre part, leur extension sur un ensemble d’instances $W$, est matérialisée en un treillis $G$, dont chaque noeud représente un ensemble d’énoncés ayant même extension sur $W$. Cette structure est par exemple essentielle pour l’exploration de $\cal L$ dans la recherche d’implications valides sur $W$. Nous avons récemment montré qu’on pouvait réduire la taille de $G$ tout en préservant l’ordre et la structure de treillis, en définissant une extension abstraite $ext’=p°ext$ où $p$ satisfait certaines propriétés et est appelée une projection. Dans la première partie de cette présentation, je remarquerai d’abord qu’à toute projection est associée un ensemble $A$ de parties de W fermé par réunion que nous appèlerons une "abstraction", et inversement, et que ces abstractions forment elle-même un treillis pour un ordre partiel "est-plus abstrait-que". Je discuterai alors des propriétés des implications, dites abstraites, correspondant à l’inclusion des extensions abstraites. La deuxième partie de l’exposé est consacrée à la représentation en logique modale obtenue en interprétant une implication abstraite entre $p$ et $q$ comme une implication entre Abstrait $p$ et Abstrait $q$. En particulier je caractériserai les classes de logiques modales monotones (mais en général non normales) correspondantes, et je définirai les logiques multimodales permettant d’utiliser l’ordre sur les abstractions pour mener des raisonnements à plusieurs niveaux d’abstraction. Enfin je terminerai par quelques mots sur les travaux en cours sur l’apprentissage supervisé abstrait.

- page 1 of 2