Actualités du LIPN

[LIPN] [CNRS] [Université Paris 13]

To content | To menu | To search

Keyword - séminaire A3

Past posts

Monday 18 June 2012

[Journées BigData] Appel à soumission, Big Data Mining and Visualization (Fouille et Visualisation de Données Massives), 18 et 19 juin à Tours

fr 
Appel à communication

Journées communes aux Groupes de Travail EGC et AFIHM


Fouille et Visualisation de Données Massives

Big Data Mining and Visualization

 

Le lundi  18 et  le mardi  19 juin 2012 à Tours

______________________________
Dates importantes
______________________________

Le  18 mai : soumission du résumé de 10 lignes

L’inscription est gratuite mais obligatoire avant le 04 juin 2012.

______________________________

Comment participer et s’inscrire

______________________________
_

Si vous êtes intéressé par faire une présentation nous vous prions de manifester votre intention en soumettant via easychair un résumé de 10 lignes au plus tard le 18 mai 2012. Les présentations pourront durer 30 min et concerner : vos travaux récents, une présentation de synthèse de votre équipe, les résultats d’une thèse en cours, des données sur lesquelles vous travaillez, des présentations de projets en cours, etc. Un intérêt particulier est porté aux travaux menés par les doctorants.

L’inscription est gratuite mais obligatoire avant le 04 juin 2012. Pour vous inscrire cela se passe ici


________________
Objectifs :
________________

Les groupes de travail de l’association EGC : "Fouille de Données Complexes" (GT-FDC), "Fouille de Grands Graphes" (GT-FGG) et "Visualisation d’informations, interaction et fouille de données" (GT-VIF, commun avec l’AFIHM) organisent conjointement deux journées thématiques visant d’une part à poursuivre les activités des groupes et d’autre part à développer des axes communs autour de la complexité liée à la fouille des données massives (big data). Dans ce contexte, les problématiques abordées lors de ces deux journées peuvent concerner les processus (acquisition, structuration, extraction d’information et de connaissances et la visualisation) ou les données elles-mêmes. L’objectif de ces journées est de rassembler l’ensemble des acteurs de la communauté scientifique intéressés par ces nouvelles approches de la fouille de données massives afin de susciter des interactions entre chercheurs du domaine et d’animer/de dynamiser cette communauté. Des conférenciers invités présenteront leurs travaux.

De façon non limitative, nous sollicitons des communications sur les thématiques suivantes :

 

  • Connaissances et classification d’objets complexes multi-sources
  • Structuration et organisation des données massives (big data)
  • Solutions émergentes en matière de traitements parallèles, décentralisés et/ou collaboratifs des données (cloud computing, GPU, ...)
  • Visualisation d’informations, fouille visuelle de données, visualisation analytique
  • Classification interactive, fouille et découverte interactive supervisée ou non supervisée,
  • Fouille et analyse des données de grands graphes
  • Dynamique des grands graphes
  • Architectures logicielles et matérielles pour la fouille et la visualisation de données massives
  • Applications et réalisations industrielles : données médicales et scientifiques, marketing, réseaux sociaux, ...
_______________________________

subventions pour participation  

_______________________________     

Des subventions seront accordées dans différentes conditions (voir procédure sur le site de l’organisation locale) :

  • le transport des orateurs étudiants pourra être pris en charge, sur la base des titres de transports de train 2ème classe,
  • pour les membres de l’AFIHM (Association Francophone d’Interface Homme-Machine), les déplacements peuvent être pris en charge.
Concernant votre venue à Tours, nous vous encourageons à consulter les informations d’hébergement sur la ville ainsi que la localisation de ces journées.

______________________________
Comité d’organisation
______________________________

GT - FDC (http://eric.univ-lyon2.fr/~gt-fdc/)
Guillaume Cleuziou (LIFO, Univ. Orléans)
Cyril de Runz (CReSTIC, Univ. de Reims)
Mustapha Lebbah (LIPN, Univ. Paris 13)
Cedric Wemmert (LSIIT, Univ. Strasbourg)

GT - FGG (http://www.polytech.univ-nantes.fr/GT-FGG/)
Hanene Azzag (LIPN, Univ. Paris 13)
Lydia Boudjeloud (LITA, Univ. Metz)
Rushed Kanawati (LIPN, Univ. Paris 13)
Fabien Picarougne (LINA, Univ. Nantes)
Bruno Pinaud (LABRI, Univ. Bordeaux)

GT - VIF (http://wiki.afihm.org/index.php?title=GT_VIF)
Monique Noirhomme (FUNDP, Namur, Belgique)
Pascale Kuntz (LINA, Univ. Nantes)
David Auber (LABRI, Univ.  Bordeaux)
Gilles Venturini (LI, Univ. Tours)

Organisateurs locaux :    Octavio Razafindramanana, Barthélémy Serres, Gilles Venturini

Thursday 22 March 2012

"Optimisation de requêtes OLAP et visualisation de résultats"

fr 

Nous accueillerons Mme Ekaterina Simonenko du LRI (Laboratoire de Recherche en Informatique) de l’Université Paris Sud.

Résumé:

Nous explorons différents aspects des entrepôts de données et de OLAP, le point commun de nos recherches étant le modèle fonctionnel pour l’analyse de données. L’objectif principal est d’utiliser ce modèle dans l’étude de trois aspects différents, mais liés:

  • l’optimisation de requêtes par réécriture et la gestion du cache,
  • la visualisation du résultat d’une requête OLAP,


L’optimisation de requêtes et la gestion de cache sont des problèmes cruciaux dans l’évaluation de requêtes en général, et les entrepôts de données en particulier; et la réécriture de requêtes est une des techniques de base pour l’optimisation de requêtes. Nous établissons des conditions d’implication de requêtes analytiques, en utilisant le pré-ordre partiel sur l’ensemble de requêtes, et nous définissons un algorithme sain et complet de réécriture ainsi que une stratégie de gestion de cache optimisée, tous les deux basés sur le modèle fonctionnel. Le deuxième aspect important que nous explorons dans ce travail est celui de la visualisation du résultat. Nous démontrons l’importance pour la visualisation de reproduire des propriétés essentielles de données qui sont les dépendances fonctionnelles. Nous montrons que la connexion, existante entre les données et leur visualisation, est précisément la connexion entre leurs représentations fonctionnelles. Nous dérivons alors un cadre technique, ayant pour objectif d’établir une telle connexion pour un ensemble de données et un ensemble de visualisations. En plus d’analyse du processus de visualisation, nous utilisons le modèle fonctionnel comme un guide pour la visualisation interactive, et définissons ce qu’on appelle la visualisation paramétrique. Les résultats de ce travail peuvent être utilisés afin d’analyser les données contenues dans une table en Boyce-Codd Normal Form (BCNF), étant donné que le schéma de la table peut être transformé aisément en un schéma fonctionnel. Nous présentons une telle transformation (mapping) . Une fois le schéma relationnel transformé en un schéma fonctionnel, nous pouvons profiter des résultats sur l’optimisation et la visualisation de requêtes. Nous avons utilisé cette transformation dans l’implémentation d’un prototype dans le cadre d’un projet européen.

Mots clés : analyse de données, requêtes OLAP, réécriture de requêtes OLAP, optimisation de traitement de requêtes OLAP, visualisation de données, interaction visuelle, "business intelligence", entrepôt de données.

Thursday 8 March 2012

Graphe de transition entre objets combinatoires ; cas des ensembles fermés

fr 

Orateur:

Nous accueillerons Alain Gely de l’Équipe Algorithmique et Optimisation du Laboratoire d’Informatique Théorique et Appliquée de l’Université Paul Verlaine de Metz.

Résumé:

Dans cet exposé, on revient sur quelques algorithmes d’énumération des ensembles fermés.
Après un détour par le problème de l’énumération des cliques maximales d’un graphe, on montre qu’il s’agit en fait d’instances de parcours d’un graphe fortement connexe : le graphe de transition. En se servant de cet outil comme moyen de comparaison des algorithmes, on remarque que Next-Closure, en particulier, est une transcription directe au problème d’énumération des fermés de l’algorithme d’énumération des cliques maximales du à Tsukiyama et Al.

Thursday 9 February 2012

Lessons learnt from the Unsupervised and Transfer Learning challenge 2011

fr 

Orateur: Vincent Lemaire

Organisme: Orange Labs (Groupe ’Profiling and Data-mining’)

Résumé:
A challenge in “Unsupervised and Transfer Learning”: the UTL challenge (http://clopinet.com/ul) has been recently organized. Organizers made available large datasets from various application domains: handwriting recognition, image recognition, video processing, text processing, and ecology. The goal was to learn data representations that can be re-used across tasks, capturing regularities of an input space. The representations were evaluated on supervised learning “target tasks” unknown to the participants. The first phase of the challenge was dedicated to “unsupervised transfer learning” (the competitors were given only unlabeled data). The second phase was dedicated to “cross-task transfer learning” (the competitors were provided with a limited amount of labeled data from “source tasks”, distinct from the “target tasks”). The purpose of the  presentation will be to present this challenge and to analyze the results obtained.

Friday 2 December 2011

Aide à l’exploration des propriétés structurelles d’un réseau de transport

fr 

Éric Mermet présentera ses travaux le 2 décembre à 14h15 dans la salle de séminaires LITIS/LMAH à UFR ST du Havre

Un réseau de transport repose sur la trame d’un système spatial dont le rôle est de mettre en relation des lieux sur un territoire. C’est aussi un objet géographique complexe qui peut être étudié de plusieurs façons. Une analyse dite thématique ou fonctionnelle permet d’extraire de nombreuses informations (enquêtes ménage déplacement, études de flux migratoires, etc.) mais demande un accès, souvent difficile, à des données hétérogènes. Une analyse structurelle, si elle ne substitue pas à une analyse thématique, permet néanmoins de dégager de l’information et notamment la part investie par le réseau dans la compréhension d’un phénomène. Elle repose sur la construction et l’analyse d’indicateurs basés sur les relations proposées par le réseau et ne demande donc pas d’avoir accès à des données particulières. Ces indicateurs relationnels, comme la centralité, l’accessibilité, les chemins de contournement locaux, etc., permettent d’expliciter en quoi la structure, l’organisation spatiale et topologique des composantes du réseau prédisposent à la mise en relation plus ou moins aisée de lieux de l’espace. Or, ce type d’analyse engendre trois complexités :

  - une complexité combinatoire liée au nombre de relations Origine-Destination existantes sur le réseau,
   - une complexité algorithmique liée aux calculs mathématiques des indicateurs,
   - et une complexité visuelle liée à la mise en valeur d’informations pertinentes par une cartographie aisément compréhensible.

Le modèle proposé dans cette thèse vise à contrôler les complexités décrites et, in fine, à faciliter l’analyse de la structure d’un réseau aux utilisateurs (urbanistes, gestionnaires de réseaux, aménageurs, chercheurs). Cette analyse repose sur la création de cartes exploratoires ciblées et donc liées à un phénomène particulier que l’on cherche à analyser. Pour cela, un langage graphique informatique a été mis en place dans lequel il est possible de combiner visuellement ces cartes à l’aide de différents opérateurs. L’analyse n’est alors plus linéaire mais devient arborescente, rapprochant ce raisonnement du processus de pensée de l’utilisateur. Ces aspects ont été développés dans un outil logiciel baptisé GeoGraphLab.

Thursday 24 November 2011

Proportion Analogique et Treillis : chantier autorisé au public

fr 

On exposera dans ce séminaire des travaux en cours sur :

  1. La recherche d’analogies entre objets décrits par des attributs binaires, dans la représentation en treillis de concepts.
  2. La construction de treillis de sous-séquences et de sur-séquences à partir d’ensembles de séquences.
Plus généralement, la discussion pourra porter aussi sur la notion d’analogie entre objets d’un treillis.

Thursday 27 October 2011

ANALYSE EXPLORATOIRE DE RÉSEAUX D’INTERACTION REPOSANT SUR LEUR STRUCTURE EN COMMUNAUTÉS

fr 

Les réseaux sociaux, informatiques ou biologiques sont composés d’éléments connectés les uns aux autres et constituent des réseaux d’interaction réels, également appelés graphes de terrain (ou complex networks en anglais).. L’analyse de ces réseaux d’interaction est extrêmement complexe, du fait de leur taille, de leur grand nombre de dimensions et du manque de connaissance de leur structure. Durant cette présentation, je présenterai une méthode d’analyse exploratoire de ces réseaux, reposant sur l’analyse formelle de concepts et les treillis de Galois en particulier. Ces outils permettent d’identifier la structure (en communautés) de ces réseaux; je montrerai comment visualiser cette structure, et comment l’exploiter pour mieux comprendre les réseaux étudiés. La question du passage à l’échelle d’une telle approche sera également abordée.

Friday 14 October 2011

"La linguasphère, système cognitif planétaire"

fr 

Info : Une vidéo du séminaire de David Dalby est disponible sur ce lien : cliquez-ici

http://podcast1.univ-paris13.fr/mediasite/Viewer/?peid=c860157791e24ff996845d0bf6682306

Pour le rentrée du séminaire " l’art de la modélisation " (SAM) nous aurons le plaisir d’accueillir David Dalby, professeur émérite de l’université de Londres et Directeur de "Linguasphere Observatory".

En français :

http://linguasphere.info/spip.**php?article171185<http: linguasphere.info="" spip.php?article171185="">

En anglais :

http://linguasphere.info/spip.**php?article171186<http: linguasphere.info="" spip.php?article171186=""> Lors de cet exposé quatre points seront présentés : a) une définition observationnelle de la linguasphère (en. linguasphere) depuis les années 1990 … cp. la définition conceptuelle de la noösphère depuis les années 1920 b) l’évolution de la linguasphère depuis au moins 500 siècles ... lancement, accélération et mise en orbite c) les opportunités et dangers inhérents à cette évolution … vers le pilotage de la planète par une espèce humaine plurilingue (ou monolingue) ? d) la mise en valeur pratique de la linguasphère orbitale actuelle … “un espace où les langues se parlent”

Thursday 6 October 2011

Graphs for Business Intelligence

fr 

Business Intelligence aims at supporting better business decision-making, by providing tools and methods for collecting, modeling and interacting with data. Users have to deal with big data from structured databases and unstructured content (emails, documents, social networks, etc). Moreover, these data are often distributed and highly dynamic. Social Media and mobile technologies have changed our way to access information, facilitating communication and data exchange/sharing. All these evolutions refer to Business Intelligence 2.0.

An adapted modeling and visualization technique of links and interactions between several objects (e.g. products and sites, customers and products, social network...) is a precious mean to permit a good understanding of a lot of situations in the enterprise context. In this latter context, most of the time, these objects and their relations are stored in relational databases. But extracting and modeling such heterogeneous graphs, with heterogeneous objects and relations, are outside of the classical graph models capabilities, moreover when each node contains a set of values. On the other hand, graph models can be a natural way to present these interactions and to facilitate their querying. In this way, we propose a graph model named SPIDER-Graph which is adapted to represent interactions between complex heterogeneous objects extracted from relational databases, used for heterogeneous objects graph extraction from a relational database. One of the steps involved in this approach consists in identifying automatically the enterprise objects. Since the enterprise ontology has been used for describing enterprise objects and processes, we propose to integrate it in the object identification process (identify objects to be able to transform a graph of heterogeneous objects according to the user choice). Finally, we introduce the main principles of an aggregation algorithm used for community detection and graph visualization.

Thursday 9 June 2011

Apprentissage de réseaux de Markov logiques

fr 

Depuis une dizaine d’années, un nouveau champ de recherches, appelé apprentissage relationnel statistique, à la frontière entre la Programmation Logique Inductive (PLI) et l’apprentissage statistique s’est développé. Plusieurs modèles ont été développés, comme les réseaux logiques bayésiens ou les modèles de Markov logiques. Dans cet exposé, nous nous intéresserons principalement à l’apprentissage de modèles de Markov logiques. Nous présenterons les réseaux logiques de Markov puis nous décrirons deux méthodes d’apprentissage, que nous avons développées pour apprendre la structure de tels réseaux. La première est fondée sur une technique classique en PLI, appelée propositionnalisation ; la seconde utilise une méthode de recherche descendante et s’appuie sur l’idée que les clauses potentiellement intéressantes sont celles fréquentes dans la base d’apprentissage.

- page 1 of 5