Sébastien Guérif est maître de conférences en informatique à l'Université Paris 13 depuis septembre 2007. Il est membre du Laboratoire d'Informatique de l'Université Paris Nord (LIPN - UMR CNRS 7030) où il effectue ses recherches dans l'équipe « Apprentissage Artificiel et Applications (A3) ». Il a obtenu le grade de docteur en informatique de l'Université Paris 13 en décembre 2006 après avoir préparé sa thèse sous la direction du Prof. Younès Bennani dans le cadre d'une convention CIFRE entre la société Numsight et l'Université Paris 13. Son domaine de recherche est la fouille de données et il s'intéresse plus particulièrement aux thèmes suivants :

Classification automatique (clustering)
Règles d'association
Sélection de variables
Systèmes de recommandations

Il effectue son service d'enseignement au département d'informatique de l'Institut Galilée. Il intervient principalement en cycle licence et en classes préparatoires où il enseigne actuellement l'algorithmique, la programmation impérative, les bases de l'apprentissage artificiel et de l'analyse visuelle de données. Ces dernières années, il a également enseigné l'architecture des ordinateurs, les systèmes d'exploitation, les réseaux et les bases de données. Depuis janvier 2012, il est responsable des enseignements dispensés en classes préparatoires assurés par le département d'informatique.

Sébastien Guérif is senior lecturer in computer science at the University of Paris 13 since september 2007. He works at the Computer Science Laboratory of Paris-North University (LIPN - UMR CNRS 7030) where he is a member of the Machine Learning Research Team. He received his Ph.D. degree in computer science from the University of Paris 13 in december 2006 ; his advisor was Prof. Younès Bennani and his researches was supported by Numsight. His scientific skills fall into data mining and he is more especially interested in the following topics :

Clustering
Association rules
Feature selection
Recommandation systems

He is also a teacher of computer science at the "Institut Galilée". He lectures on algorithms and data structures, imperative programming, introduction to machine learning and visual data analysis. During the last years, he taught computer architecture, operating systems, computer networks and relational databases.

Publications

Revues nationales ou internationales

Younès Bennani, Emmanuel Viennet, and Sébastien Guérif. « Réduction des dimensions de l'espace de description ». Revue des Nouvelles Technologies de l'Information, RNTI-A2:135-163, 2008. Numéro spécial : Journées Apprentissage Artificiel et Fouille de Données. bibtex

Conférences internationales

Alessandro Perolini and Sébastien Guérif. « Simultaneous feature and model selection for high-dimensional data ». In Proceedings of the 23rd IEEE International Conference on Tools with Artificial Intelligence (ICTAI 2011), pages 47-50. IEEE, 2011. link bibtex

Bruno Pradel, Savaneary Sean, Julien Delporte, Sébastien Guérif, Céline Rouveirol, Nicolas Usunier, Françoise Fogelman-Soulié, and Frédéric Dufau-Joël. « A case study in a recommender system based on purchase data ». In Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD 2011), pages 377-385. ACM, 2011. (acceptance rate: 17,6%) link pdf bibtex

Sébastien Guérif and Younès Bennani. « Dimensionality Reduction Through Unsupervised Features Selection ». In Proceedings of the 10th International Conference on Engineering Applications of Neural Networks (EANN 2007), pages 98-106, 2007. Publishing Centre Alexander T.E.I. of Thessaloniki. pdf bibtex

Sébastien Guérif, Younès Bennani and Claude Baudoin. « Connectionist and Ethological Approaches for Discovering Salient Facial Movement Features in Human Gender Recognition ». In Proceeding of the 28th International Conference Information Technology Interfaces (ITI 2006), pages 189-194, 2006. pdf bibtex

Ateliers et autres conférences avec comité de lecture

Sébastien Guérif. « Sous-échantillonnage et test de permutations pour la sélection de variables non supervisée ». In Actes de la 11e Conférence d'Apprentissage, Plateforme AFIA (CAp 2009), pages 355-358, 2009. Presses universitaires de Grenoble. (poster, taux d'acceptation : 25,8%) pdf bibtex

Sébastien Guérif. « Unsupervised variable selection: when random rankings sound as irrelevancy ». Journal of Machine Learning Research - Proceedings Track, 4:163-177, 2008. (FSDM workshop à ECML-PKDD, taux d'acceptation : 30 %). link pdf bibtex

Nistor Grozavu, Younès Bennani and Sébastien Guérif ». « Towards a dimensionality reduction through unsupervised learning and local variable weighting. In Proceedings of the ICMCS'07, 2007. bibtex

Sébastien Guérif and Younès Bennani. « Selection of Clusters Number and Features Subset during a Two-Levels Clustering Task ». In Proceeding of the Artificial Intelligence and Soft Computing (ASC 2006), pages 28-33, 2006. pdf bibtex

Sébastien Guérif, Younès Bennani and Eric Janvier. « μ-SOM : Weighting features during clustering ». In Proceedings of the 5th Workshop On Self-Organizing Maps (WSOM'05), pages 397-404, 2005. pdf bibtex

Sébastien Guérif and Younès Bennani. « Sélection de Variables en Apprentissage Numérique Non Supervisé ». In Actes de la Conférence francophone sur l'Apprentissage automatique (CAp'2007)), pages 221-236, 2007. pdf bibtex

Zeina Jrad, Francine Krief and Sébastien Guérif. « Une Interface Utilisateur pour Faciliter l'Accès à l'Internet Nouvelle Génération ». Journées doctorales Informatique et Réseau (JDIR 2005), 2005. pdf bibtex

Miscellaneous

Sébastien Guérif. « Réduction de Dimension en Apprentissage Numérique Non Supervisé ». Thèse de doctorat, Université Paris 13, Villetaneuse, Décembre 2006. pdf bibtex

Sébastien Guérif and Younès Bennani. « Apprentissage numérique non supervisé à partir de données évolutives ». Rapport de recherche de deuxième année, Juin 2005.

Sébastien Guérif and Younès Bennani. « Approches connexionnistes pour l'exploration et l'extraction de connaissances à partir de données spatio-temporelles : application aux données géographiques ». Rapport de recherche de première année, Avril 2004.

Expérience Professionnelle

sept. 2007-

Maître de Conférences en Informatique, Université Paris 13, Villetaneuse (93).

Enseignement : département informatique de l'Institut Galilée
Recherche : Laboratoire d'Informatique de l'Université Paris Nord (LIPN - CNRS UMR 7030)

2006-2007

Attaché Temporaire d'Enseignement et de Recherche (ATER) à mi-temps, Université Paris 13, Villetaneuse (93).

Enseignement : département informatique de l'Institut Galilée
- Architecture, Systèmes et Réseaux en Licence 2 mention Physique-Chimie
- Base de Données en Master 1 Mathématiques et Informatique
- Programmation impérative en Licence 1
- Reconnaissance des Formes en Master 2 (pro) Informatique, spécialité Exploration Informatique des Données (EID)
- Visualisation des Données en Master 1 Informatique
Recherche : Laboratoire d'Informatique de l'Université Paris Nord (LIPN - CNRS UMR 7030)

2005-2006

Assistant de Recherche, Numsight Consulting France, Boulogne-Billancourt (92).

Développement d'algorithmes d'analyses de données évolutives.
Mise en place d'un serveur sous Linux (Samba PDC, DHCP, DNS).

2002-2004

Ingénieur de Recherche et Développement, Géobs, Saint-Herblain (44).

Développement de méthodes innovantes d'analyse de données géographiques évolutives,
Mise en place, Administration et Maintenance du réseau de la société.

2002

Stage de DESS (5 mois), Géobs, Saint-Herblain (44).

Intégration des réseaux de neurones aux Systèmes d'Information Géographique (SIG),
Application de méthodes connexionnistes à l'étude de la dynamique d'occupation des sols.

1999-2001

Moniteur « Informatique Pour Tous », Faculté des Sciences et Techniques - Université de Nantes(44).

521 heures
Assistance aux utilisateurs du Centre Informatique d'Enseignement (équipe SOS)
Participation à la maintenance du parc (dépannage matériel, reconfiguration des postes, ...)

Formation

2003-2006

Doctorat en informatique, Laboratoire d'Informatique de l'Université Paris Nord (LIPN), Villetaneuse (93.

Titre : Réduction de Dimension en Apprentissage Numérique Non Supervisé,
Directeur : Pr. Younès Bennani
Mention Très Honorable
Soutenue publiquement le 11 décembre 2006 à l'Institut Galilée - Université Paris 13
Jury :
- Pr. Younès Bennani, Université Paris 13 (directeur)
- Pr. Jean-Daniel Zucker, Université Paris 13 (président)
- Pr. Cyrille Bertelle, Université du Havre (rapporteur)
- Pr. Gilles Venturini, Université de Tours (rapporteur)
- Pr. Pascale Kuntz, Université de Nantes (examinatrice)
- Pr. Magnus Magnusson, Université d'Islande (examinateur)
- M. Emmanuel Ecosse, Inserm Paris (invité)
- M. Eric Janvier, Numsight, Boulogne (invité)

2001-2002

DESS Exploration Informatiques des Données (EID), Institut Galilée - Université Paris 13, Villetaneuse (93).

Mention Bien (major),
Options : Apprentissage Connexionniste et Apprentissage Symbolique.

2000-2001

Maîtrise d'Informatique, Faculté des Sciences et Techniques - Université de Nantes (44).

Options : IA, Programmation par contraintes et Recherche opérationnelle,
Mémoire : Représentation des Fonctions Booléennes (ROBDD).

1998-1999

Licence d'Informatique, Faculté des Sciences et Techniques - Université de Nantes (44).

1996-1998

DEUG A (mention mathématiques, informatique et applications aux sciences), Faculté des Sciences et Techniques - Université de Nantes (44).

1996

Baccalauréat série S (spécialité mathématiques), Lycée Notre Dame de Rezé (44).

Options : informatique et espagnol.

Datasets (available on-line)

Challenges in Machine Learning
UCI Machine Learning Repository : repository of databases, domain theories and data generators that are used by the machine learning community for the empirical analysis of machine learning algorithms.
DELVE Datasets : Data for Evaluating Learning in Valid Experiments.
Kent Ridge Biomedical Data Set Repository : high-dimensional biomedical data set.
Datasets for Data Mining.
Neural Information Processing Systems (NIPS 2003) : NIPS-03 Feature Selection Challenge Data Set.
The Predictive Toxicology Challenge (PTC) for 2000-2001.

Machine learning and Data Mining Software

Weka : Data Mining Software in Java.
Netlab neural networks software : a neural networks toolbox for matlab.
SOM Toolbox : a toolbox to use Self-Organizing Maps (SOM) in matlab environment.
Kohonen's Map for SAS : IML macro for SAS (version 6 and 8).
Stuttgart Neural Networks Simulator (SNNS) : a software simulator for neural networks.

Data Base Management Systems (DBMS)

PostgreSQL : a powerful, open source relational database system.
PostGIS : PostGIS adds support for geographic objects to the PostgreSQL object-relational database.
EyeDB : an Object Oriented Database Management System (OODBMS) based on the ODMG 3 specification.

Cette page ne regroupe que des liens vers des sites francophones; consultez aussi la version anglaise...

Pour les (futurs) doctorants et jeunes docteurs...

Association Nationale de la Recherche Technique : Promouvoir les Relations Recherche-Entreprise
Association Nationale des Docteurs Es Sciences : Promouvoir le doctorat
Association Bernard Gregory : De la Thèse à l'Emploi

Associations Francophones relatives à l'Apprentissage Artificiel

Sources d'Information Francophones

Wikipedia : Encyclopédie Libre Participative
Comment Ca Marche.Net : Encyclopédie généraliste de l'informatique
Developpez.Com : Club d'Entraide des Développeurs Francophones

Enseignements

Liste

CP2i

Licence

2012-2013

Algorithmes élémentaires (cours-TD: 39h, TP: 21h, colles: 16h) en CP2i/CPES 1ère année
Éléments d'analyse visuelle de données (cours-TD: 18h) en CP2i 2ème année
Introduction à l'apprentissage artificiel (cours-TD: 12h) en CP2i 2ème année
Introduction aux structures de données linéaires (cours: 6h) en Licence 1ère année
Programmation impérative et Algorithmique des structures de données linéaires (cours: 36h) en Licence 1ère année
Structures de données (cours-TD: 24h, TP: 12h, colles: 8h) en CP2i 2ème année

2011-2012

Algorithmique des structures de données linéaires (cours: 9h) en Licence 1ère année
Architecture, Systèmes et Réseaux (cours-TD: 22h30, TP: 13h30, colles: 14h) en CP2i 2ème année
Algorithmes et arbres (cours-TD: 27h) en CP2i 2ème année
Éléments d'informatique (resp. : Antoine Rozenknop, cours-TD: 36h, TP: 36h, colles: 13h) en CP2i 1ère année
Introduction aux structures de données linéaires (cours: 6h) en Licence 1ère année
Programmation impérative (cours: 16h30) en Licence 1ère année
Conduite et gestion de projet en Formation ingénieur 2ème année (resp. : Sophie Toulouse) : rôle du client, « Plateforme didactique de la programmation impérative ».

2010-2011

Algorithmique des structures de données linéaires (cours: 6h) en Licence 1ère année
Algorithmique et arbres (resp. : Pierre Boudes, TD: 39h) en Licence 2ème année
Algorithmique numérique (resp. : Basarab Matei, TP: 9h) en Licence 2ème année
Éléments d'informatique (resp. : Antoine Rozenknop, cours-TD: 36h, TP: 36h, colles: 13h) en CP2i 1ère année
Introduction aux structures de données linéaires (cours: 6h, TD: 7h30, TP: 3h) en Licence 1ère année
Programmation impérative (co-responsabilité avec Daniel Kayser, cours: 7h30, TD: 24h, TP: 12h) en Licence 1ère année
Conduite et gestion de projet en Master 1ère année (resp. : Sophie Toulouse) : rôle du client, « Outils d'évaluation de systèmes de recommandations ».

2009-2010

Algorithmique et arbres (resp. Pierre Boudes, TD: 39h) en Licence 2ème année
Programmation impérative (cours: 18h, TD: 18h, TP: 18h, 2 groupes de TD/TP) en Licence 1ère année
Conduite de projet (cours: 3h, TD/TP: 18h) en Licence 1ère année

2008-2009

Conduite de projet (cours: 3h, TD/TP: 18h) en Licence 1ère année
Conduite et gestion de projet (cours-TD: 52heqTD) en Licence 3ème année (info appliquée)
Programmation impérative 1 (resp. : Daniel Kayser, TD: 36h, TP: 18h) en Licence 1ère année

2007-2008

Architecture, Systèmes et Réseaux (resp. : Christophe Fouqueré, TD: 9h, TP: 6h) en Licence 2ème année
Conduite et gestion de projet (cours-TD: 26heqTD) en Licence 3ème année (info appliquée)
Programmation impérative 1 (resp. : Daniel Kayser, TD: 36h, TP: 18h) en Licence 1ère année
Systèmes d'exploitation (cours-TP: 50heqTD) en Licence 2ème année

2006-2007 (ATER à mi-temps - Institut Galilée)

Architecture, Systèmes et Réseaux (resp. : Christophe Fouqueré, TD: 9h, TP: 6h) en Licence 2ème année
Bases de données (resp. : Céline Rouveirol, TD: 6h, TP: 12h) en Master 1ère année (maths-info)
Programmation impérative 1 (resp. : Daniel Kayser et Catherine Recanati, TD: 21h, TP: 15h) en Licence 1ère année
Reconnaissance de formes (resp. : Younès Bennani, TD/TP: 18h) en Master 2ème année
Visualisation de données (resp. : Younès Bennani, TD/TP: 18h) en Master 1ère année

2005-2006 (vacations à l'Institut Galilée)

Architecture, Systèmes et Réseaux (resp. : Christophe Fouqueré, TD: 19h30, TP: 19h30) en Licence 2ème année

2003-2004 (vacations à l'Institut Galilée)

Conduite et gestion de projet en Master 1ère année (resp. : Brigitte Biébow, Chritophe Fouqueré et Catherine Recanati) : rôle du client, « Outil de visualisation et d'analyse de données géographiques ».