Projets

CARTOGRAFíA

Cartographie de la diaspora des savoirs par fouille sémantique des résultats de recherches sur le web

Le but du projet est de fouiller sémantiquement le web pour cartographies les migrations hautement qualifiées. On suppose que notre méthode pourrait produire une source de données très riche pour la sociologie de la migration. Actuellement on développe une méthode basée sur l'apprentissage par renforcement (reinforcement learning) sur des requêtes biographiques envers un moteur de recherche pour extraire des traces de mobilité qui nous permettraient d'établir une cartographie des trajectoires professionnelles.

Appel: Ecos Nord (2016-2020)
Budget: ~64k€
Rôle: Porteur du projet
Partenaires: LIPN, Télécom-Paristech, IRD, IIMAS/UNAM, CRIM/UNAM (Mexique)

GOLFRED

Génération de récits à partir d'expériences spatiales d'un robot de service par extraction de connaissances textuelles

Lorsqu'un être humain rentre à la maison, en général il y a un autre humain pour lui demander : « Comment s'est passé ta journée ? » Le but de notre projet est de permettre à un robot de service de répondre le plus naturellement possible à des questions similaires, pas exactement sur sa journée, mais sur son activité récente. Les récits d'expérience cherchent à véhiculer par le support narratif une perception holistique des taches récemment réalisées par le robot: navigation dans l'espace, description des actions et perceptions visuelles.

Appel: AUF-PIRAT (2015-2016)
Budget: 11k€
Rôle: Porteur du projet
Partenaires: LIPN, LORIA, IIMAS/UNAM (Mexique)

Publications

Robot Experience Stories: first person generation of robotic task narratives in SitLog

Garcia Flores, J., Meza, I., Colin, E., Gardent, C., Gangemi, A. and Pineda, L. (2018, accepté pour publication) Journal of Intelligent and Fuzzy Systems.

Cross-domain deception detection using support vector networks

Hernandez-Castañeda, A, Calvo, H., Gelbukh A. and Garcia Flores, J.J. (2017) Soft Computing, 21(3), 585-595. doi:10.1007/s00500-016-2409-2

Mesurer la qualité des systèmes de catégories de blogs

Garrido-Marquez, I. Garcia Flores, J., Lévy, F. and Nazarenko, A. (2017) Actes des 28es Journées francophones d'Ingénierie des Connaissances, PFIA 2017, 223-229.

Lipn-core: Semantic text similarity using n-grams, wordnet, syntactic analysis, ESA and information retrieval based features

Buscaldi, D., Le Roux, J., Garcia Flores, J.J. and Popescu, A. (2013) Second Joint Conference on Lexical and Computational Semantics (SEMEVAL 2013).

Tracking Researcher Mobility on the Web Using Snippet Semantic Analysis

Garcia Flores, J.J., Zweigenbaum, P., Yue, Z. and Turner, W. (2012) Advances in Natural Language Processing (JapTAL, 2012). Lecture Notes in Computer Science, 7614, 180-191. doi:10.1007/978-3-642-33983-7_18

voir toutes les publications

Code

Nom Description Rôle URL source URL prototype
UnoporunO Fouille sémantique du web à la recherche des migrants hautement qualifiés chef de projet, développeur https://github.com/rcln/unoporuno http://tal.lipn.univ-paris13.fr/unoporuno/
unoporunoDQN Apprentissage par renforcement pour repérer des données professionnelles des migrants hautement qualifiés co-chef de projet https://github.com/rcln/unoporunoDQN
cartographies sonores Cartographies sonores des langues du monde (projet de valorisation Labex EFL). project manager https://github.com/rcln/unoporunoDQN http://tal.lipn.univ-paris13.fr/cartographies/
BNI Bibliothèque Numérique des Idées co-chef de projet https://github.com/rcln/bni http://tal.lipn.univ-paris13.fr/bni/
CCTV Visualization multilingue de topics Wikipédia pour des "thèmes" extraits avec la méthode sampled min-hashing. chef de projet https://github.com/rcln/min-hashing http://tal.lipn.univ-paris13.fr/minhashing/
Golfred Génération in vitro de récits d'expérience pour des robots de service chef de projet, co-développeur https://github.com/rcln/golfred
SOPA-Semeval Système de calcul de similarité sémantique entre des pairs des phrases basé sur la régression linéaire (tâche SEMEVAL-STS 2013-2015). co-développeur https://github.com/rcln/semeval

Enseignement et encadrement

Université Paris 13, Institut Galilée, Master Informatique
Parcours EID2 (Exploration Informatique des Données et Décisionnel)

Conduite et gestion de projet

Depuis 2013 j'assure entre 4 et6 heures CM de cours théorique pour l'UE Conduite est gestion de projet. De plus, j'encadre une où deux équipes (7 étudiants par équipe) par an dans la réalisation d'un projet de développement informatique avec un client réel. Pour l'édition 2016, le client était un centre de recherche à Mexico. Les deux équipes ont développé des modules différents du projet, tout en assurant des visioconférences hebdomadaires avec le client. À la fin du projet, on a choisi deux étudiants pour aller en mission à Mexico et y présenter son travail (mission financée par le Conseil de Rélations Européennes et Internationales de l'UP13).

Ivan Garrido-Marquez (doctorant, LIPN, UP13)

Le travail de thèse d'Ivan est centré sur l'annotation sémantique, notamment sur les aspects dynamiques de celle-ci, c'est à dire, le calcul de mesures pour estimer la qualité de l'annotation (équilibre, redondance) sous une perspective d'amélioration par ré-annotation assisté par un utilisateur. Pour évaluer son approche méthodologique, Ivan a recueilli un corpus de billets de blogs en droit, cuisine et technologie (11 millions de mots), annotés par catégories et mots clés. La thèse d'Ivan est encadrée par Adeline Nazarenko et co-encadré par François Lévy et moi.

Josué Urbina and Carl Posthuma (École d'ingénieurs-IIMAS, UNAM)

Je suis le co-encadrant du stage de service social de Josué et Carl à la fac d'ingénierie de l'UNAM à Mexico (son encadrant principal est Ivan Vladimir Meza, de l'IIMAS/UNAM. Josué et Carl travaillent sur une méthode basée sur un réseau de neurones Deep-Q qui cherche à extraire des données biographiques à partir des résultat de requêtes d'un moteur de recherche et localiser ainsi des migrants hautement qualifiés, dans le cadre du projet CARTOGRAFíA.