Maître de conférences en linguistique informatique
MCF à l'université Paris 13 Sorbonne Paris Cité depuis 2006 |
Contact : rf.31sirap-vinu.npil@reitrac.leunamme Bureau : B 207 Institut Galilée Université Paris 13 99, avenue Jean-Baptiste Clément 93430 - Villetaneuse |
Parcours professionnel
2006- |
Maître de Conférences, Université PARIS 13 SPC, Section 7 |
2004 – 2006 |
e-doc Labs, Paris, France, Directeur scientifique |
1999 – 2004 |
LexiQuest puis Lingway, Montreuil, France, Ingénieur linguiste informaticien puis chef de projet, associé |
1998 – 1999 |
Softissimo, Paris, France, Ingénieur linguiste informaticien |
1996 – 1998 |
CNRS, Paris, France, Ingénieur Contractuel (Projet SERAPHIN, Résumé automatique)
|
Formation
2004 |
Doctorat en Linguistique informatique, Université Paris-IV Sorbonne, mention Très honorable |
1993 |
D.E.A. Mathématiques, Informatique, Linguistique |
Projets de recherche
2015-2018 |
Projet « Neoveille : repérage, analyse et suivi des néologismes en corpus », projet financé par Sorbonne Paris Cité. Coordinateur du projet impliquant le LIPN-RCLN, LDI, ERTIM (Inalco), CLILLAC-ARP (Université Paris 7), Université de Sao Paulo, groupe EMPNEO.[en savoir plus] |
2010-2013 |
Responsable scientifique du projet « Séquences verbales figées » contrat de recherche LDI-ITESOFT. Co-direction de la thèse CIFRE d'Aurélie Joseph (thèse soutenue en décembre 2013, mention très bien avec félicitations du jury).[en savoir plus] |
2007-2014 |
Projet NEOLOGIA : base de données pour la gestion des bases de données lexicographiques sur les néologismes en français. Responsable de la modélisation et de l'implémentation informatique de la base de données. En collaboration avec Jean-François Sablayrolles [en savoir plus] |
2007-2008 |
Projet METALANGUE : base de données pour la gestion des bases de données lexicographiques sur la terminologie des sciences du langage. en français et arabe : responsable de l'implémentation informatique de la base. |
2007-2010 |
Projet DICOSEM : base de données pour la gestion des bases de données lexicographiques sur la représentation sémantique des mots du français: conception de la base avec le groupe des verbes, responsable de l'implémentation informatique de la base. |
2007-2009 |
Projet PICS : base de données pour la gestion des bases de données lexicographiques sur les mots composés en français, espagnol, arabe et catalan : responsable de l'implémentation informatique de la base. LDI – Universidad Autonoma de Barcelona |
2004-2006 |
Logiciel d'anonymisation e-doc Anonymiser : mise au point d'un logiciel d'anonymisation pour les services de documentation ayant à publier des arrêts de justice (Cour des comptes, CIC, Banques Populaires). E-doc Labs [en savoir plus] |
2004-2006 |
Logiciel de veille des prix des vins en ligne: mise au point d'un logiciel permettant de récupérer sur les sites de vins en ligne les différentes informations sur les vins vendus en ligne (dans vingt langues), extraction et population d'une base de données interrogeable. Mise à jour régulière de la base. E-doc Labs |
2003-2004 |
Projet français « TILT » d’expérimentations d’outils linguistiques sur un corpus de Normes. Projet « Technolangue ». Collaboration entre Lingway, ATILF, AFNOR. [en savoir plus] |
2003-2004 |
Projet français « WATSON » d’outils linguistiques pour l’analyse de sites Web . Projet « Technolangue » . Collaboration entre Lingway, BNF (Bibliothèque Nationale de France) et Paris-IV Sorbonne. [en savoir plus] |
2002–2003 |
Projet Européen « CROSSMARC » d’extraction automatique d’informations dans les Offres d’emploi et les annonces de ventes de produits informatiques. Collaboration internationale entre Institute of Informatics & Telecommunications, NCSR « Demokritos » (GR), University of Edinburgh (UK), University Roma, Tor vergata (IT), Lingway (FR). Responsable de la partie française et de la méthodologie d'extraction des informations. [en savoir plus] |
2001–2002 |
Projet français « BREV », collaboration Lingway – INPI – MESR. Responsable de la modélisation linguistique et sémiotique des brevets, en vue d'extraire les énoncés importants, constituant une synthèse. |
2000–2001 |
Projet Européen « MUSI » (Multi-lingual Summarisation Tool for the Internet) de résumé multilingue. Collaboration Internationale entre DFKI, Language Technology Lab (GER), University of Pisa, Instituto di Linguistica Computazionale (IT), Lexiquest (FR). Responsable de la partie française du projet et de la méthodologie d'extraction des « phrases importantes ». [en savoir plus] |
1996–1998 |
Projet « SERAPHIN » de résumé automatique d’articles scientifiques, en collaboration avec le CNRS et EDF/GDF. Responsable de la modélisation sémiotique et linguistique des documents, extraction des « phrases importantes » par patrons lexico-syntaxiques. [en savoir plus]
|