Maître de conférences en linguistique informatique

MCF à l'université Paris 13 Sorbonne Paris Cité depuis 2006
Membre du LIPN - RCLN (CNRS UMR 7030)
Membre du CNU section 7 : depuis 2011
Resp. du département de linguistique UP13 : 2010-2014

           Contact :
rf.31sirap-vinu.npil@reitrac.leunamme
Bureau : B 207
Institut Galilée
Université Paris 13
99, avenue Jean-Baptiste Clément
93430 - Villetaneuse

 

Parcours professionnel

2006-

Maître de Conférences, Université PARIS 13 SPC, Section 7

2004 – 2006

e-doc Labs, Paris, France, Directeur scientifique

1999 – 2004

LexiQuest puis Lingway, Montreuil, France, Ingénieur linguiste informaticien puis chef de projet, associé

1998 – 1999

Softissimo, Paris, France, Ingénieur linguiste informaticien

1996 – 1998

CNRS, Paris, France, Ingénieur Contractuel (Projet SERAPHIN, Résumé automatique)

 

Formation

2004

Doctorat en Linguistique informatique, Université Paris-IV Sorbonne, mention Très honorable
Repérage automatique des expressions définitoires : modélisation de l'information définitoire. méthode d'exploration contextuelle, méthodologie du développement des ressources linguistiques, description des expressions du français contemporain, implémentation informatique [pdf]
Membres du jury
Jean-Pierre Desclés professeur, Paris IV Sorbonne, directeur de thèse
Michel Charolles professeur, Paris III, rapporteur
Mohamed Hassoun professeur, ENSSIB, rapporteur
Marc El-Bèze professeur, LIA, examinateur
Jean-Luc Minel Ingénieur de Recherche (HDR), CNRS, examinateur 

1993

D.E.A. Mathématiques, Informatique, Linguistique
Université Paris-IV Sorbonne, mention Très Bien, major de promotion
Description formelle des verbes de mouvement du français contemporain à partir du modèle de Boguslavski et Bogacki

   

Projets de recherche

2015-2018

Projet « Neoveille : repérage, analyse et suivi des néologismes en corpus », projet financé par Sorbonne Paris Cité. Coordinateur du projet impliquant le LIPN-RCLN, LDI, ERTIM (Inalco), CLILLAC-ARP (Université Paris 7), Université de Sao Paulo, groupe EMPNEO.[en savoir plus]

2010-2013

Responsable scientifique du projet « Séquences verbales figées » contrat de recherche LDI-ITESOFT. Co-direction de la thèse CIFRE d'Aurélie Joseph (thèse soutenue en décembre 2013, mention très bien avec félicitations du jury).[en savoir plus]

2007-2014

Projet NEOLOGIA : base de données pour la gestion des bases de données lexicographiques sur les néologismes en français. Responsable de la modélisation et de l'implémentation informatique de la base de données. En collaboration avec Jean-François Sablayrolles [en savoir plus]

2007-2008

Projet METALANGUE : base de données pour la gestion des bases de données lexicographiques sur la terminologie des sciences du langage. en français et arabe : responsable de l'implémentation informatique de la base. 

2007-2010

Projet DICOSEM : base de données pour la gestion des bases de données lexicographiques sur la représentation sémantique des mots du français: conception de la base avec le groupe des verbes, responsable de l'implémentation informatique de la base.

2007-2009

Projet PICS : base de données pour la gestion des bases de données lexicographiques sur les mots composés en français, espagnol, arabe et catalan : responsable de l'implémentation informatique de la base. LDI – Universidad Autonoma de Barcelona

2004-2006

Logiciel d'anonymisation e-doc Anonymiser : mise au point d'un logiciel d'anonymisation pour les services de documentation ayant à publier des arrêts de justice (Cour des comptes, CIC, Banques Populaires). E-doc Labs [en savoir plus]

2004-2006

Logiciel de veille des prix des vins en ligne: mise au point d'un logiciel permettant de récupérer sur les sites de vins en ligne les différentes informations sur les vins vendus en ligne (dans vingt langues), extraction et population d'une base de données interrogeable. Mise à jour régulière de la base. E-doc Labs

2003-2004

Projet français « TILT » d’expérimentations d’outils linguistiques sur un corpus de Normes. Projet « Technolangue ». Collaboration entre Lingway, ATILF, AFNOR. [en savoir plus]

2003-2004

Projet français « WATSON » d’outils linguistiques pour l’analyse de sites Web . Projet « Technolangue » . Collaboration entre Lingway, BNF (Bibliothèque Nationale de France) et Paris-IV Sorbonne. [en savoir plus]

2002–2003

Projet Européen « CROSSMARC » d’extraction automatique d’informations dans les Offres d’emploi et les annonces de ventes de produits informatiques. Collaboration internationale entre Institute of Informatics & Telecommunications, NCSR « Demokritos » (GR), University of Edinburgh (UK), University Roma, Tor vergata (IT), Lingway (FR). Responsable de la partie française et de la méthodologie d'extraction des informations. [en savoir plus]

2001–2002

Projet français « BREV », collaboration Lingway – INPI – MESR. Responsable de la modélisation linguistique et sémiotique des brevets, en vue d'extraire les énoncés importants, constituant une synthèse.

2000–2001

Projet Européen « MUSI » (Multi-lingual Summarisation Tool for the Internet) de résumé multilingue. Collaboration Internationale entre DFKI, Language Technology Lab (GER), University of Pisa, Instituto di Linguistica Computazionale (IT), Lexiquest (FR). Responsable de la partie française du projet et de la méthodologie d'extraction des « phrases importantes ». [en savoir plus]

1996–1998

Projet « SERAPHIN » de résumé automatique d’articles scientifiques, en collaboration avec le CNRS et EDF/GDF. Responsable de la modélisation sémiotique et linguistique des documents, extraction des « phrases importantes » par patrons lexico-syntaxiques. [en savoir plus]