Torres-Moreno Juan-Manuel
LIA Université d'Avignon et des Pays de Vaucluse, France
- Article 81 : Profilage de candidatures assisté par Relevance Feedback
- Auteurs :
Rémy Kessler (Laboratoire Informatique d'Avignon, France)
Béchet Nicolas (Laboratoire d'Informatique, de Robotique et de Microélectronique de Montpellier., France)
Torres-Moreno Juan-Manuel (Laboratoire Informatique d'Avignon, France)
Roche Mathieu (Laboratoire d'Informatique, de Robotique et de Microélectronique de Montpellier., France)
El-Bèze Marc (Laboratoire Informatique d'Avignon, France)
- Conférence : TALN
- Type : Poster
- Résumé : Le marché d'offres d'emploi et des candidatures sur Internet a eu une croissance exponentielle. Ceci implique des volumes d'information (majoritairement sous la forme de texte libre) intraitables manuellement. Une analyse et catégorisation assistés nous semble pertinente pour répondre à cette problématique. Nous proposons E-Gen, système qui a pour but l'analyse et catégorisation assistés d'offres d'emploi et des réponses des candidats. Dans cet article nous présentons plusieurs stratégies, reposant sur les modèles vectoriel et probabiliste, afin de résoudre la problématique du profilage des candidatures en fonction d'une offre précise. Nous avons évalué une palette de mesures de similarité afin d'effectuer un classement pertinent des candidatures au moyen des courbes ROC. L'utilisation de {it relevance feedback} a permis de surpasser nos résultats sur ce problème difficile, divers et sujet à une grande subjectivité.
- Format PDF
- Article 86 : Résumé automatique multi-document et indépendance de la langue : une première évaluation en français
- Auteurs :
Boudin Florian (Laboratoire Informatique d'Avignon / Université d'Avignon, France)
Torres-Moreno Juan-Manuel (Laboratoire Informatique d'Avignon / Université d'Avignon, France)
- Conférence : TALN
- Type : Poster
- Résumé : Le résumé automatique de texte est une problématique difficile, fortement dépendante de la langue et qui peut nécessiter un ensemble de données d'apprentissage conséquent. L'approche par extraction peut aider a surmonter ces difficultés. (Mihalcea, 2004) a démontré l'intérêt des approches à base de graphes pour l'extraction de segments de texte importants. Dans cette étude, nous décrivons une approche indépendante de la langue pour la problématique du résumé automatique multi-documents. L'originalité de notre méthode repose sur l'utilisation d'une mesure de similarité permettant le rapprochement de segments morphologiquement proches. De plus, c'est à notre connaissance la première fois que l'évaluation d'une approche de résumé automatique multi-document est conduite sur des textes en français.
- Format PDF
- Article 112 : Classification encyclopédique en vue d'un étiquetage par entités nommées
- Auteurs :
Charton Eric (Laboratoire Informatique d'Avignon - Université d'Avignon, France)
Torres-Moreno Juan-Manuel (Laboratoire Informatique d'Avignon - Université d'Avignon, France)
- Conférence : TALN
- Type : Communication orale
- Résumé : L'étiquetage par entités nommées recourant à des ressources d'étiquetage externes, fait l'objet d'un regain d'intérêt avec l'apparition de Wikipédia ou Wordnet. La disponibilité de ces corpus encyclopédiques numériques de grande taille, multilingues, exhaustifs et ouverts, conduit à proposer des solutions de labellisation qui exploitent les connaissances qu'ils contiennent.
La mise en correspondance d'une séquence de mot avec un document encyclopédique est possible, mais la classification des étiquettes et des entités encyclopédiques mises en relation n'est pas encore complètement résolue.
Le corpus encyclopédique ouvert tel que Wikipédia est en effet classé de manière anarchique, et sa consistance rend parfois difficile la mise relation des ses entités avec un système taxonomique contraint.
Dans cet article nous explorons cette difficulté et proposons un système complet pour répondre à ce besoin.
- Format PDF