<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet title="XSL formatting" type="text/xsl" href="http://www-lipn.univ-paris13.fr/actualites/feed/rss2/xslt" ?><rss version="2.0"
  xmlns:dc="http://purl.org/dc/elements/1.1/"
  xmlns:wfw="http://wellformedweb.org/CommentAPI/"
  xmlns:content="http://purl.org/rss/1.0/modules/content/"
  xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
  <title>Actualités du LIPN - Tag - multimédia</title>
  <link>http://www-lipn.univ-paris13.fr/actualites/</link>
  <atom:link href="http://weblipn/actualites/feed/tag/navlang:en/multim%C3%A9dia/rss2" rel="self" type="application/rss+xml"/>
  <description></description>
  <language>en</language>
  <pubDate>Tue, 31 Jul 2012 18:27:28 +0200</pubDate>
  <copyright>Webmaster: Jean-Christophe Dubacq</copyright>
  <docs>http://blogs.law.harvard.edu/tech/rss</docs>
  <generator>Dotclear</generator>
  
    
  <item>
    <title>Méthodes d'analyse multi-vues supervisées et non supervisées des données textuelles</title>
    <link>http://www-lipn.univ-paris13.fr/actualites/post/M%C3%A9thodes-d-analyse-multi-vues-supervis%C3%A9es-et-non-supervis%C3%A9es-des-donn%C3%A9es-textuelles</link>
    <guid isPermaLink="false">urn:md5:a6fc24d6aee6dc3c85360bbb35fe26db</guid>
    <pubDate>Friday 13 April 2012</pubDate>
    <dc:creator>rozenknop</dc:creator>
        <category>Seminars</category>
        <category>Analyse de données multi-vues</category><category>classification supervisée</category><category>détection de nouveauté</category><category>filtrage personnalisé</category><category>fouille de données</category><category>modèles multi-topographiques</category><category>modèles neuronaux non supervisés</category><category>multimédia</category><category>méthodes symboliques</category><category>RCLN</category><category>recherche d’information</category><category>règles d association</category><category>réseaux bayésiens</category><category>systémique</category><category>séminaire RCLN</category><category>texte</category><category>visualisation hyperbolique</category><category>visualisation topographique</category><category>webométrie</category><category>évaluation de la qualité et optimisation du clustering</category>    
    <description>    &lt;p&gt;&lt;p&gt;&lt;ins style=&quot;font-style: italic; &quot;&gt;Invité&amp;nbsp;:&lt;/ins&gt; &lt;strong&gt;Jean-Charles Lamirel&lt;/strong&gt;&lt;em&gt;, D. HDR, Equipe SYNALP, LORIA&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;Le paradigme MVDA (Multi-View Data Analysis) couvre à la fois le domaine de l&amp;rsquo;analyse de données et&amp;nbsp;celui de la fouille de données. Il est plus spécifiquement dédié au traitement des données textuelles et&amp;nbsp;multimédia, sans toutefois s&amp;rsquo;y limiter. Selon celui-ci, chaque analyse de données est considérée comme&amp;nbsp;une vue différente sur les données. Le croisement entre les vues s’opère par l’intermédiaire d’un réseau&amp;nbsp;bayésien construit, de manière non supervisée, à partir des données ou des propriétés partagées entre ces&amp;nbsp;dernières. Le paradigme MDVA repose également sur l’exploitation de méthodes spécifiques de&amp;nbsp;visualisation, comme la visualisation topographique ou la visualisation hyperbolique, qui permettant de&amp;nbsp;gérer une interaction systémique entre les modèles obtenus et l&amp;rsquo;analyste. La mise en place de nouveaux&amp;nbsp;estimateurs de qualité du clustering de type Rappel/Précision non supervisés basés sur l’analyse de la&amp;nbsp;distribution des propriétés associées aux classes, et qui sont indépendants à la fois des méthodes de&amp;nbsp;clustering et des changements relatifs à leur mode opératoire (initialisation, distances utilisées ...), nous a&amp;nbsp;permis de démontrer objectivement les avantages de ce paradigme par rapport à l&amp;rsquo;approche globale,&amp;nbsp;classique en analyse de données. Elle nous a également permis de comparer et d&amp;rsquo;intégrer dans le&amp;nbsp;paradigme MVDA des méthodes de clustering neuronales, basées sur un nouveau principe de&amp;nbsp;maximisation d’étiquetage, qui sont plus particulièrement adaptées à la gestion des données ultra-éparses&amp;nbsp;et fortement multidimensionnelles, à l’image des données textuelles, ainsi que d’optimiser le mode&amp;nbsp;opératoire de telles méthodes. Notre démarche a par ailleurs impliqué de développer la cohabitation entre&amp;nbsp;le raisonnement neuronal et le raisonnement symbolique, ou entre des modèles de nature différente, de&amp;nbsp;manière à couvrir l’ensemble des fonctions de recherche et d&amp;rsquo;analyse de l’information et à éliminer, sinon&amp;nbsp;à réduire, les défauts inhérents à chacun des types d’approche.&lt;/p&gt;
&lt;p&gt;A travers plusieurs applications, nous montrerons comment l’exploitation d’un tel paradigme peut&amp;nbsp;permettre de résoudre des problèmes complexes d’analyse des données textuelles, comme ceux liés, en&amp;nbsp;veille, à l&amp;rsquo;analyse sémantique de corpus de brevets, en scientométrie, à l’analyse diachronique à grande&amp;nbsp;échelle des corpus bibliographiques, ou en TAL, à la classification et à l&amp;rsquo;étiquetage automatisés des&amp;nbsp;catégories syntaxiques.&lt;/p&gt;
&lt;p&gt;Nous aborderons dans un dernier temps le problème de la classification supervisée des données textuelles,&amp;nbsp;et décrirons les travaux que nous avons menés en exploitant le principe de la détection de nouveauté, pour&amp;nbsp;obtenir des méthodes de catégorisation à large champ, telle que la méthode ILoNDF, qui s&amp;rsquo;avèrent&amp;nbsp;supérieures aux références usuelles du domaine, comme SVM, sur le texte. Nous montrerons finalement&amp;nbsp;comment il est possible d&amp;rsquo;envisager l&amp;rsquo;intégration de ce type de méthode dans un contexte multi-vues.&lt;/p&gt;
&lt;/p&gt;</description>
    
    
    
      </item>
    
</channel>
</rss>