| 
                                              Navigation 
                                           | 
                                         
                                        
                                          | 
                                            
                                           | 
                                         
                                        
                                             | 
                                         
                                        
                                             
                                           | 
                                         
                                        
                                          |   | 
                                         
                                        
                                          | 
                                              Liens
                                                  conseillés 
                                           | 
                                         
                                        
                                          | 
                                            
                                           | 
                                         
                                      
                                     
                                   
                                 | 
                                
                                  
                                    
                                      
                                        
                                          
                                            
                                            
                                            Approches
                                              multi-vues et
                                              multi-sources en
                                              apprentissage
                                              non-supervisé 
                                             
                                            Collaborations Y.
                                              Bennani, G. Cabanes, N.
                                              Grozavu, J. Sublime 
                                             
                                             
                                            Je me suis
                                              intéressé
                                              depuis 2015 à
                                              l’apprentissage
                                              non-supervisé et en
                                              particulier aux
                                              méthodes multi-vues
                                              et multisources.
                                              En effet, l’étude
                                              de données
                                              distribuées et pour
                                              lesquelles il n’existe peu
                                              ou pas d’étiquettes
                                              permettant un
                                              traitement
                                              supervisé est un
                                              domaine important de le
                                              fouille de données
                                              dans lequel les
                                              problématiques sont
                                              nombreuses.
                                              Dans ce contexte, je me
                                              suis
                                              intéressé en
                                              particulier au clustering
                                              collaboratif qui est une
                                              branche du clustering
                                              multivue
                                              dans lequel des
                                              algorithmes de clustering
                                              travaillent ensemble avec
                                              des données issues
                                              de différentes
                                              vues, mais dont
                                              l’objectif n’est pas
                                              d’aboutir une seule
                                              partition globale, mais
                                              à des partitions
                                              localement
                                              améliorées
                                              dans toutes les vues
                                              via des collaborations
                                              mutuelles.
                                              S’il existait
                                              déjà dans la
                                              littérature de
                                              nombreuses méthodes
                                              permettant de faire
                                              collaborer des algorithmes
                                              de clustering
                                              identiques, l’une de mes
                                              contributions  a
                                              été de
                                              proposer des
                                              méthodes permettant
                                              à des algorithmes
                                              de
                                              familles
                                              différentes de
                                              travailler ensemble. En
                                              effet,
                                              l’intérêt de
                                              pouvoir faire travailler
                                              ensemble des
                                              méthodes
                                              différentes
                                              (fonctions de distances
                                              locales
                                              différentes, nombre
                                              de clusters
                                              différents, voire
                                              modèles
                                              différents) est
                                              assez évident
                                              lorsqu’on
                                              est face à des vues
                                              très
                                              hétérogènes
                                              et ne pouvant être
                                              toutes traitées de
                                              la même façon
                                              par le même
                                              algorithme (données
                                              issues des réseaux
                                              sociaux, résultats
                                              de moteurs de recherches,
                                              données issues
                                              d’objets
                                              connectées, etc.).
                                              La difficulté est
                                              alors de trouver comment
                                              des algorithmes
                                              différents peuvent
                                              s’échanger des
                                              informations sous un
                                              format commun qu’ils
                                              comprennent tous. La
                                              méthode que j’ai
                                              proposée dans ce
                                              sens repose sur un
                                              modèle permettant
                                              de faire collaborer
                                              ensemble n’importe quels
                                              algorithmes de clustering
                                              probabilistes ou ayant une
                                              fonction objectif,
                                              indépendamment des
                                              modèles et des
                                              nombres de clusters
                                              utilisés dans les
                                              vues locales.   
                                             
                                            
                                                
                                             
                                            
                                            J’ai
                                              continué de
                                              travailler cette
                                              problématiques de
                                              collaborations entre
                                              algorithmes très
                                              différents. En
                                              utilisant le
                                              principe minimum de
                                              complexité, nous
                                              avons amené
                                              à proposer dans
                                              l’utilisation de la
                                              complexité de
                                              Kolmogorov
                                              à machine
                                              fixée comme
                                              critère
                                              d’optimisation universel
                                              pour permettre d’optimiser
                                              la collaboration entre
                                              algorithmes de
                                              clustering potentiellement
                                              très
                                              différents. En
                                              essayant de trouver des
                                              critères objectifs
                                              permettant de
                                              pondérer
                                              l’influence
                                              des différentes
                                              vues en fonction de leur
                                              potentiel à
                                              améliorer ou
                                              détériorer
                                              le résultat final
                                              de la collaboration, je me
                                              suis
                                              intéressé
                                              aux problématiques
                                              de qualité des
                                              résultats, de
                                              capacité à
                                              explorer de nouvelles
                                              solutions, et de
                                              stabilité des
                                              partitions issues d’un
                                              clustering multi-vue.
                                              Les résultats de
                                              ces travaux ont permis
                                              d’aboutir à la
                                              conclusion
                                              théorique que
                                              l’importance de la
                                              diversité reste
                                              vraie dans le cadre de
                                              méthodes
                                              non-supervisées
                                              multi-algorithmes, et que
                                              faute de pouvoir s’appuyer
                                              sur un critère de
                                              qualité
                                              objectif, c’est la
                                              stabilité des
                                              solutions de clustering
                                              qui devra être
                                              favorisée  ce
                                              qui encourage ainsi
                                              prioritairement
                                              les collaborations entre
                                              algorithmes trouvant des
                                              résultats proches
                                              de ceux du reste du
                                              groupe.
                                               
                                            
                                           | 
                                         
                                      
                                     
                                   
                                 |