Navigation


 

Liens conseillés

Google
Wikipedia
"Compressed Sensing"
"Machine Learning"
Contacts

Choisis en paroles la vérité (Lao-Tseu).

Il ne dépend que de nous de suivre la route qui monte et dviter celle qui descend (Platon)

Apprentissage de représentations hiérarchiques de données

Collaborations : F. Arandiga, J.-F. Aujol,  A. Cohen, R. Donat, N. Dyn,  M. Kaaniche,  S. Meignen, A. Molkaroui,  B. Thai, A. Zakharova.
 


Dans les différents problèmes existants en analyse de données le choix d’une représentation appropriée de ces données est souvent fondamental pour résoudre un problème donné. Toujours en considérant que les données observées vivent dans un espace de grande dimension et que celles-ci se regroupent sur des variétés régulières séparées par des singularités, l’objectif est de proposer des changements de représentation qui préservent la topologie de données observées, c’est à dire qui détectent avec précisions les variétés contenant des singularités. Ces variétés singulières une fois détectées permettront la définition de "clusters" dans les données observées. D’un point de vue plus formel cela revient à changer de représentation pour une fonction régulière par morceaux telle que certaines propriétés sont préservées, par exemple la localisation des singularités. Un exemple typique existe en analyse harmonique, car on peut décomposer une fonction arbitraire en une combinaison de fonctions de base

Un premier exemple d’une telle décomposition est le développement en série de Fourier, où les fonctions de base sont les fonctions trigonométriques. On peut représenter alors la fonction  par ses coefficients a0, a1, a2, · · · . Dans le cas unidimensionnel, si la fonction f présente des discontinuités, on utilise plutôt les bases d’ondelettes (ψ_n) sont les dilatées et translatées d’une seule fonction ψ). Introduites au milieu des années ’80 ont apporté un cadre fonctionnel fécond au développement et à l’analyse des représentations hiérarchiques. 


Toutefois, les bases d’ondelettes sont mal adaptées pour décrire des fonctions en dimension supérieure n ≥ 2 qui sont régulières en dehors des singularités elles aussi régulières. Un exemple type sont les images qui sont des objets complexes contenant des régions homogènes séparées par des contours. Ceci est dû au "conflit" entre le caractère "diffus-isotrope” des ondelettes et le caractère "concentré-anisotrope” des singularités. C’est la malédiction de la dimension.

Les représentations hiérarchiques non-linéaires trouvent des applications en analyse de données : réduction de la dimension, visualisation. Celles-ci sont la conséquence directe du fait que ces représentations hiérarchiques ont un nombre important des valeurs nulles. On parle ainsi de la parcimonie de la représentation. Une propriété toute aussi importante de ces représentations est la stabilité. Dans les applications telles que la compression et le débruitage, nous sommes amenés à perturber les coefficients de la représentation multi-échelles de v par des opérations de seuillage ou de quantification.