Logo SupGalilée  Logo Université Paris 13

Ingénieurs Informatique 3ème année
INFO3 - Option ADO

Apprentissage Symbolique Automatique

C. Rouveirol, H. Soldano et Y. Chevaleyre (par ordre d'apparition)

Le but de ce cours est de présenter des techniques d'apprentissage qui opèrent sur des langages d'hypothèses "symboliques", c'est-à-dire exprimées dans des langages logiques (propositionnelle ou en ordre un).

Cours 1: Le premier cours introduit un algorithme d'apprentissage "historique", permettant e construire des Arbres de Décision, étant donné un ensemble d'apprentissage formé d'exemples positifs et négatifs. Ce premiers cours permet d'introduire les premières définitions essentielles pour la suite du cours.

Cours 2: Ce deuxième cours introduit les deux notions fondamentales d'ordre partiel sur un espace d'hypothèses et d'espace des versions. Il présent aussi un algorithme d'élimination des candidats de Mitchell et introduit la notion de biais (de langage et de recherche) en apprentissage et celle de l'apprentissage vu comme une recherche dans un espace d'hypothèses partiellement ordonné.

Cours 3, 4 et 5: Les cours suivants (associés à deux TPs) permettent d'introduire et d'étudier diverses stratégies d'apprentissage de règles ainsi que les systèmes les implémentant. On abordera également dans ces cours les notions d'évaluation des systèmes d'apprentissage, de sur-apprentissage et d'élagage d'un ensemble de règles.

Cours 6 et 7: Aspects théoriques de l'Apprentissage Artificiel. On aborde dans le cours les odèles d'apprentissage en ligne Mistake-bound et par requêtes, et l'apprentissage Probablement Approximativement Correct (PAC). Dans les deux cas on se pose des questions sur les ressources suffisantes pour garantir d'atteindre ou d'approcher une fonction booléenne cible. Nous présenterons en particulier des modèles d'algorithmes classiques dans le cas mistake-bound : le principe du Halving (littéralement division par deux) et l'algorithme Winnow.

Cours 8: Fouille de données. On s'attache dans cette partie à l'étude d'une processus non supervisé, l'extraction de motifs fermés et de règles d'associations. Nous présenterons la notion de treillis de concepts, donnant une représentation structurée et compacte de l'ensemble des motifs qui se distinguent sur un ensemble d'objets, chaque noeud du treillis étant associé à une classe d'équivalence de motifs et à son représentant dit motif "fermé". On déduit classiquement de ces représentations une base de l'ensemble des règles d'associations satisfaisant des critères de support et de confiance sur les objets d'entrée. La construction du treillis et de la base de règle par l'algorithme Close est présentée.

Cours 9 et 10: Ces deux derniers cours aborderont deux points complémentaires : le modèle d'apprentissage on-line, où les exemples, contrairement aux cas précédents, ne sont pas disponibles dès le début de l'apprentissage, mais arrivent un à un au système d'apprentissage. Ceci pose des problèmes spécifiques aux systèmes d'apprentissage supervisé (ordre des exemples, sensibilité au bruit, etc.). Enfin, nous aborderons les modèles de classification supervisée par ensemble : on cherche à optimiser la performance d'un classifieur binaire en combinant plusieurs instances de ce classifieur. Nous étudierons en particulier les propriétés de l'algorithme de boosting, ce qui nous permettra de faire le lien avec le cadre PAC.

Contacts

Pour plus d'informations, vous pouvez contacter :

Céline Rouveirol

Henry Soldano

Yann Chevaleyre