Equipe encadrante: Stéphan Clémençon et Aurélien Garivier
L'objectif du cours est de découvrir les enjeux du "machine learning", une discipline en plein essor à l'interface des mathématiques (probabilités/statistiques, optimisation) et de l'informatique et qui joue aujourd'hui un rôle majeur en matière d'innovation technologique. Il s'agira ici d'en explorer quelques concepts et techniques essentiels, à travers un projet (décrit ci-dessous) autour du problème fondamental de la "classification supervisée" (i.e. "reconnaissance de formes"). Il se déroulera sur trois semaines, pendant lesquelles alterneront:
En parallèle, vous devrez réaliser en équipe un projet de synthèse requérant l'utilisation des notions abordées en cours/TP. L'organisation du travail en équipe est laissée à votre discrétion. Vous disposerez d'un accès à une salle de TP (DB 001 sur le site Dareau).
En ce qui concerne l'évaluation de votre travail (individuel et collectif), vous rédigerez ensemble:
Séance 1 (17/10/11) Le machine-learning : problèmes et principes généraux
TP 1 (17/10/11) Introduction au logiciel statistique R (slides d'introduction à R, le perceptron)
Séance 2 (18/10/11) Le problème de la classification binaire - Premiers algorithmes
TP 2 (18/10/11) Premiers algorithmes de classification
Séance 3 (19/10/11) Notions de complexité - Un peu de théorie
TP 3 (19/10/11) Premiers algorithmes de classification (suite)
Séance 4 (20/10/11) Evaluation du risque, sélection de modèle et bootstrap
TP 4 (20/10/11) Premiers algorithmes de classification (suite)
Séance 5 (21/10/11) Apprentissage en ligne et problèmes de bandits
TP 5 (21/10/11) Quelques expériences en apprentissage on-line et problèmes de bandits
Séance 6 (24/10/11) Travail sur projet
TP 6 (24/10/11) Travail sur projet en salle C129 exceptionnellement
Séance 7 (25/10/11) Machines à vecteurs support - cas linéaire et "kernel trick"
TP 7 (25/10/11) Mise en oeuvre des SVM
Séance 8 (26/10/11) Méthodes d'agrégation: bagging, boosting et forêts aléatoires
TP 8 (26/10/11) Mise en oeuvre des méthodes d'agrégation
Séance 9 (27/10/11) Apprentissage par renforcement
TP 9 (27/10/11) Optimisation de stock, corrigé
Séance 10 (28/10/11) Prédiction de séquences individuelles et soft-max
TP 10 (28/10/11) poursuite du meilleur expert, comparaisons EXP3/UCB
Projet (31/10-04/11) Finalisation du projet