Apprentissage statistique
Enseignant Aurélien Garivier
Description du cours
Ce cours introduit les techniques d’apprentissage machine à ceux qui, dans leurs disciplines, sont susceptibles de vouloir l’utiliser. Plutôt qu’un recensement exhaustif de tous les algorithmes existants, il vise à présenter la méthodologie de l’apprentissage statistique, à préciser ce que l’on peut en attendre, et à esquisser le type d’éclairage qu’apportent les études théoriques. Il sera illustré de nombreux exemples sur des jeux de données synthétiques et réelles.
Plan succinct
- Données, aléa, modèles et algorithmes
- Apprentissage non supervisé : algorithmes de clustering
- Apprentissage supervisé : algorithmes de classification
- Introduction à l’apprentissage par renforcement
- Apprentissage pour données massives : qu’est-ce qui change ?
Pré-requis
Si la présentation rendra possible de suivre la trame générale sans connaissances particulières, certains développements plus techniques nécessiteront des connaissances mathématiques de début d’enseignement supérieur (bases d’algèbre linéaire et d’analyse réelle).
Des notions de programmation sont également
Evaluation
Examen terminal ou rapport de projet.
Documents divers
- Slides: introduction (intelligence artificielle, machine learning, apprentissage statistique)
- Notebook: introduction au Machine Learning
- Notebook: introduction à MNIST
- Slides: apprentissage non-supervisé, clustering
- Notebook: clustering
- Slides: apprentissage supervisé: introduction, k plus proches voisins
- Expérience sous R: jeu de données "adult" (census américain)
- Slides: apprentissage supervisé: validation croisée, régression logistique, arbres de décision
- Slides: apprentissage supervisé: SVM, méthodes d'agrégation (bagging, random forests, boosting)
- Slides: réseaux de neurones
- Notebook: réseaux de neurones pour MNIST
- Slides: Apprentissage séquentiel, apprentissage par renforcement
Bibliographie succinte
- The Elements of Statistical Learning, by Trevor Hastie, Robert Tibshirani and Jerome Friedman
- Understanding Machine Learning, From Theory to Algorithms, by Shai Shalev-Shwartz and Shai Ben-David
- A Probabilistic Theory of Pattern Recognition, by Luc Devroye, Laslzlo Gyorfi and Gabor Lugosi
- Introduction to Nonparametric Estimation, by Alexander Tsybakov
- Lectures notes on advanced Statistical Learning , by Martin Wainwright