ECTS
5 crédits
Composante
Faculté des Sciences
Description
Ce cours traite du cadre de l'apprentissage automatique sous un angle statistique.
Nous nous intéresserons principalement au cadre supervisé (régression et classification) et introduirons quelques éléments du cadre non-supervisé à travers les méthodes de partitionnement (clustering).
Au-delà des aspects de modélisation et de théorie, le cours couvrira aussi quelques éléments d'optimisation et d'implémentation (sklearn, pytorch, etc.) des méthodes introduites.
Objectifs
Être capable de modéliser un nouveau problème d’apprentissage au vu des objectifs, méthodes disponibles.
Pré-requis nécessaires
Modèle linéaire (HAX814X) / Développement logiciel (HAX712X) / Optimisation (HAX706X)
Pré-requis recommandés : Statistique inférentielle (HAX710X) et Estimation et tests non paramétriques (HAX809X)
Contrôle des connaissances
CC
TP noté (code)
Projet (rapport + présentation + code)
Syllabus
- Introduction à l'apprentissage supervisé; modèles linéaires.
- Validation croisée, régression logistique, analyse discriminante.
- Sélection de modèle et méthodes de régularisation.
- Mesure de performance (multi-classe: top-k, ROC curve AUC, etc.)
- Perceptron et (descente) de gradient stochastique.
- SVM
- Arbres de décision, Forêts aléatoires et Boosting.
- Apprentissage non-supervisé (partitionnement: KMEANS, Ward's method)
- Résaux de neurones
Informations complémentaires
Volumes horaires :
CM : 21h
TD :
TP :
Terrain :