ECTS
5 crédits
Composante
Faculté des Sciences
Description
Le modèle linéaire est un outil à la fois simple et très riche, qui est à la base de nombreuses méthodes statistiques. Sa maîtrise et sa bonne compréhension sont très utiles à la fois d'un point de vue pratique, pour analyser de manière fine certains jeux de données, et d'un point de vue conceptuel, pour comprendre les bases théoriques des méthodes d'apprentissages plus avancées, y compris actuelles.
Ce cours propose une introduction au modèle linéaire de régression simple et multiple, avec des variables quantitatives ou qualitatives. Il présente la dérivation formelle et l'étude théorique des estimateurs des moindres carrés et du maximum de vraisemblance dans le cas gaussien. Il donne également des outils de validation et de sélection de variables pour étudier les limites du modèle. Enfin, il introduit l'utilisation pratique de cet outil sur des jeux de données simples grâce au logiciel R.
Objectifs
- Comprendre les propriétés théoriques des modèles linéaires, avec variables quantitatives ou qualitatives.
- Savoir construire et estimer un modèle linéaire sur des données avec le logiciel R.
- Être capable d'interpréter les résultats et les limites du modèle posé.
Pré-requis nécessaires
Probabilités et statistiques descriptives de niveau L
HAX710X statistique inférentielle
Algèbre linéaire de niveau L
Pré-requis recommandés : La connaissance du logiciel R serait un atout
Syllabus
1 - Régression Linéaire Simple
1.1 - Moindres Carrés
Propriétés des estimateurs des moindres carrés, prédictions, interprétation géométrique
1.2 - Modèle Gaussien
Loi des estimateurs du maximum de vraisemblance, intervalles et régions de confiance
2 - Régression Linéaire Multiple
2.1 - Moindres Carrés
Propriétés des estimateurs des moindres carrés, prédictions, interprétation géométrique
2.2 - Modèle Gaussien
Loi des estimateurs du maximum de vraisemblance, intervalles et régions de confiance
2.3 - Sélection de Variable
Tests d'hypothèses, critères de sélection de modèle (AIC, BIC, ...)
3 - Validation de Modèle
3.1 - Analyse des résidus
Structure, normalité, homoscédasticité
3.2 - Points leviers et données aberrantes
Matrice de projection, distance de Cook
4 - Régression Linéaire avec variables qualitatives
4.1 - ANOVA à un facteur
Modèle, tests d'hypothèses
4.2 - ANOVA à deux facteurs
Modèle, tests d'hypothèses
Informations complémentaires
Volumes horairestrio :
CM : 21h
TD : 21h
TP :
Terrain :