Structure de formation
Faculté des Sciences
Présentation
Alimentée par des moyens de recueil de plus en plus puissants, la donnée statistique (alias la data ) est en croissance exponentielle, et peu de domaines échappent à une mesure chaque jour plus extensive. Mais si le recueil de la donnée est une chose, son analyse en est une autre. Celle-ci est rendue difficile par deux phénomènes principaux : la taille des données et la complexité des phénomènes mesurés. La statistique contemporaine s'attache à résoudre ces deux problèmes. Elle est ainsi conduite à évoluer très rapidement, en conservant le meilleur des outils passés qu'elle adapte aux données massives et de grande dimension, et en proposant parallèlement des voies de modélisation de plus en plus fines et respectueuses de la complexité des phénomènes. La statistique classique a ainsi évolué vers une "science des données" plus computationnelle, qui intègre des techniques d'apprentissage et diagnostic automatiques à mi-chemin entre statistique et intelligence artificielle.
Le parcours de Statistique et Sciences des Données est une formation à toutes les méthodologies d'analyse et modélisation statistique contemporaines. S'il conduit au métier de " data scientist ", il intègre autant les aspects de conception méthodologique - grâce à la maîtrise des mathématiques sous-jacentes et de leur programmation informatique - que l'application rigoureuse des méthodes et modèles à des données de types et domaines variés.
Ce parcours est scindé en seconde année en deux sous-parcours plus spécialisés, dont les enseignements restent partiellement mutualisés. La première de ces spécialisations est la Biostatistique, qui approfondit l'analyse et la modélisation des données du vivant. La seconde est le management de l'information et de la décision (MIND), spécialisé dans l'analyse et la modélisation de la donnée économique ainsi que la gestion des décisions et risques associés.
What do you want to do ?New mailCopy
Objectifs
La première année du parcours donne aux étudiantes et aux étudiants les bases conceptuelles, mathématiques et pratiques des grandes branches de la méthodologie statistique : information et décision statistique, modélisation probabiliste et inférence statistique, exploration et modélisation linéaires multidimensionnelles. Le parcours contient en outre deux UE d'ouverture au choix parmi des UE d'initiation à l'économie et aux données du vivant.
Au terme de cette année, l'étudiante ou l'étudiant possèdera des bases solides sur lesquelles la spécialisation pourra, en deuxième année, être développée. Elle ou il aura aussi une idée éclairée de la spécialisation qui lui conviendra le mieux : Biostatistique ou MIND.
What do you want to do ?New mailCopy
Savoir faire et compétences
Pour chacune des grandes familles de techniques et modèles, l'étudiante ou l'étudiant saura en maîtriser les idées, le formalisme mathématique jusqu'à pouvoir l'adapter et le programmer, et bien sûr l'utilisation correcte, c'est-à-dire critique, consciente et respectueuse des limites de validité.
L'étudiante ou l'étudiant commencera également à pouvoir construire une chaîne de traitement des données constituée des étapes suivantes, dans l'ordre : définition d'une problématique, gestion et prétraitement des données, conception et mise en œuvre de la chaîne analytique : analyse exploratoire, modélisation, estimation et choix de modèles, analyse des résultats, et enfin, rédaction d'un compte rendu clair, rigoureux et pédagogique de l'ensemble du travail.
L'étudiante ou l'étudiant aura en outre appris, au cours de divers projets et travaux domestiques, à programmer correctement et efficacement les calculs statistiques nécessités par des problématiques originales.
Enfin, elle ou il aura appris à présenter et soutenir son travail devant un public en une vingtaine de minutes.
Programme
Un projet tutoré en second semestre du M1.
Contrôle stochastique
2 créditsSéries temporelles
4 créditsEstimation et tests non paramétriques
4 créditsModèle linéaire
5 créditsProjet
5 créditsAnglais
2 créditsCHOIX2
2 créditsAu choix : 1 parmi 4
Outils d'épidémiologie
2 créditsMicro-économie
2 créditsBioinformatics Learning Lab
2 créditsInformation biologique
2 crédits
CHOIX1
4 créditsAu choix : 1 parmi 2
Alignement et Phylogénie
4 créditsEconomie générale
4 crédits
Programmation R
2 crédits
Admission
Conditions d'accès
Modalités d'inscription
Les candidatures se font sur les plateformes suivantes :
- Étudiants français & Européens : suivre la procédure « Mon Master » depuis le site : https://www.monmaster.gouv.fr/
- Étudiants internationaux hors UE : suivre la procédure « Études en France » : https://pastel.diplomatie.gouv.fr/etudesenfrance/dyn/public/authentification/login.html
Public cible
Etudiant.es titulaires d'une licence de mathématiques générales.
Pré-requis nécessaires
Avoir un bon niveau en analyse, algèbre linéaire et bilinéaire, géométrie, statistique élémentaire et probabilités.
Pré-requis recommandés
Avoir un bon niveau en analyse, algèbre linéaire et bilinéaire, géométrie, statistique élémentaire et probabilités.
Et après
Poursuites d'études
M2 de statistique au sens large, préparation à l'agrégation de mathématiques, et doctorat possible par la suite.
Insertion professionnelle
Métiers : statisticien.ne, biostatisticien.ne, data-scientist, analyse de données, tous de niveau ingénieur.
Tous secteurs d'activité : industrie, recherche et développement, santé, agronomie, banques et assurances, commerces, etc.