M1 - Statistique et Science des Données (SSD)

  • Structure de formation

    Faculté des Sciences

Présentation

Alimentée par des moyens de recueil de plus en plus puissants, la donnée statistique (alias la data )  est en croissance exponentielle, et peu de domaines échappent à une mesure chaque jour plus  extensive. Mais si le recueil de la donnée est  une chose, son analyse  en est une autre. Celle-ci est rendue  difficile par deux phénomènes principaux : la taille des données et la complexité  des phénomènes mesurés. La statistique contemporaine s'attache  à résoudre  ces deux problèmes. Elle est ainsi conduite à évoluer très rapidement, en conservant le meilleur des outils passés qu'elle adapte aux données massives  et de grande dimension, et en proposant parallèlement des  voies de modélisation  de plus en plus fines  et  respectueuses  de la complexité des phénomènes. La statistique classique  a ainsi évolué vers une  "science des données"  plus  computationnelle, qui intègre  des techniques d'apprentissage et diagnostic automatiques  à mi-chemin  entre  statistique  et  intelligence artificielle.

Le parcours de Statistique et Sciences des Données est  une formation à toutes les méthodologies d'analyse  et  modélisation  statistique contemporaines. S'il  conduit au métier de " data  scientist ", il intègre autant les aspects de conception  méthodologique - grâce à la maîtrise des mathématiques sous-jacentes et de leur  programmation informatique - que l'application rigoureuse des méthodes et modèles  à des données de types  et domaines variés.

Ce parcours est  scindé en seconde année  en deux sous-parcours plus spécialisés, dont les enseignements restent partiellement mutualisés. La première  de ces spécialisations est la Biostatistique, qui approfondit  l'analyse et la  modélisation des  données du vivant. La seconde est  le management de l'information  et de la décision (MIND), spécialisé dans l'analyse et la modélisation de la donnée  économique ainsi que la gestion des décisions et risques associés.

 

What do you want to do ?New mailCopy

Lire plus

Objectifs

La première année du parcours donne aux étudiantes et aux étudiants  les bases conceptuelles, mathématiques et pratiques  des grandes branches de la méthodologie statistique : information et décision statistique, modélisation  probabiliste et inférence statistique, exploration et modélisation linéaires multidimensionnelles. Le parcours  contient   en outre deux UE d'ouverture au choix parmi  des UE d'initiation à l'économie  et aux données  du vivant.

Au terme de cette année, l'étudiante  ou l'étudiant  possèdera des bases solides sur lesquelles  la spécialisation pourra, en deuxième  année, être  développée. Elle  ou il aura aussi  une idée  éclairée de la spécialisation qui lui conviendra le mieux : Biostatistique  ou MIND.

What do you want to do ?New mailCopy

Lire plus

Savoir faire et compétences

Pour chacune des grandes familles de techniques  et modèles, l'étudiante ou l'étudiant saura  en maîtriser les idées, le  formalisme mathématique jusqu'à  pouvoir  l'adapter  et le programmer, et  bien  sûr l'utilisation correcte,  c'est-à-dire  critique, consciente et respectueuse des  limites de validité.

L'étudiante ou  l'étudiant commencera également  à pouvoir  construire  une chaîne de traitement des données  constituée  des étapes  suivantes, dans l'ordre : définition d'une problématique,  gestion et prétraitement des données, conception et mise  en œuvre  de la chaîne  analytique :  analyse exploratoire, modélisation,  estimation et choix de modèles, analyse des résultats, et enfin, rédaction d'un compte rendu  clair, rigoureux et  pédagogique de l'ensemble  du travail.

L'étudiante  ou l'étudiant aura en outre  appris, au cours  de divers projets et travaux  domestiques, à programmer correctement et efficacement  les  calculs  statistiques  nécessités  par des problématiques originales.

Enfin, elle ou il aura  appris à présenter  et  soutenir son travail devant  un public  en une  vingtaine de minutes.

Lire plus

Programme

Un projet tutoré en second  semestre du M1.

Lire plus
  • Optimisation

    5 crédits42h
  • Analyse des données multi-dimensionnelles

    5 crédits42h
  • Système d’information et bases de données

    4 crédits
  • Théories de l'information et de la décision

    2 crédits18h
  • Développement logiciel

    4 crédits30h
  • Statistique inférentielle

    5 crédits42h
  • Processus stochastiques

    5 crédits42h
  • Séries temporelles

    4 crédits30h
  • Estimation et tests non paramétriques

    4 crédits30h
  • Programmation R

    2 crédits16,5h
  • Projet

    5 crédits50h
  • Modèle linéaire

    5 crédits42h
  • CHOIX2

    2 crédits
    • Au choix : 1 parmi 4

      • Outils d'épidémiologie

        2 crédits
      • Micro-économie

        2 crédits18h
      • Bioinformatics Learning Lab

        2 crédits
      • Information biologique

        2 crédits
  • Contrôle stochastique

    2 crédits18h
  • CHOIX1

    4 crédits
    • Au choix : 1 parmi 2

      • Alignement et Phylogénie

        4 crédits
      • Economie générale

        4 crédits30h
  • Anglais

    2 crédits18h

Admission

Conditions d'accès

Modalités d'inscription

Public cible

Etudiant.es titulaires  d'une licence de mathématiques  générales.

Lire plus

Pré-requis nécessaires

Avoir un bon niveau en analyse, algèbre linéaire et bilinéaire, géométrie,  statistique élémentaire et  probabilités.

Lire plus

Pré-requis recommandés

Avoir un bon niveau en analyse, algèbre linéaire et bilinéaire, géométrie, statistique élémentaire et probabilités.

Lire plus

Et après

Poursuites d'études

M2  de  statistique au sens large, préparation à l'agrégation de  mathématiques, et doctorat possible par la suite.

Lire plus

Insertion professionnelle

Métiers : statisticien.ne,  biostatisticien.ne, data-scientist, analyse de données, tous de niveau ingénieur.

Tous secteurs d'activité : industrie, recherche et développement, santé, agronomie, banques et assurances, commerces, etc.

Lire plus