Sciences

Statistique et Science des Données (SSD)

  • Structure de formation

    Faculté des Sciences

Présentation

Le parcours SSD est une formation de mathématiques appliquées qui vise à donner des compétences de haut niveau en statistique, modélisation de l’aléatoire et en science des données.
Il a vocation à fournir des connaissances solides et des compétences professionnelles afin que les étudiant·e·s s’intègrent au sein d’équipes pluridisciplinaires dans de nombreux secteurs d’activité : santé, biologie, écologie, environnement, génomique, énergie, agronomie, économie, banque, assurance, marketing, recherche, enseignement supérieur ...

Lire plus

Organisation

Ouvert en alternance

Cet enseignement est ouvert en alternance.

Programme

Sélectionnez un programme

M1 - Statistique et Science des Données (SSD)

Alimentée par des moyens de recueil de plus en plus puissants, la donnée statistique (alias la data )  est en croissance exponentielle, et peu de domaines échappent à une mesure chaque jour plus  extensive. Mais si le recueil de la donnée est  une chose, son analyse  en est une autre. Celle-ci est rendue  difficile par deux phénomènes principaux : la taille des données et la complexité  des phénomènes mesurés. La statistique contemporaine s'attache  à résoudre  ces deux problèmes. Elle est ainsi conduite à évoluer très rapidement, en conservant le meilleur des outils passés qu'elle adapte aux données massives  et de grande dimension, et en proposant parallèlement des  voies de modélisation  de plus en plus fines  et  respectueuses  de la complexité des phénomènes. La statistique classique  a ainsi évolué vers une  "science des données"  plus  computationnelle, qui intègre  des techniques d'apprentissage et diagnostic automatiques  à mi-chemin  entre  statistique  et  intelligence artificielle.

Le parcours de Statistique et Sciences des Données est  une formation à toutes les méthodologies d'analyse  et  modélisation  statistique contemporaines. S'il  conduit au métier de " data  scientist ", il intègre autant les aspects de conception  méthodologique - grâce à la maîtrise des mathématiques sous-jacentes et de leur  programmation informatique - que l'application rigoureuse des méthodes et modèles  à des données de types  et domaines variés.

Ce parcours est  scindé en seconde année  en deux sous-parcours plus spécialisés, dont les enseignements restent partiellement mutualisés. La première  de ces spécialisations est la Biostatistique, qui approfondit  l'analyse et la  modélisation des  données du vivant. La seconde est  le management de l'information  et de la décision (MIND), spécialisé dans l'analyse et la modélisation de la donnée  économique ainsi que la gestion des décisions et risques associés.

 

What do you want to do ?New mailCopy

Voir la page complète de ce parcours

  • Processus stochastiques

  • Système d’information et bases de données

    4 crédits
  • Analyse des données multi-dimensionnelles

    5 crédits
  • Optimisation

    5 crédits
  • Développement logiciel

    4 crédits
  • Statistique inférentielle

  • Théories de l'information et de la décision

    2 crédits
  • Contrôle stochastique

    2 crédits
  • Séries temporelles

    4 crédits
  • Estimation et tests non paramétriques

    4 crédits
  • Modèle linéaire

    5 crédits
  • Projet

    5 crédits
  • Anglais

    2 crédits
  • CHOIX2

    2 crédits
    • Au choix : 1 parmi 4

      • Outils d'épidémiologie

        2 crédits
      • Micro-économie

        2 crédits
      • Bioinformatics Learning Lab

        2 crédits
      • Information biologique

        2 crédits
  • CHOIX1

    4 crédits
    • Au choix : 1 parmi 2

      • Alignement et Phylogénie

        4 crédits
      • Economie générale

        4 crédits
  • Programmation R

    2 crédits

M2 - Statistique et Science des Données (SSD) - BIOSTATS

Ce M2 s’adresse à des étudiantes et étudiants titulaires du M1 Statistique Science des Données (SSD) ou tout autre M1 de mathématiques ou équivalent avec une spécialisation forte en probabilités et statistique.

Ce M2 est scindé en deux sous-parcours plus spécialisés, dont les enseignements restent partiellement mutualisés.

- La première de ces spécialisations est la Biostatistique, qui approfondit l'analyse et la modélisation des données du vivant.

- La seconde est le Management de l'information et de la décision (MIND), spécialisé dans l'analyse et la modélisation de la donnée économique ainsi que la gestion des décisions et risques associés.

  • L’ambition du parcours SSD-Biostat est de répondre aux attentes des étudiantes et étudiants du M1 SSD qui se sentent attiré·es par la modélisation des données du vivant ou de l’environnement. Les aspects statistiques abordés dans ce parcours vont de la modélisation du vivant jusqu’aux problématiques les plus théoriques de la statistique et de la modélisation stochastique. Les aspects numériques sont extrêmement présents dans ce parcours et requièrent un goût prononcé pour la programmation informatique.

Le parcours SSD-Biostat est une formation exigeante car elle met l’accent sur les concepts plutôt que sur les techniques. En effet, dans le domaine de la donnée au sens large, les technologies numériques, avec l’avènement de l’intelligence artificielle évoluent vite et se périment encore plus vite. Les futur·es ingénieur·es statisticien·nes ou chercheurs et chercheuses qui devront traiter des données pourront, tout au long de leur vie professionnelle se former à de nouvelles technologies, d’autant mieux s’ils ou elles ont eu une formation initiale conceptuelle solide. La plus-value de la formation est justement d’apporter la compréhension théorique des concepts statistiques sous-jacents aux algorithmes automatiques. Les diplômé·es doivent aussi être capable d’assurer une veille technologique de qualité.

Le parcours SSD-Biostat reste en partie mutualisé en deuxième année avec le parcours management de l'information et de la décision (SSD-MIND). Toutefois, des UE de spécialisation pour la science des données du vivant ou de l’environnement et davantage tournées vers l’initiation à la recherche sont spécifiques au parcours SSD-BIOSTAT (deux UE par semestre du M2).

  • L’ambition du parcours SSD-MIND est de répondre aux attentes des étudiantes et étudiants du M1 SSD qui se sentent attiré·es par l'application de la science des données en entreprise. Compte tenu de la très grande diversité des entreprises et de leurs problématiques, ce M2 forme à une science des données généraliste, "tous terrains". Par surcroît, il fournit une formation plus spécifique au contexte de l'entreprise et à ses problématiques économique et managériale (information économique, gestion des risques financiers, clientèle, stratégie d'entreprise etc).

Le parcours SSD - MIND est une formation de type ingénierie mathématique, qui met au premier plan la méthodologie et la parfaite maîtrise des concepts et modèles statistiques. La ou le diplômé·e de ce parcours pourra faire face à tout type de données et de problématique, et concevoir une méthodologie complète et souvent originale servant cette problématique, partant de la gestion et de l'organisation des données, poursuivant avec leur exploration et leur réduction ciblée, puis avec la modélisation des phénomènes d'intérêt, et enfin synthétisant l'information extraite à des fins de décision. Elle ou il devra également savoir transmettre à l'entreprise la connaissance synthétisée à partir de l'information extraite des données. Chaque nouvel ensemble de données et chaque question posée le concernant est souvent un nouveau problème, et l'application à ces données d'une méthode standard est alors inadaptée. Il s'agit au contraire d'écrire un modèle mathématique adapté à ces données (au sens où il en traduit la complexité de façon satisfaisante) et de le rendre assimilable à une méthode d'estimation standard, ou de concevoir et programmer une méthode plus spécifique. L'accent mis par cette formation sur la maîtrise conceptuelle et mathématique des outils garantit aux diplômés de ce parcours la très grande capacité d'adaptation et d'auto-formation nécessitée par la rapide évolution de la science des données.

Le parcours SSD-MIND reste en partie mutualisé en deuxième année avec le parcours biostatistique (SSD-Biostat), plus spécialisé en analyse et modélisation des données du vivant ou de l’environnement. Le parcours SSD-MIND est une double formation en partenariat avec l'IAE (qui assure les enseignements d'économie et de management), donnant lieu à un double diplôme.

Voir la page complète de ce parcours

  • Estimation non-paramétrique

    5 crédits
  • Modèles linéaires généralisés

    5 crédits
  • Anglais

    2 crédits
  • Projet ou Soutenance alternance

    3 crédits
  • Statistique Bayésienne

    5 crédits
  • Analyse multivariée

    5 crédits
  • Apprentissage statistique

    5 crédits
  • Analyse des durées de vie

    4 crédits
  • Complément 2

    4 crédits
  • Complément 1

    4 crédits
  • Stage

    14 crédits
  • Modèles à variables latentes

    4 crédits

M2 - Statistique et Science des Données (SSD) - MIND

Ce M2 s’adresse à des étudiantes et étudiants titulaires du M1 Statistique Science des Données (SSD) ou tout autre M1 de mathématiques ou équivalent avec une spécialisation forte en probabilités et statistique.

Ce M2 est scindé en deux sous-parcours plus spécialisés, dont les enseignements restent partiellement mutualisés.

- La première de ces spécialisations est la Biostatistique, qui approfondit l'analyse et la modélisation des données du vivant.

- La seconde est le Management de l'information et de la décision (MIND), spécialisé dans l'analyse et la modélisation de la donnée économique ainsi que la gestion des décisions et risques associés.

  • L’ambition du parcours SSD-Biostat est de répondre aux attentes des étudiantes et étudiants du M1 SSD qui se sentent attiré·es par la modélisation des données du vivant ou de l’environnement. Les aspects statistiques abordés dans ce parcours vont de la modélisation du vivant jusqu’aux problématiques les plus théoriques de la statistique et de la modélisation stochastique. Les aspects numériques sont extrêmement présents dans ce parcours et requièrent un goût prononcé pour la programmation informatique.

Le parcours SSD-Biostat est une formation exigeante car elle met l’accent sur les concepts plutôt que sur les techniques. En effet, dans le domaine de la donnée au sens large, les technologies numériques, avec l’avènement de l’intelligence artificielle évoluent vite et se périment encore plus vite. Les futur·es ingénieur·es statisticien·nes ou chercheurs et chercheuses qui devront traiter des données pourront, tout au long de leur vie professionnelle se former à de nouvelles technologies, d’autant mieux s’ils ou elles ont eu une formation initiale conceptuelle solide. La plus-value de la formation est justement d’apporter la compréhension théorique des concepts statistiques sous-jacents aux algorithmes automatiques. Les diplômé·es doivent aussi être capable d’assurer une veille technologique de qualité.

Le parcours SSD-Biostat reste en partie mutualisé en deuxième année avec le parcours management de l'information et de la décision (SSD-MIND). Toutefois, des UE de spécialisation pour la science des données du vivant ou de l’environnement et davantage tournées vers l’initiation à la recherche sont spécifiques au parcours SSD-BIOSTAT (deux UE par semestre du M2).

  • L’ambition du parcours SSD-MIND est de répondre aux attentes des étudiantes et étudiants du M1 SSD qui se sentent attiré·es par l'application de la science des données en entreprise. Compte tenu de la très grande diversité des entreprises et de leurs problématiques, ce M2 forme à une science des données généraliste, "tous terrains". Par surcroît, il fournit une formation plus spécifique au contexte de l'entreprise et à ses problématiques économique et managériale (information économique, gestion des risques financiers, clientèle, stratégie d'entreprise etc).

Le parcours SSD - MIND est une formation de type ingénierie mathématique, qui met au premier plan la méthodologie et la parfaite maîtrise des concepts et modèles statistiques. La ou le diplômé·e de ce parcours pourra faire face à tout type de données et de problématique, et concevoir une méthodologie complète et souvent originale servant cette problématique, partant de la gestion et de l'organisation des données, poursuivant avec leur exploration et leur réduction ciblée, puis avec la modélisation des phénomènes d'intérêt, et enfin synthétisant l'information extraite à des fins de décision. Elle ou il devra également savoir transmettre à l'entreprise la connaissance synthétisée à partir de l'information extraite des données. Chaque nouvel ensemble de données et chaque question posée le concernant est souvent un nouveau problème, et l'application à ces données d'une méthode standard est alors inadaptée. Il s'agit au contraire d'écrire un modèle mathématique adapté à ces données (au sens où il en traduit la complexité de façon satisfaisante) et de le rendre assimilable à une méthode d'estimation standard, ou de concevoir et programmer une méthode plus spécifique. L'accent mis par cette formation sur la maîtrise conceptuelle et mathématique des outils garantit aux diplômés de ce parcours la très grande capacité d'adaptation et d'auto-formation nécessitée par la rapide évolution de la science des données.

Le parcours SSD-MIND reste en partie mutualisé en deuxième année avec le parcours biostatistique (SSD-Biostat), plus spécialisé en analyse et modélisation des données du vivant ou de l’environnement. Le parcours SSD-MIND est une double formation en partenariat avec l'IAE (qui assure les enseignements d'économie et de management), donnant lieu à un double diplôme.

Voir la page complète de ce parcours

  • Modèles linéaires généralisés

    5 crédits
  • Anglais

    2 crédits
  • Projet ou Soutenance alternance

    3 crédits
  • Management des risques

    10 crédits84h
  • Analyse multivariée

    5 crédits
  • Apprentissage statistique

    5 crédits
  • Analyse des durées de vie

    4 crédits
  • Stage

    14 crédits
  • Stratégie et gestion de projet

    4 crédits
  • Modèles à variables latentes

    4 crédits
  • Data mining et données manquantes

    4 crédits

Admission

Conditions d'accès

Le Master Maths - SSD est accessible après une Licence de Mathématiques (fondamentales ou appliquées).

Lire plus

Modalités d'inscription

Les candidatures se font sur les plateformes suivantes : 

Étudiants français & Européens :

Étudiants internationaux hors UE : suivre la procédure « Études en France » : https://pastel.diplomatie.gouv.fr/etudesenfrance/dyn/public/authentification/login.html

Lire plus

Et après

Poursuites d'études

Le Master Maths – SSD débouche aussi sur la poursuite en thèse dans le milieu académique ou professionnel pour former de futur·es enseignant·es chercheur·euse·s ou ingénieur·e·s de recherche.

Lire plus

Insertion professionnelle

Ingénieurs d’études statisticien·ne, data scientist, data-manager, chargé d’études marketing, manager de la relation client, responsable en gestion des risques, biostatisticien·ne, chercheur·euse dans des établissements publics de recherche, dans les équipes R&D en entreprise.

Lire plus