Statistique et Science des Données (SSD)

  • Composante

    Faculté des Sciences

Programme

Sélectionnez un programme

M1 - Statistique et Science des Données (SSD)

Alimentée par des moyens de recueil de plus en plus puissants, la donnée statistique (alias la data )  est en croissance exponentielle, et peu de domaines échappent à une mesure chaque jour plus  extensive. Mais si le recueil de la donnée est  une chose, son analyse  en est une autre. Celle-ci est rendue  difficile par deux phénomènes principaux : la taille des données et la complexité  des phénomènes mesurés. La statistique contemporaine s'attache  à résoudre  ces deux problèmes. Elle est ainsi conduite à évoluer très rapidement, en conservant le meilleur des outils passés qu'elle adapte aux données massives  et de grande dimension, et en proposant parallèlement des  voies de modélisation  de plus en plus fines  et  respectueuses  de la complexité des phénomènes. La statistique classique  a ainsi évolué vers une  "science des données"  plus  computationnelle, qui intègre  des techniques d'apprentissage et diagnostic automatiques  à mi-chemin  entre  statistique  et  intelligence artificielle.

Le parcours de Statistique et Sciences des Données est  une formation à toutes les méthodologies d'analyse  et  modélisation  statistique contemporaines. S'il  conduit au métier de " data  scientist ", il intègre autant les aspects de conception  méthodologique - grâce à la maîtrise des mathématiques sous-jacentes et de leur  programmation informatique - que l'application rigoureuse des méthodes et modèles  à des données de types  et domaines variés.

Ce parcours est  scindé en seconde année  en deux sous-parcours plus spécialisés, dont les enseignements restent partiellement mutualisés. La première  de ces spécialisations est la Biostatistique, qui approfondit  l'analyse et la  modélisation des  données du vivant. La seconde est  le management de l'information  et de la décision (MIND), spécialisé dans l'analyse et la modélisation de la donnée  économique ainsi que la gestion des décisions et risques associés.

 

What do you want to do ?New mailCopy

Voir la page complète de ce parcours

  • Optimisation

    5 crédits
  • Analyse des données multi-dimensionnelles

    5 crédits
  • Système d’information et bases de données

    4 crédits
  • Théories de l'information et de la décision

    2 crédits
  • Développement logiciel

    4 crédits
  • Statistique inférentielle

    5 crédits
  • Processus stochastiques

    5 crédits
  • Séries temporelles

    4 crédits
  • Estimation et tests non paramétriques

    4 crédits
  • Programmation R

    2 crédits
  • Projet

    5 crédits
  • Modèle linéaire

    5 crédits
  • CHOIX2

    2 crédits
    • Au choix: 1 parmi 1

      • Outils d'épidémiologie

        2 crédits
      • Micro-économie

        2 crédits
      • Bioinformatics Learning Lab

        2 crédits
      • Information biologique

        2 crédits
  • Contrôle stochastique

    2 crédits
  • CHOIX1

    4 crédits
    • Au choix: 1 parmi 1

      • Alignement et Phylogénie

        4 crédits
      • Economie générale

        4 crédits
  • Anglais

    2 crédits

M2 - Statistique et Science des Données (SSD) - BIOSTATS

Ce M2 s’adresse à des étudiantes et étudiants titulaires du M1 Statistique Science des Données (SSD) ou tout autre M1 de mathématiques ou équivalent avec une spécialisation forte en probabilités et statistique.

Ce M2 est scindé en deux sous-parcours plus spécialisés, dont les enseignements restent partiellement mutualisés.

- La première de ces spécialisations est la Biostatistique, qui approfondit l'analyse et la modélisation des données du vivant.

- La seconde est le Management de l'information et de la décision (MIND), spécialisé dans l'analyse et la modélisation de la donnée économique ainsi que la gestion des décisions et risques associés.

  • L’ambition du parcours SSD-Biostat est de répondre aux attentes des étudiantes et étudiants du M1 SSD qui se sentent attiré·es par la modélisation des données du vivant ou de l’environnement. Les aspects statistiques abordés dans ce parcours vont de la modélisation du vivant jusqu’aux problématiques les plus théoriques de la statistique et de la modélisation stochastique. Les aspects numériques sont extrêmement présents dans ce parcours et requièrent un goût prononcé pour la programmation informatique.

Le parcours SSD-Biostat est une formation exigeante car elle met l’accent sur les concepts plutôt que sur les techniques. En effet, dans le domaine de la donnée au sens large, les technologies numériques, avec l’avènement de l’intelligence artificielle évoluent vite et se périment encore plus vite. Les futur·es ingénieur·es statisticien·nes ou chercheurs et chercheuses qui devront traiter des données pourront, tout au long de leur vie professionnelle se former à de nouvelles technologies, d’autant mieux s’ils ou elles ont eu une formation initiale conceptuelle solide. La plus-value de la formation est justement d’apporter la compréhension théorique des concepts statistiques sous-jacents aux algorithmes automatiques. Les diplômé·es doivent aussi être capable d’assurer une veille technologique de qualité.

Le parcours SSD-Biostat reste en partie mutualisé en deuxième année avec le parcours management de l'information et de la décision (SSD-MIND). Toutefois, des UE de spécialisation pour la science des données du vivant ou de l’environnement et davantage tournées vers l’initiation à la recherche sont spécifiques au parcours SSD-BIOSTAT (deux UE par semestre du M2).

  • L’ambition du parcours SSD-MIND est de répondre aux attentes des étudiantes et étudiants du M1 SSD qui se sentent attiré·es par l'application de la science des données en entreprise. Compte tenu de la très grande diversité des entreprises et de leurs problématiques, ce M2 forme à une science des données généraliste, "tous terrains". Par surcroît, il fournit une formation plus spécifique au contexte de l'entreprise et à ses problématiques économique et managériale (information économique, gestion des risques financiers, clientèle, stratégie d'entreprise etc).

Le parcours SSD - MIND est une formation de type ingénierie mathématique, qui met au premier plan la méthodologie et la parfaite maîtrise des concepts et modèles statistiques. La ou le diplômé·e de ce parcours pourra faire face à tout type de données et de problématique, et concevoir une méthodologie complète et souvent originale servant cette problématique, partant de la gestion et de l'organisation des données, poursuivant avec leur exploration et leur réduction ciblée, puis avec la modélisation des phénomènes d'intérêt, et enfin synthétisant l'information extraite à des fins de décision. Elle ou il devra également savoir transmettre à l'entreprise la connaissance synthétisée à partir de l'information extraite des données. Chaque nouvel ensemble de données et chaque question posée le concernant est souvent un nouveau problème, et l'application à ces données d'une méthode standard est alors inadaptée. Il s'agit au contraire d'écrire un modèle mathématique adapté à ces données (au sens où il en traduit la complexité de façon satisfaisante) et de le rendre assimilable à une méthode d'estimation standard, ou de concevoir et programmer une méthode plus spécifique. L'accent mis par cette formation sur la maîtrise conceptuelle et mathématique des outils garantit aux diplômés de ce parcours la très grande capacité d'adaptation et d'auto-formation nécessitée par la rapide évolution de la science des données.

Le parcours SSD-MIND reste en partie mutualisé en deuxième année avec le parcours biostatistique (SSD-Biostat), plus spécialisé en analyse et modélisation des données du vivant ou de l’environnement. Le parcours SSD-MIND est une double formation en partenariat avec l'IAE (qui assure les enseignements d'économie et de management), donnant lieu à un double diplôme.

Voir la page complète de ce parcours

  • Analyse multivariée

    5 crédits
  • Projet ou Soutenance alternance

    3 crédits
  • Estimation non-paramétrique

    5 crédits
  • Statistique Bayésienne

    5 crédits
  • Anglais

    2 crédits
  • Apprentissage statistique

    5 crédits
  • Modèles linéaires généralisés

    5 crédits
  • Analyse des durées de vie

    4 crédits
  • Modèles à variables latentes

    4 crédits
  • Complément 1

    4 crédits
  • Complément 2

    4 crédits
  • Stage

    14 crédits

M2 - Statistique et Science des Données (SSD) - MIND

Ce M2 s’adresse à des étudiantes et étudiants titulaires du M1 Statistique Science des Données (SSD) ou tout autre M1 de mathématiques ou équivalent avec une spécialisation forte en probabilités et statistique.

Ce M2 est scindé en deux sous-parcours plus spécialisés, dont les enseignements restent partiellement mutualisés.

- La première de ces spécialisations est la Biostatistique, qui approfondit l'analyse et la modélisation des données du vivant.

- La seconde est le Management de l'information et de la décision (MIND), spécialisé dans l'analyse et la modélisation de la donnée économique ainsi que la gestion des décisions et risques associés.

  • L’ambition du parcours SSD-Biostat est de répondre aux attentes des étudiantes et étudiants du M1 SSD qui se sentent attiré·es par la modélisation des données du vivant ou de l’environnement. Les aspects statistiques abordés dans ce parcours vont de la modélisation du vivant jusqu’aux problématiques les plus théoriques de la statistique et de la modélisation stochastique. Les aspects numériques sont extrêmement présents dans ce parcours et requièrent un goût prononcé pour la programmation informatique.

Le parcours SSD-Biostat est une formation exigeante car elle met l’accent sur les concepts plutôt que sur les techniques. En effet, dans le domaine de la donnée au sens large, les technologies numériques, avec l’avènement de l’intelligence artificielle évoluent vite et se périment encore plus vite. Les futur·es ingénieur·es statisticien·nes ou chercheurs et chercheuses qui devront traiter des données pourront, tout au long de leur vie professionnelle se former à de nouvelles technologies, d’autant mieux s’ils ou elles ont eu une formation initiale conceptuelle solide. La plus-value de la formation est justement d’apporter la compréhension théorique des concepts statistiques sous-jacents aux algorithmes automatiques. Les diplômé·es doivent aussi être capable d’assurer une veille technologique de qualité.

Le parcours SSD-Biostat reste en partie mutualisé en deuxième année avec le parcours management de l'information et de la décision (SSD-MIND). Toutefois, des UE de spécialisation pour la science des données du vivant ou de l’environnement et davantage tournées vers l’initiation à la recherche sont spécifiques au parcours SSD-BIOSTAT (deux UE par semestre du M2).

  • L’ambition du parcours SSD-MIND est de répondre aux attentes des étudiantes et étudiants du M1 SSD qui se sentent attiré·es par l'application de la science des données en entreprise. Compte tenu de la très grande diversité des entreprises et de leurs problématiques, ce M2 forme à une science des données généraliste, "tous terrains". Par surcroît, il fournit une formation plus spécifique au contexte de l'entreprise et à ses problématiques économique et managériale (information économique, gestion des risques financiers, clientèle, stratégie d'entreprise etc).

Le parcours SSD - MIND est une formation de type ingénierie mathématique, qui met au premier plan la méthodologie et la parfaite maîtrise des concepts et modèles statistiques. La ou le diplômé·e de ce parcours pourra faire face à tout type de données et de problématique, et concevoir une méthodologie complète et souvent originale servant cette problématique, partant de la gestion et de l'organisation des données, poursuivant avec leur exploration et leur réduction ciblée, puis avec la modélisation des phénomènes d'intérêt, et enfin synthétisant l'information extraite à des fins de décision. Elle ou il devra également savoir transmettre à l'entreprise la connaissance synthétisée à partir de l'information extraite des données. Chaque nouvel ensemble de données et chaque question posée le concernant est souvent un nouveau problème, et l'application à ces données d'une méthode standard est alors inadaptée. Il s'agit au contraire d'écrire un modèle mathématique adapté à ces données (au sens où il en traduit la complexité de façon satisfaisante) et de le rendre assimilable à une méthode d'estimation standard, ou de concevoir et programmer une méthode plus spécifique. L'accent mis par cette formation sur la maîtrise conceptuelle et mathématique des outils garantit aux diplômés de ce parcours la très grande capacité d'adaptation et d'auto-formation nécessitée par la rapide évolution de la science des données.

Le parcours SSD-MIND reste en partie mutualisé en deuxième année avec le parcours biostatistique (SSD-Biostat), plus spécialisé en analyse et modélisation des données du vivant ou de l’environnement. Le parcours SSD-MIND est une double formation en partenariat avec l'IAE (qui assure les enseignements d'économie et de management), donnant lieu à un double diplôme.

Voir la page complète de ce parcours

  • Management des risques

    10 crédits
  • Analyse multivariée

    5 crédits
  • Projet ou Soutenance alternance

    3 crédits
  • Anglais

    2 crédits
  • Apprentissage statistique

    5 crédits
  • Modèles linéaires généralisés

    5 crédits
  • Analyse des durées de vie

    4 crédits
  • Modèles à variables latentes

    4 crédits
  • Stratégie et gestion de projet

    4 crédits
  • Data Mining et données manquantes

    4 crédits
  • Stage

    14 crédits