ECTS
2 crédits
Composante
Faculté des Sciences
Description
- Premièrement donner aux étudiants un socle de connaissance et de compétences informatiques et ainsi leur fournir des bases solides pour apprendre et utiliser les outils bioinformatiques utilisées plus spécifiquement en évolution et écologie.
- Deuxièmement les sensibiliser à la nécessité de produire des résultats reproductibles et leur présenter les concepts et outils clés pour cela.
- Troisièmement faire travailler les étudiants sur des exemples concrets remobilisables lors de leur stage de master et de leur future vie professionnelle.
Objectifs
"Savoirs :
- Commandes clés de linux/bash en bioinfo (ls, cp, mv, grep, cut, sort, uniq, sed, …) ;
- Notions clés de programmation impératives (variables, boucles, fonctions, structures de données basiques) ;
- Notions de flux de données (pipes en bash et R ggplot2) ;
- Notions clés liés aux clusters de calculs (organisation d'un cluster, utilisation d'un cluster) ;
- Bonnes pratiques en bioinformatique (commentaires, indentation, nommage des variables/fonctions, données FAIR, utilisation basique de git et de md, ""test first approach"") ;
- Notions clés pour tester et valider des programmes et des modèles (""training/validation/ test sets"", mesurer l'apport d'un modèle/programme par rapport à l'existant) ;
- Limites inhérentes aux outils bioinfo (fonction objectif, heuristique).
Savoir-Faire :
- Cluster de calculs : manipuler et chercher du contenu dans de nombreux fichiers/dossiers (bash/R) ;
- Cluster de calculs : se connecter à un cluster, transférer des données de/vers le cluster, lancer des ""jobs"" ;
- Programmation : lancer des tâches répétitives (boucle for en bash), définir une fonction et l'appeler sur plusieurs jeux de données (R, bash) ;
- Programmation : enchaîner des commandes (bash/R-ggplot2) ;
- Reproductibilité : savoir créer un dépôt git et l'utiliser pour gérer plusieurs version d'un script R/bash ;
- Reproductibilité : utiliser markdown pour documenter les scripts."
Contrôle des connaissances
Contrôle continu intégral : 100%
Informations complémentaires
Volumes horaires :
CM : 0 h
TD : 9 h
TP : 0 h
Terrain : 0 h
**********
SPS : 0 h
Séminaires : 0 h
Hors UM : 6 h