Dernière mise à jour : 28/02/2025
Métiers ayant des bases en biologie : Biologistes, biostatisticiens, chargés de projets de tous secteurs.
Il est recommandé d'avoir des connaissances en bash et R.
1. RAPPEL DES CONCEPTS SUR LA BIOLOGIE DU NGS
Les différents types de séquençage (1ère, 2ème et 3ème génération, paired ou single-end)
Profondeur de séquençage vs. nombre d'échantillons pour la reproductibilité de l'analyse
Les différentes molécules séquencées et leur intérêt
2. DU FASTQ À LA MATRICE D'EXPRESSION
Choix du génome de référence
Contrôles qualité des sorties de séquençage
Alignement et étapes indispensables post-alignement
Contrôles qualité post-alignement
Comptage des lectures et transformations
3. L'ANALYSE D'EXPRESSION DIFFÉRENTIELLE
Prétraitement des données
Visualisation des données (ACP, PLS-DA, heatmap)
Modélisation statistique et définition de la signature de gènes différentiellement exprimés
4. L'ANALYSE FONCTIONNELLE DES RÉSULTATS
Qu'est-ce qu'une signature d'expression ?
Les bases de données de référence
Méthodes et données d'entrée
Fisher exact test
Gene set enrichment analysis
Single Sample Signature score
• Partage et discussion autour d'exemples d'application
• Alternance d'exposés, de discussions avec le formateur et entre participants.
• Exemples de manipulation sur des cas types
• Utilisation de méthodes et pipelines publics (langages R et bash)
• Remise des supports pédagogiques
• Vidéo projection du support PowerPoint.