Analyse de données RNA-SEQ
Dernière mise à jour : 16/07/2025
Description
Domaine : COSMETIQUES SANTE, BIOTECH, AGROALIMENTAIRE, ENVIRONNEMENT
Objectifs de la formation
- Savoir analyser des données de RNA-seq
- Savoir déterminer les ARN messagers différentiellement exprimés
- Savoir contextualiser les résultats d'expression
Public visé
Métiers ayant des bases en biologie : Biologistes, biostatisticiens, chargés de projets de tous secteurs.
Il est recommandé d'avoir des connaissances en bash et R.
Prérequis
Programme
1. RAPPEL DES CONCEPTS SUR LA BIOLOGIE DU NGS
Les différents types de séquençage (1ère, 2ème et 3ème génération, paired ou single-end)
Profondeur de séquençage vs. nombre d'échantillons pour la reproductibilité de l'analyse
Les différentes molécules séquencées et leur intérêt
2. DU FASTQ À LA MATRICE D'EXPRESSION
Choix du génome de référence
Contrôles qualité des sorties de séquençage
Alignement et étapes indispensables post-alignement
Contrôles qualité post-alignement
Comptage des lectures et transformations
3. L'ANALYSE D'EXPRESSION DIFFÉRENTIELLE
Prétraitement des données
Visualisation des données (ACP, PLS-DA, heatmap)
Modélisation statistique et définition de la signature de gènes différentiellement exprimés
4. L'ANALYSE FONCTIONNELLE DES RÉSULTATS
Qu'est-ce qu'une signature d'expression ?
Les bases de données de référence
Méthodes et données d'entrée
Fisher exact test
Gene set enrichment analysis
Single Sample Signature score
Modalités pédagogiques
• Partage et discussion autour d'exemples d'application
• Alternance d'exposés, de discussions avec le formateur et entre participants.
• Exemples de manipulation sur des cas types
• Utilisation de méthodes et pipelines publics (langages R et bash)
• Remise des supports pédagogiques
• Vidéo projection du support PowerPoint.
Modalités d'évaluation et de suivi
- Evaluation de début et fin de formation.
- Evaluation de la satisfaction en fin de formation.