par Sébastien Renaut
Le séquençage de nouvelle génération a promis des séquences d’ADN bon marché aux masses. Bien que cela soit vrai, le goulot d’étranglement s’est déplacé de la production de données à leur analyse. Ici, j’utiliserai les données de séquençage du transcriptome (RNAseq) pour quantifier l’expression des gènes. Je présenterai les formats de données couramment utilisés en génomique (par exemple : .fastq, .bam, .sam) et j’utiliserai le langage de programmation R pour identifier les gènes exprimés de manière différentielle (par exemple, les paquets DESeq2, edgeR), regrouper les échantillons en fonction de l’expression des gènes, détecter les catégories de l’ontologie des gènes qui sont sur/sous représentées (goseq) et présenter divers graphiques pour illustrer les résultats.