Nouvelles et évènements
Retour aux nouvelles et événements

Plateforme bio-informatique C3G de l’Institut du cancer Rosalind et Morris Goodman

par Alain Pacis

Le séquençage de nouvelle génération et les autres technologies à haut rendement qui révolutionnent la recherche dans le domaine des sciences de la vie et des soins de santé font en sorte que le traitement et l’interprétation des données, plutôt que leur production, sont désormais le principal facteur limitant la découverte et l’innovation. Les grands centres de génomique, et les laboratoires de recherche de plus en plus petits, sont confrontés à d’importants problèmes d’analyse des données. Le Centre canadien de génomique computationnelle (C3G) offre des services d’analyse bio-informatique et de calcul de haute performance à la communauté des chercheurs en sciences de la vie. 

Depuis 2018, le C3G travaille en partenariat avec l’Institut du cancer Rosalind et Morris Goodman (ICG) pour mettre en place et exploiter une plateforme bio-informatique à l’ICG. Les analyses moléculaires à haut rendement offrent un aperçu sans précédent de la biologie et de la pathogenèse du cancer, pouvant avoir une incidence sur le diagnostic et le choix du traitement. La plateforme soutient de nombreux chercheurs de l’ICG dans l’analyse, la visualisation et l’interprétation d’un large éventail de données « omiques » (notamment les données génomiques, transcriptomiques, épigénomiques, protéomiques et métabolomiques).

Notre pipeline de séquençage du génome entier (WGS) comprend les différentes étapes de traitement des données, des lectures de données brutes de séquençage (fichiers FASTQ) jusqu’aux fichiers de rapport sur les variantes. Nous utilisons une combinaison d’appelants de variantes pour identifier les variantes mononucléotidiques (SNV), les insertions/délétions (INDEL) et les variantes structurelles (SV) de haute confiance à partir de paires tumeur-normal appariées. La liste des variantes est annotée avec différents types d’informations comme les gènes ou les transcrits affectés, la localisation génomique, les conséquences ou les effets, et les variantes connues provenant de bases de données cliniques (notamment ClinVar et CIViC). Notre pipeline rend également compte des variations du nombre de copies (VNC), de la ploïdie, de l’(in)stabilité microsatellitaire, de la charge mutationnelle tumorale et d’autres signatures mutationnelles. Nous continuons à moderniser et à améliorer notre méthode d’analyse de WGS en intégrant et en testant de nouveaux ensembles de données et outils de référence afin d’augmenter le rendement et la précision de la procédure de WGS. 

Le séquençage de l’ARN (RNA-seq) en masse est l’une des techniques les plus couramment utilisées dans la recherche sur le cancer. Notre pipeline d’analyse RNA-seq vise à identifier les gènes ou isoformes différentiellement exprimés (signatures), ainsi qu’à détecter les fusions de gènes. Le séquençage de l’ARN unicellulaire (scRNA-Seq) est un outil puissant pour disséquer l’hétérogénéité transcriptomique intratumorale (cachée dans l’analyse en masse). Notre pipeline d’analyse scRNA-seq vise à distinguer les cellules néoplasiques des cellules non néoplasiques, à identifier les sous-populations et les états transcriptionnels distincts qui peuvent être à l’origine de la tumorigenèse, et à réaliser une inférence de trajectoire pour découvrir les changements dynamiques de l’expression génétique.

Pour de plus amples informations sur le Centre canadien de génomique computationnelle, visitez le site https://www.computationalgenomics.ca