L’analyse de l’expression génique d’une personne nécessite de cartographier son paysage d’ARN à une référence common pour mieux comprendre dans quelle mesure les gènes sont “activés” et remplissent des fonctions dans le corps. un problème connu sous le nom de biais de référence.
Dans un nouvel short article publié dans la revue Nature Strategies, des chercheurs de l’UC Santa Cruz présentent la toute première méthode d’analyse des données de séquençage de l’ARN à l’échelle du génome à l’aide d’un «pantranscriptome», qui combine un transcriptome et un pangénome – une référence qui contient génétique matériel d’une cohorte d’individus divers, plutôt qu’un seul brin linéaire. Un groupe de scientifiques dirigé par le professeur agrégé de génie biomoléculaire de l’UCSC, Benedict Paten.
“Il s’agit de pangénome plus transcriptome – cette combinaison n’a jamais vraiment été réalisée auparavant”, a déclaré Jordan Eizenga, co-leading auteur de l’article et chercheur postdoctoral au laboratoire de génomique computationnelle de l’UCSC.”
Cet outil aidera les chercheurs du monde entier qui s’efforcent de comprendre l’expression des gènes grâce à l’analyse du séquençage de l’ARN. Les outils sont accessibles au public et accessibles by way of Github.
“Avec cette boîte à outils, nous utilisons ces données as well as diversifiées que nous pouvons désormais obtenir du pangénome pour améliorer la mesure des données d’expression génique, ce qui peut varier considérablement d’un individu à l’autre”, a déclaré Paten. “L’objectif est de faire sentir l’impact de ces données additionally diverses sur les études qui examinent l’expression des gènes, ce qui se traduira par une meilleure analyse des modèles cellulaires, des modèles organoïdes et d’autres purposes de recherche.”
La fonction la additionally communément reconnue de l’ARN est de traduire l’ADN en protéines, mais les scientifiques comprennent maintenant que la grande majorité de l’ARN est non codante et ne fabrique pas de protéines, mais peut plutôt jouer des rôles tels que l’influence de la framework cellulaire ou la régulation des gènes. L’ensemble du paysage de l’ARN est connu collectivement sous le nom de transcriptome.
Généralement, lors de l’évaluation des données génomiques d’un individu pour la variation, les scientifiques comparent le génome de l’individu à celui d’une référence composée d’un seul brin linéaire de bases d’ADN. L’utilisation d’un pangénome permet aux chercheurs de comparer simultanément le génome d’un individu à celui d’une cohorte génétiquement diversifiée de séquences de référence. Cela donne aux scientifiques moreover de points de comparaison pour mieux comprendre la variation génomique d’un individu.
ce qui signifie qu’un ensemble de données d’ARN peut provenir de zones non connectées du génome. Ces web sites d’épissage ne sont pas uniformes dans la inhabitants humaine, mais varient d’un individu à l’autre.
Mais avec le nouveau pipeline d’outils open up resource, les chercheurs peuvent prendre les segments épissés de l’ARN d’un individu.
Tout d’abord, le pipeline identifie les zones du génome d’où proviennent les données de séquençage de l’ARN, y compris les web-sites d’épissage, et marque ces details sur la référence du pangénome.
Enfin.
a déclaré Jonas Sibbesen, co-leading auteur de l’étude et ancien chercheur postdoctoral au laboratoire de génomique computationnelle de l’UCSC. qui est maintenant professeur adjoint à l’Université de Copenhague.”
À l’avenir. Pour l’instant, le groupe espère que sa nouvelle boîte à outils servira à montrer à quel level l’analyse dérivée de la pangénomique peut être utile.
“Nous devons être en mesure d’expliquer à certains chercheurs remark une référence de pangénome leur sera bénéfique”, a déclaré Paten. “Ce pipeline est vraiment une première tentative pour faire cela pour l’ARN, pour les données fonctionnelles, pour les données d’expression.”