in

Les scientifiques utilisent les mathématiques pour augmenter la précision des résultats d'analyse de données pour la recherche biomédicale

Kyoto-Depuis que les scientifiques ont cartographié pour la première fois le génome humain complet, l’attention s’est maintenant tournée vers la dilemma de savoir comment les cellules utilisent cette copie maîtresse des directions génétiques. On sait que lorsque les gènes sont activés, des get-togethers des séquences d’ADN dans le noyau cellulaire sont copiées dans des molécules en forme de chaîne plus courtes, l’ARN, qui délivrent les molécules essentielles à la survie et aux fonctions spécifiques aux cellules.

Comprendre les profils des ARN dans une cellule peut montrer quels gènes sont actifs et permettre aux chercheurs de spéculer sur ce que fait la cellule. La technologie de mesure de l’ARN par séquenceur d’ADN massivement parallèle, le RNA-sequencing, est devenue une technique typical au cours de la dernière décennie. In addition récemment. accélérant les progrès des sciences biomédicales. Mais la quantification des ARN à partir d’un si petit matériau pose de grands défis tactics. Même avec un équipement de pointe, les données produites à partir des données de séquençage d’ARN unicellulaire contiennent d’importantes erreurs de détection. De plus. de sorte que toute facts utile est perdue parmi le bruit du sign.

Maintenant, une équipe de l’Institut universitaire de Kyoto pour l’étude avancée de la biologie humaine (WPI-ASHBi) a développé une nouvelle méthode mathématique qui peut éliminer le bruit et ainsi permettre l’extraction de signaux clairs à partir de données de séquençage d’ARN unicellulaire. La nouvelle méthode réduit avec succès le bruit d’échantillonnage aléatoire dans les données pour permettre une compréhension précise et complète de l’activité d’une cellule. La recherche a récemment été publiée dans la revue Existence Science Alliance.

L’auteur principal de l’article, Yusuke Imoto de l’ASHBi, explique : « Chaque gène représente une dimension différente dans les données de séquençage de l’ARN, ce qui signifie que des dizaines de milliers de proportions doivent être collectées sur plusieurs cellules et analysées. Même le moindre bruit dans une dimension peut avoir un impact majeur sur les analyses de données en aval, de sorte que des signaux potentiellement importants sont perdus.

Pour briser la malédiction de la dimensionnalité, l’équipe de Kyoto a développé une nouvelle méthode de réduction du bruit, RECODE – qui signifie “résolution de la malédiction de la dimensionnalité” – pour supprimer le bruit d’échantillonnage aléatoire des données de séquençage d’ARN unicellulaire. même pour les gènes exprimés à des niveaux très bas.

Tout d’abord, l’équipe a testé sa méthode sur les données d’une inhabitants cellulaire largement bien étudiée, le sang périphérique humain. Ils ont confirmé que RECODE supprime avec succès la malédiction de la dimensionnalité pour révéler des modèles d’expression pour des gènes individuels proches de leurs valeurs attendues.

Ensuite, comparé à d’autres méthodes d’analyse de pointe, RECODE a surpassé la concurrence en donnant des représentations beaucoup moreover fidèles de l’activation des gènes. De furthermore, RECODE est additionally straightforward à utiliser que les autres méthodes.

Enfin, l’équipe a testé RECODE sur un ensemble de données complexe provenant de cellules d’embryons de souris contenant de nombreux styles de cellules différents avec des modèles d’expression génique uniques. Alors que d’autres méthodes ont brouillé les résultats, RECODE a clairement résolu les niveaux d’expression génique, même pour les types de cellules rares.

Imoto conclut :. Avec notre contribution, le séquençage d’ARN unicellulaire l’analyse des données pourrait devenir un outil de recherche puissant avec des implications massives dans de nombreux domaines biologiques.” Un autre auteur de premier prepare, Tomonori Nakamura, biologiste de l’ASHBi et du Hakubi Centre for Sophisticated Analyze de l’Université de Kyoto, ajoute : « En libérant le véritable pouvoir du séquençage d’ARN unicellulaire, RECODE permettra aux chercheurs de découvrir des kinds de cellules rares non identifiés, conduisant à la le développement et l’établissement du nouveau domaine de recherche en sciences fondamentales ainsi que la recherche sur les purposes cliniques et la découverte de médicaments. »

Les programmes de calcul RECODE (code Python/R, software de bureau) sont disponibles sur GitHub (https://github.com/yusuke-imoto-lab/RECODE).