Les ingénieurs biomédicaux de l’Université Duke ont mis au issue un algorithme pour supprimer les informations génétiques microbiennes contaminées de l’Atlas du génome du cancer (TCGA). Avec une image in addition claire du microbiote vivant dans divers organes, à la fois sains et cancéreux, les chercheurs seront désormais en mesure de trouver de nouveaux biomarqueurs de maladies et de mieux comprendre comment de nombreux cancers affectent le corps humain.



Dans la première étude utilisant l’ensemble de données nouvellement décontaminé, les chercheurs ont déjà découvert que les tissus d’organes normaux et cancéreux ont une composition microbiologique légèrement différente, que les bactéries de ces web pages malades peuvent pénétrer dans la circulation sanguine et que ces informations bactériennes pourraient aider à diagnostiquer le most cancers et à prédire Résultats individual.

Les résultats paraissent en ligne le 30 décembre dans la revue Cell Host & Microbe.



Le TCGA est un programme historique de génomique du cancer qui a caractérisé au niveau moléculaire in addition de 20 000 cancers primaires et mis en correspondance des échantillons sains couvrant 33 types de most cancers. Il a produit furthermore de 2,5 hundreds of thousands de gigaoctets de données « omiques ». L’atlas comprend quel ADN est présent, quels marqueurs épigénétiques sont sur l’ADN, quel ADN est activé et quelles protéines sont produites. Il est disponible gratuitement pour un use community.

Une étude à partir des données de l’atlas a révélé une abondance de Fusobacterium nucleatum dans le cancer colorectal, ce qui s’est avéré depuis être indicatif du stade, de la survie, des métastases et même des réactions médicamenteuses de ce sort de cancer. De nombreuses autres études ont recherché de tels biomarqueurs bactériens, mais peu ont été découverts. Une des principales raisons à cela est la contamination. Lorsque des bactéries sont introduites accidentellement dans les échantillons par les laboratoires, il devient difficile de discerner quelles espèces se trouvaient réellement dans les échantillons au départ. Alors que des études similaires sur le microbiome utilisant des matériaux riches en microbes tels que les matières fécales peuvent surmonter de petites quantités de contamination, les échantillons relativement minuscules prélevés sur des organes humains vivants et des échantillons de tumeurs ne le peuvent pas.

Lors de l’examen d’un sous-ensemble de données de séquençage du TCGA, des analyses précédentes ont révélé que l’ADN microbien d’un specified nombre d’espèces était le résultat d’une contamination en laboratoire.

« Toutes les études sur le microbiote sont en proie à l’idée que si vous trouvez un microbe, était-ce vraiment dans le tissu ou était-ce une contamination introduite pendant le traitement ? » a déclaré Xiling Shen, professeur agrégé de la famille Hawkins en génie biomédical à Duke. « Nous avons inventé une méthode qui peut extraire les microbes qui se trouvaient vraiment dans chaque échantillon et l’avons utilisée pour construire ce que nous avons appelé l’Atlas du microbiome du most cancers, qui sera une ressource formidable pour la communauté et nous permettra de comprendre remark le cancer alter. le microbiome d’un organe.  »

La méthode pour éliminer la contamination des données TCGA a été inventée par Anders Dohlman, un étudiant diplômé du laboratoire de Shen. Dohlman a d’abord comparé les signatures du microbiome entre les tissus cancéreux de différents organes et le sang, et a exclu les espèces contaminantes qui se manifestaient sans discernement. Il a ensuite comparé les signatures microbiologiques d’échantillons identiques qui ont été traités sur des web sites distincts, allant de Harvard à Baylor. Dohlman a conclu que les espèces microbiennes qui ne peuvent être détectées qu’à partir d’un site spécifique seraient les contaminants, ce qui lui permettrait d’attribuer une signature de contamination exceptional à chaque web page.

« Un grand défi dans ce processus était les espèces à preuves mixtes, qui sont des bactéries qui sont à la fois un contaminant et endogène au tissu », a déclaré Dohlman. « Mais parce que TCGA a tellement de styles de données différents, nous avons pu le découvrir. Le Significant Knowledge aide vraiment !  »

L’effort porte déjà ses fruits de diverses manières. Après avoir utilisé l’algorithme de décontamination de Dohlman, les chercheurs ont examiné de près les signatures microbiologiques d’échantillons prélevés sur des patients atteints d’un most cancers colorectal. Ils ont découvert deux groupes uniques de bactéries fréquemment trouvés ensemble, dont l’un semble être associé à la survie des clients.

Les chercheurs ont également découvert que certains cancers altèrent en effet le microbiome de leurs organes résidents. Il se peut, explique Shen, que les tumeurs modifient le micro-environnement d’un organe, le rendant plus ou moins hospitalier pour différentes espèces microbiennes. Et en recherchant des signatures microbiennes dans les échantillons de sang de sufferers, ils ont également constaté que, malgré la sagesse conventionnelle à l’effet contraire, certaines bactéries trouvent leur chemin dans la circulation sanguine, ce qui pourrait également fournir une indication de la development d’un cancer.

« Il y a eu une sorte de crise sur le terrain pour savoir si des content de grande envergure peuvent être reproduits ou non, en raison du défi de la contamination », a déclaré Shen. « Par exemple, alors qu’un centre serait en mesure de reproduire ses résultats, un autre ne le ferait pas. Ceci explique pourquoi: Chaque centre a son propre biais très cohérent. (Ses propres contaminants microbes résidents.) À l’avenir, de nouvelles études pourront utiliser notre méthode pour éliminer ce biais et reproduire les résultats, et les centres de recherche pourraient être en mesure d’utiliser leur biais que nous avons identifié pour atténuer leur contamination.  »

Cette recherche a été financée par les Nationwide Institutes of Wellness (R35GM122465, DK119795) et la Defense State-of-the-art Exploration Tasks Agency (W911NF1920111).