Un pas vers une médecine de précision basée sur l’IA

L’intelligence artificielle, l’IA, qui trouve des modèles dans des données biologiques complexes, pourrait à terme contribuer au développement de soins de santé personnalisés. Des chercheurs de l’Université de Linköping, en Suède, ont développé une méthode basée sur l’IA relevant à divers problèmes médicaux et biologiques. Leurs modèles peuvent par exemple estimer avec précision l’âge chronologique des personnes et déterminer si elles ont fumé ou non. De nombreux facteurs peuvent influencer lesquels de nos gènes sont utilisés à un minute donné. Le tabagisme, les habitudes alimentaires et la pollution de l’environnement font partie de ces facteurs. Cette régulation de l’activité des gènes peut être assimilée à un interrupteur d’alimentation déterminant quels gènes sont activés ou désactivés, sans altérer les gènes eux-mêmes, et est appelée épigénétique. Des chercheurs de l’Université de Linköping ont utilisé des données contenant des informations épigénétiques provenant de in addition de 75 000 échantillons humains pour former un grand nombre de modèles de réseaux neuronaux d’IA. Ils espèrent que de tels modèles basés sur l’IA pourront éventuellement être utilisés en médecine de précision pour développer des traitements et des stratégies préventives adaptés à l’individu. Leurs modèles sont du style vehicle-encodeur, qui car-organise les informations et trouve des modèles d’interrelation dans la grande quantité de données. Pour tester leur modèle, les chercheurs de LiU l’ont comparé aux modèles existants. Il existe déjà des modèles des effets du tabagisme sur l’organisme, basés sur le fait que des changements épigénétiques spécifiques reflètent l’effet du tabagisme sur le fonctionnement des poumons. Ces traces restent dans l’ADN longtemps après qu’une personne a arrêté de fumer, et ce type de modèle peut identifier si une personne est un fumeur actuel, ancien ou jamais fumeur. D’autres modèles peuvent, à partir de marqueurs épigénétiques, estimer l’âge chronologique d’un individu, ou regrouper des individus selon qu’ils sont atteints d’une maladie ou en bonne santé. Les chercheurs de LiU ont formé leur auto-encodeur et ont ensuite utilisé le résultat pour répondre à trois requêtes différentes : détermination de l’âge, statut de fumeur et diagnostic de la maladie du lupus érythémateux systémique, LED. Bien que les modèles existants s’appuient sur des marqueurs épigénétiques sélectionnés connus pour être associés à la maladie qu’ils visent à classer. Cependant, il s’est avéré que les auto-encodeurs des chercheurs de LiU fonctionnaient mieux, voire aussi bien. « Nos modèles nous permettent non seulement de classer les individus en fonction de leurs données épigénétiques. Nous avons constaté que nos modèles peuvent identifier des marqueurs épigénétiques déjà connus utilisés dans d’autres modèles, mais également de nouveaux marqueurs associés à la maladie que nous examinons. Un exemple de ceci est que notre modèle de tabagisme identifie des marqueurs associés aux maladies respiratoires, telles que le cancer du poumon, et aux dommages à l’ADN », explique David Martínez, doctorant à l’université de Linköping. L’objectif des modèles d’auto-encodeur est de permettre la compression de données biologiques extrêmement complexes en une représentation des caractéristiques et des modèles les plus pertinents des données. « Nous n’avons pas piloté le modèle et n’avions aucune hypothèse basée sur les connaissances biologiques existantes, mais avons laissé les données parler d’elles-mêmes. En examinant par la suite ce qui se passait dans l’auto-encodeur, nous avons constaté que les données s’auto-organisaient d’une manière similaire à la façon dont cela fonctionne dans le corps », explique Mika Gustafsson, professeur de bioinformatique translationnelle à l’université de Linköping, qui a dirigé l’étude publiée dans Briefings in Bioinformatics. Dans l’étape suivante, les chercheurs pourront utiliser les caractéristiques les plus importantes trouvées par l’auto-encodeur pour créer des modèles capables de classer un grand nombre de facteurs liés à l’environnement et spécifiques à l’individu pour lesquels il n’y a pas suffisamment de données d’entraînement pour entraîner des modèles d’IA in addition complexes sur. Certains styles d’IA sont parfois assimilés à une boîte noire qui fournit des réponses, mais les humains ne peuvent pas voir remark l’IA est parvenue à la réponse. Mika Gustafsson et ses collègues s’efforcent cependant de créer des modèles d’IA interprétables qui, pour ainsi dire, permettent aux chercheurs de jeter un coup d’œil sous le couvercle de la « boîte noire » pour comprendre ce qui s’y passe. « Nous voulons être capables de comprendre ce que le modèle nous montre sur la biologie derrière la maladie et d’autres circumstances. Ensuite, nous verrons non seulement si une personne est malade ou non, mais, en interprétant les données, nous aurons également la possibilité de découvrez pourquoi », déclare Mika Gustafsson. Cette recherche a été financée, entre autres, par le Conseil suédois de la recherche, le Wallenberg AI, Autonomous Units and Computer software Program (WASP) et le SciLifeLab & Wallenberg Nationwide Method for Data-Driven Daily life Science (DDLS).

Un pas vers une médecine de précision basée sur l’IA