Les equipment d’apprentissage de l’intelligence artificielle (IA) peuvent être formées pour résoudre elles-mêmes les problèmes et les énigmes au lieu d’utiliser les règles que nous avons créées pour elles. Mais souvent, les chercheurs ne savent pas quelles règles les devices se font elles-mêmes. Le professeur adjoint Peter Koo du Cold Spring Harbor Laboratory (CSHL) a développé une nouvelle méthode qui interroge un programme d’apprentissage automatique pour déterminer quelles règles il a appris par lui-même et si elles sont les bonnes.



Les informaticiens « forment » une equipment IA à faire des prédictions en lui présentant un ensemble de données. La machine extrait une série de règles et d’opérations – un modèle – en fonction des informations qu’elle a rencontrées lors de sa development. Koo dit :

« Si vous apprenez des règles générales sur les mathématiques au lieu de mémoriser les équations, vous savez comment résoudre ces équations. Donc, plutôt que de simplement mémoriser ces équations, nous espérons que ces modèles apprennent à le résoudre et maintenant nous pouvons lui donner n’importe quelle équation et cela le résoudra.  »



Koo a développé un form d’IA appelé réseau neuronal profond (DNN) pour rechercher des modèles dans les brins d’ARN qui augmentent la capacité d’une protéine à se lier à eux. Koo a formé son DNN, appelé Residual Bind (RB), avec des milliers de séquences d’ARN correspondant aux scores de liaison aux protéines, et RB est devenu bon pour prédire les scores pour les nouvelles séquences d’ARN. Mais Koo ne savait pas si la machine se concentrait sur une courte séquence de lettres d’ARN – un motif – auquel les humains pourraient s’attendre, ou sur une autre caractéristique secondaire des brins d’ARN qu’ils pourraient ne pas avoir.

Koo et son équipe ont développé une nouvelle méthode, appelée World wide Importance Examination, pour tester les règles que RB a générées pour faire ses prédictions. Il a présenté au réseau formé un ensemble soigneusement conçu de séquences d’ARN synthétique contenant différentes combinaisons de motifs et de caractéristiques qui, selon les scientifiques, pourraient influencer les évaluations de RB.

Ils ont découvert que le réseau considérait plus que simplement l’orthographe d’un court motif. Il a pris en compte la façon dont le brin d’ARN pourrait se replier et se lier à lui-même, à quel stage un motif est proche d’un autre et d’autres caractéristiques.

Mais plutôt que de tester toutes les prédictions de ce laboratoire, la nouvelle méthode de Koo agit comme un laboratoire virtuel. Les chercheurs peuvent concevoir et tester des tens of millions de variables différentes par ordinateur, bien in addition que ce que les humains pourraient tester dans un laboratoire réel. Vous pouvez trouver une séquence, vous pouvez trouver un modèle mais vous ne savez pas » Ce modèle est-il vraiment critical ?  » Vous devez faire ces expériences interventionnelles. Dans ce cas, toutes mes expériences sont toutes faites en demandant simplement au réseau neuronal. «