Un nouvel outil d’intelligence artificielle peut prédire les fonctions des enzymes en fonction de leurs séquences d’acides aminés, même lorsque les enzymes n’ont pas été étudiées ou sont mal contains. Les chercheurs ont déclaré que l’outil d’IA, baptisé Clean up, surpasse les principaux outils de pointe en termes de précision, de fiabilité et de sensibilité. Une meilleure compréhension des enzymes et de leurs fonctions serait une aubaine pour la recherche en génomique, en chimie, en matériaux industriels, en médecine, en pharmacie, and many others.
“Tout comme ChatGPT utilise les données du langage écrit pour créer un texte prédictif, nous exploitons le langage des protéines pour prédire leur activité”, a déclaré le responsable de l’étude Huimin Zhao, professeur de génie chimique et biomoléculaire à l’Université de l’Illinois à Urbana-Champaign. “Presque tous les chercheurs, lorsqu’ils travaillent avec une nouvelle séquence protéique, veulent savoir immédiatement ce que fait la protéine. De plus, lors de la fabrication de produits chimiques pour n’importe quelle software – biologie, médecine, industrie – cet outil aidera les chercheurs à identifier rapidement le bon enzymes nécessaires à la synthèse des produits chimiques et des matériaux.”
Les chercheurs publieront leurs découvertes dans la revue Science et rendront Thoroughly clean accessible en ligne le 31 mars.
Avec les progrès de la génomique, de nombreuses enzymes ont été identifiées et séquencées, mais les scientifiques ont peu ou pas d’informations sur ce que font ces enzymes, a déclaré Zhao, membre de l’Institut Carl R. Woese de biologie génomique de l’Illinois.
D’autres outils informatiques tentent de prédire les fonctions enzymatiques. En règle générale, ils tentent d’attribuer un numéro de commission d’enzyme – un code d’identification qui indique le kind de réaction qu’une enzyme catalyse – en comparant une séquence interrogée avec un catalogue d’enzymes connues et en trouvant des séquences similaires. Cependant, ces outils ne fonctionnent pas aussi bien avec des enzymes moins étudiées ou non caractérisées, ou avec des enzymes qui effectuent plusieurs tâches, a déclaré Zhao.
“Nous ne sommes pas les premiers à utiliser des outils d’IA pour prédire les numéros de commission d’enzymes, mais nous sommes les premiers à utiliser ce nouvel algorithme d’apprentissage en profondeur appelé apprentissage contrastif pour prédire la fonction enzymatique. Nous constatons que cet algorithme fonctionne bien mieux que l’IA. des outils qui sont utilisés par d’autres », a déclaré Zhao. “Nous ne pouvons pas garantir que le produit de chacun sera correctement prédit, mais nous pouvons obtenir une moreover grande précision que les deux ou trois autres méthodes.”
Les chercheurs ont vérifié leur outil expérimentalement avec des expériences informatiques et in vitro. Ils ont découvert que non seulement l’outil pouvait prédire la fonction d’enzymes précédemment non caractérisées, mais qu’il corrigeait également les enzymes mal étiquetées par le logiciel chief et identifiait correctement les enzymes avec deux fonctions ou in addition.
Le groupe de Zhao rend Clear accessible en ligne pour d’autres chercheurs cherchant à caractériser une enzyme ou à déterminer si une enzyme pourrait catalyser une réaction souhaitée.
“Nous espérons que cet outil sera largement utilisé par l’ensemble de la communauté de recherche”, a déclaré Zhao. “Avec l’interface Web, les chercheurs peuvent simplement saisir la séquence dans un champ de recherche, comme un moteur de recherche, et voir les résultats.”
Zhao a déclaré que le groupe prévoyait d’étendre l’IA derrière Clear pour caractériser d’autres protéines, telles que les protéines de liaison. L’équipe espère également développer davantage les algorithmes d’apprentissage automatique afin qu’un utilisateur puisse rechercher une réaction souhaitée et que l’IA pointe vers une enzyme appropriée pour le travail.
“Il existe de nombreuses protéines de liaison non caractérisées, telles que des récepteurs et des facteurs de transcription. Nous souhaitons également prédire leurs fonctions”, a déclaré Zhao. “Nous voulons prédire les fonctions de toutes les protéines afin que nous puissions connaître toutes les protéines d’une cellule et mieux étudier ou concevoir la cellule entière pour des programs biotechnologiques ou biomédicales.”
La Countrywide Science Foundation a soutenu ce travail par le biais du Molecule Maker Lab Institute, un institut de recherche sur l’IA dirigé par Zhao.
In addition d’informations : https://moleculemaker.org/alphasynthesis/