Les enzymes jouent un rôle clé dans les processus métaboliques cellulaires. Pour permettre l’évaluation quantitative de ces processus, les chercheurs ont besoin de connaître le soi-disant « chiffre d’affaires » (en abrégé : kcat) des enzymes. Dans la revue scientifique Mother nature Communications, une équipe de bioinformaticiens de l’Université Heinrich Heine de Düsseldorf (HHU) décrit maintenant un outil permettant de prédire ce paramètre pour diverses enzymes à l’aide de méthodes d’IA.
Les enzymes sont des biocatalyseurs importants dans toutes les cellules vivantes. Ce sont normalement de grosses protéines, qui se lient à des molécules additionally petites – les soi-disant substrats – et les convertissent ensuite en d’autres molécules, les “produits”. Sans enzymes, la réaction qui convertit les substrats en produits ne pourrait pas avoir lieu, ou ne pourrait le faire qu’à une vitesse très faible. La plupart des organismes possèdent des milliers d’enzymes différentes. Les enzymes ont de nombreuses purposes dans un significant éventail de processus biotechnologiques et dans la vie quotidienne – de la fermentation de la pâte à suffering aux détergents.
La vitesse maximale à laquelle une enzyme spécifique peut convertir ses substrats en produits est déterminée par ce que l’on appelle le chiffre d’affaires kcat. C’est un paramètre critical pour la recherche quantitative sur les activités enzymatiques et joue un rôle clé dans la compréhension du métabolisme cellulaire.
Cependant, il est prolonged et coûteux de déterminer les chiffres de rotation de kcat dans les expériences, c’est pourquoi ils ne sont pas connus pour la grande majorité des réactions. Le groupe de recherche Computational Cell Biology du HHU, dirigé par le professeur Dr Martin Lercher, a maintenant développé un nouvel outil appelé TurNuP pour prédire le nombre de rotations de kcat des enzymes à l’aide de méthodes d’IA.
Pour previous un modèle de prédiction kcat, les informations sur les enzymes et les réactions catalysées ont été converties en vecteurs numériques à l’aide de modèles d’apprentissage en profondeur. Ces vecteurs numériques ont servi d’entrée pour un modèle d’apprentissage automatique – un modèle dit d’amplification de gradient – qui prédit les chiffres de rotation de kcat.
L’auteur principal Alexander Kroll : “TurNuP surpasse les modèles précédents et peut même être utilisé avec succès pour les enzymes qui n’ont qu’une faible similitude avec celles de l’ensemble de données d’entraînement.” Les modèles précédents n’ont pas été en mesure de faire des prédictions significatives à moins qu’au moins 40% de la séquence enzymatique soit identique à au moins une enzyme dans l’ensemble d’apprentissage. En revanche, TurNuP peut déjà faire des prédictions significatives pour les enzymes avec une identité de séquence maximale de à 40 %.
Le professeur Lercher ajoute : “Dans notre étude, nous montrons que les prédictions faites par TurNuP peuvent être utilisées pour prédire les concentrations d’enzymes dans les cellules vivantes avec beaucoup as well as de précision que ce n’était le cas jusqu’à présent.”
Afin de rendre le modèle de prédiction facilement obtainable au as well as grand nombre d’utilisateurs attainable, l’équipe du HHU a développé un serveur World wide web convivial, que d’autres chercheurs peuvent utiliser pour prédire le nombre de rotations de kcat des enzymes.
Lien vers le serveur Internet : https://turnup.cs.hhu.de/
Contexte : Apprentissage automatique et apprentissage en profondeur
Les modèles d’apprentissage en profondeur comprennent des réseaux de neurones artificiels multicouches qui peuvent reconnaître et traiter des modèles dans les données d’entrée. L’utilisation de grands ensembles de données d’apprentissage est le moyen optimum d’entraîner un modèle d’apprentissage en profondeur pour traiter les entrées numériques.
Les modèles d’amplification de gradient sont une méthode d’apprentissage automatique, qui produit un grand nombre d’arbres de décision. Les résultats de tous les arbres de décision pour une entrée spécifique sont utilisés pour faire des prédictions. Semblable à l’apprentissage en profondeur, les données d’apprentissage sont utilisées pour affiner le modèle, c’est-à-dire pour produire les arbres de décision.