in

Une analyse informatique révèle que de nombreuses séquences répétitives sont partagées entre les protéines et sont similaires dans les espèces, des bactéries aux humains

Environ 70 % de toutes les protéines humaines comprennent au moins une séquence constituée d’un seul acide aminé répété plusieurs fois, avec quelques autres acides aminés saupoudrés. Ces « régions de faible complexité » se retrouvent également dans la plupart des autres organismes.

Les protéines qui contiennent ces séquences ont de nombreuses fonctions différentes, mais les biologistes du MIT ont maintenant trouvé un moyen de les identifier et de les étudier en tant que groupe unifié. Leur technique leur permet d’analyser les similitudes et les différences entre les LCR de différentes espèces, et les aide à déterminer les fonctions de ces séquences et les protéines dans lesquelles elles se trouvent.

Grâce à leur technique, les chercheurs ont analysé toutes les protéines présentes dans huit espèces différentes, des bactéries aux humains. Ils ont découvert que même si les LCR peuvent varier entre les protéines et les espèces, ils partagent souvent un rôle similaire  : aider la protéine dans laquelle ils se trouvent à rejoindre un assemblage à furthermore grande échelle tel que le nucléole, un organite présent dans presque toutes les cellules humaines.

“Au lieu d’examiner des LCR spécifiques et leurs fonctions, qui peuvent sembler distinctes parce qu’elles sont impliquées dans des processus différents. “, déclare Byron Lee, un étudiant diplômé du MIT.

Les chercheurs ont également trouvé des différences entre les LCR de différentes espèces et ont montré que ces séquences LCR spécifiques à l’espèce correspondent à des fonctions spécifiques à l’espèce, telles que la development de parois cellulaires végétales.

Lee et étudiant diplômé Nima Jaberi-Lashkari sont les principaux auteurs de l’étude. Eliezer Calo, professeur adjoint de biologie au MIT, est l’auteur principal de l’article.

Étude à grande échelle

Des recherches antérieures ont révélé que les LCR sont impliqués dans une variété de processus cellulaires, y compris l’adhésion cellulaire et la liaison à l’ADN. Ces LCR sont souvent riches en un seul acide aminé tel que l’alanine, la lysine ou l’acide glutamique.

Trouver ces séquences puis étudier leurs fonctions individuellement est un processus qui prend du temps.

“Ce que nous voulions faire, c’est prendre du recul et au lieu de regarder les LCR individuellement, essayer de les examiner tous et voir si nous pouvions observer certains modèles à as well as grande échelle qui pourraient nous aider à comprendre ce que le ceux qui ont des fonctions assignées font, et nous aident également à en savoir un peu furthermore sur ce que font ceux qui n’ont pas de fonctions assignées », dit Jaberi-Lashkari.

Ils ont ensuite utilisé des méthodes informatiques de traitement d’images pour comparer des milliers de ces matrices en même temps.

les chercheurs ont pu catégoriser les LCR en fonction des acides aminés les plus fréquemment répétés dans le LCR. Ils ont également regroupé les protéines contenant la LCR en fonction du nombre de copies de chaque form de LCR trouvé dans la protéine. L’analyse de ces characteristics a aidé les chercheurs à en savoir additionally sur les fonctions de ces LCR.

À titre de démonstration, les chercheurs ont choisi une protéine humaine, connue sous le nom de RPA43, qui possède trois LCR riches en lysine. qui synthétise l’ARN ribosomal. Les chercheurs ont découvert que le nombre de copies de LCR riches en lysine est crucial pour aider la protéine à s’intégrer dans le nucléole, l’organite responsable de la synthèse des ribosomes.

Assemblages biologiques

Dans une comparaison des protéines trouvées dans huit espèces différentes, les chercheurs ont découvert que certains styles de LCR sont hautement conservés entre les espèces, ce qui signifie que les séquences ont très peu changé au cours des échelles de temps évolutives. Ces séquences ont tendance à se trouver dans des protéines et des structures cellulaires qui sont également hautement conservées, comme le nucléole.

“Ces séquences semblent être importantes pour l’assemblage de certaines get-togethers du nucléole”, explique Lee. “Certains des principes connus pour être importants pour l’assemblage d’ordre supérieur semblent être en jeu auto le nombre de copies, qui pourrait contrôler le nombre d’interactions qu’une protéine peut faire, est crucial pour que la protéine s’intègre dans ce compartiment.”

Les chercheurs ont également trouvé des différences entre les LCR observés dans deux types différents de protéines impliquées dans l’assemblage du nucléole. Ils ont découvert qu’une protéine nucléolaire connue sous le nom de TCOF contient de nombreux LCR riches en glutamine qui peuvent aider à échafauder la formation d’assemblages, tandis que les protéines nucléolaires avec seulement quelques-uns de ces LCR riches en acide glutamique pourraient être recrutées comme consumers (protéines qui interagissent avec l’échafaudage ).

Une autre construction qui semble avoir de nombreux LCR conservés est le speckle nucléaire, qui se trouve à l’intérieur du noyau cellulaire. Les chercheurs ont également trouvé de nombreuses similitudes entre les LCR qui sont impliqués dans la formation d’assemblages à plus grande échelle tels que la matrice extracellulaire, un réseau de molécules qui fournit un help structurel aux cellules des plantes et des animaux.

L’équipe de recherche a également trouvé des exemples de constructions avec des LCR qui semblent avoir divergé entre les espèces. Par exemple, les plantes ont des séquences LCR distinctives dans les protéines qu’elles utilisent pour échafauder leurs parois cellulaires, et ces LCR ne sont pas observées dans d’autres varieties d’organismes.

Les chercheurs prévoient maintenant d’étendre leur analyse LCR à d’autres espèces.

“Il y a tellement de choses à explorer, car nous pouvons étendre cette carte à pratiquement toutes les espèces”, déclare Lee. “Cela nous donne l’opportunité et le cadre pour identifier de nouveaux assemblages biologiques.”

La recherche a été financée par le National Institute of General Healthcare Sciences, le Countrywide Cancer Institute, le Ludwig Heart du MIT, une subvention de formation prédoctorale des Countrywide Institutes of Well being et les Pew Charitable Trusts.