in

STING-seq fournit une feuille de route pour identifier les variants et les gènes, permettant une meilleure compréhension du génome non codant et des cibles pour les thérapies

Un défi majeur en génétique humaine est de comprendre quelles events du génome déterminent des features spécifiques ou contribuent au risque de maladie. Ce défi est encore additionally grand pour les variantes génétiques trouvées dans les 98 % du génome qui ne codent pas pour les protéines.

Une nouvelle approche développée par des chercheurs de l’Université de New York et du New York Genome Middle blend des études d’association génétique, l’édition de gènes et le séquençage unicellulaire pour relever ces défis et découvrir des variantes causales et des mécanismes génétiques pour les traits des cellules sanguines.

Leur approche, baptisée STING-seq et publiée dans Science, relève le défi de relier directement les variantes génétiques aux attributes humains et à la santé, et peut aider les scientifiques à identifier des cibles médicamenteuses pour les maladies à base génétique.

Au cours des deux dernières décennies, les études d’association à l’échelle du génome (GWAS) sont devenues un outil crucial pour l’étude du génome humain. À l’aide de GWAS, les scientifiques ont identifié des milliers de mutations ou de variantes génétiques associées à de nombreuses maladies, de la schizophrénie au diabète, ainsi que des traits tels que la taille. Ces études sont menées en comparant les génomes de grandes populations pour trouver des variantes qui surviennent moreover souvent chez les personnes atteintes d’une maladie ou d’un trait spécifique.

GWAS peut révéler quelles régions du génome et quelles variantes potentielles sont impliquées dans des maladies ou des attributes. Cependant, ces associations se retrouvent presque toujours dans les 98% du génome qui ne codent pas pour les protéines, ce qui est beaucoup moins bien compris que les 2% bien étudiés du génome qui codent pour les protéines. Une autre complication est que de nombreuses variantes se trouvent à proximité les unes des autres dans le génome et voyagent ensemble à travers les générations, un notion connu sous le nom de liaison. Cela peut rendre difficile de distinguer quelle variante joue un rôle véritablement causal par rapport aux autres variantes qui se trouvent juste à proximité. Même lorsque les scientifiques peuvent identifier quelle variante est à l’origine d’une maladie ou d’un trait, ils ne savent pas toujours sur quel gène la variante a un affect.

“Un objectif majeur pour l’étude des maladies humaines est d’identifier les gènes et les variantes causales, qui peuvent clarifier les mécanismes biologiques et informer les cibles des médicaments pour ces maladies”, a déclaré Neville Sanjana, professeur agrégé de biologie à NYU, professeur agrégé de neurosciences et de physiologie à NYU Grossman Faculty of Medicine, membre principal du corps professoral du New York Genome Heart et co-auteur principal de l’étude.

“L’énorme succès de GWAS a mis en évidence le défi d’extraire des informations sur la biologie des maladies à partir de ces ensembles de données massifs. Malgré tous nos attempts au cours des 10 dernières années, le verre n’était encore qu’à moitié plein – au mieux. Nous avions besoin d’une nouvelle approche “, a déclaré Tuuli Lappalainen, membre principal du corps professoral associé au New York Genome Centre, professeur de génomique au KTH Royal Institute of Technological innovation en Suède et co-auteur principal de l’étude.

Un remède contre la drépanocytose

Une percée scientifique récente dans le traitement de l’anémie falciforme – une maladie génétique marquée par des épisodes de douleur powerful – illustre remark la combinaison de GWAS avec des outils moléculaires de pointe comme l’édition de gènes peut identifier des variantes causales et conduire à des thérapies innovantes. À l’aide de GWAS, les scientifiques ont identifié des zones du génome importantes pour la manufacturing d’hémoglobine fœtale, une cible basée sur sa promesse d’inverser l’anémie falciforme, mais ils ne savaient pas quelle variante exacte entraîne sa creation.

Les chercheurs se sont tournés vers CRISPR – un outil d’édition de gènes qui utilise des “ciseaux moléculaires pour couper l’ADN”, selon Sanjana – pour éditer les régions identifiées par GWAS. Lorsque des modifications CRISPR ont été effectuées à un emplacement spécifique du génome non codant près d’un gène appelé BCL11A, cela a entraîné des niveaux élevés d’hémoglobine fœtale.

CRISPR a maintenant été utilisé dans des essais cliniques pour modifier cette région dans les cellules de la moelle osseuse de dizaines de individuals atteints d’anémie falciforme. Une fois que les cellules modifiées sont réinjectées dans les people, elles commencent à produire de l’hémoglobine fœtale, qui déplace la forme adulte mutée de l’hémoglobine, les guérissant efficacement de la drépanocytose.

“Cette réussite dans le traitement de la drépanocytose est le résultat de la combinaison des connaissances de GWAS avec l’édition de gènes”, a déclaré Sanjana. “Mais il a fallu des années de recherche sur une seule maladie. Comment pouvons-nous intensifier cela pour mieux identifier les variantes causales et les gènes cibles de GWAS?”

GWAS rencontre CRISPR et le séquençage unicellulaire

L’équipe de recherche a créé un flux de travail appelé STING-seq – Ciblage systématique et inhibition des locus GWAS non codants avec séquençage unicellulaire. STING-seq fonctionne en prenant GWAS à l’échelle de la biobanque et en recherchant des variantes causales probables en utilisant une combinaison de caractéristiques biochimiques et d’éléments régulateurs. Les chercheurs utilisent ensuite CRISPR pour cibler chacune des régions des génomes impliquées par GWAS et effectuer un séquençage unicellulaire pour évaluer l’expression des gènes et des protéines.

Dans leur étude, les chercheurs ont illustré l’utilisation de STING-seq pour découvrir des gènes cibles de variants non codants pour les qualities sanguins. Les characteristics sanguins – tels que les pourcentages de plaquettes, de globules blancs et de globules rouges – sont faciles à mesurer dans les tests sanguins de program et ont été bien étudiés dans GWAS. En conséquence, les chercheurs ont pu utiliser GWAS représentant près de 750 000 personnes d’horizons divers pour étudier les characteristics sanguins.

Une fois que les chercheurs ont identifié 543 régions candidates du génome susceptibles de jouer un rôle dans les characteristics sanguins, ils ont utilisé une edition de CRISPR appelée inhibition CRISPR qui peut faire taire des régions précises du génome.

Après le silence CRISPR des régions identifiées par GWAS, les chercheurs ont examiné l’expression de gènes voisins dans des cellules individuelles pour voir si des gènes particuliers étaient activés ou désactivés. S’ils voyaient une différence dans l’expression des gènes entre les cellules où les variantes étaient et n’étaient pas réduites au silence, ils pourraient lier des régions non codantes spécifiques aux gènes cibles. Ce faisant, les chercheurs ont pu identifier quelles régions non codantes sont au cœur de characteristics spécifiques (et lesquelles ne le sont pas) et souvent aussi les voies cellulaires par lesquelles ces régions non codantes fonctionnent.

“La puissance de STING-seq est que nous pourrions appliquer cette approche à n’importe quelle maladie ou trait”, a déclaré John Morris, associé postdoctoral au New York Genome Centre et NYU et leading auteur de l’étude.

L’utilisation de STING-seq pour tester des grappes de variantes probables et voir leur influence sur les gènes élimine les conjectures que les scientifiques rencontraient auparavant lorsqu’ils étaient confrontés à un lien entre les variantes ou les gènes les as well as proches des variantes, qui sont souvent mais pas toujours le gène cible. Dans le cas d’un trait sanguin appelé numération des monocytes, l’application de CRISPR a fait ressortir clairement un gène, CD52, comme significativement modifié – et bien que CD52 était proche de la variante d’intérêt, ce n’était pas le gène le plus proche, il a donc peut-être été négligé en utilisant les méthodes précédentes.

Dans une autre analyse, les chercheurs ont identifié un gène appelé PTPRC qui est associé à 10 attributes sanguins, y compris ceux liés aux globules rouges et blancs et aux plaquettes. Cependant, il existe plusieurs variantes non codantes identifiées par GWAS à proximité et il était difficile de comprendre lesquelles (le cas échéant) pourraient moduler l’expression de PTPRC. L’application de STING-seq leur a permis d’isoler les variantes causales en voyant celles qui modifiaient l’expression de PTPRC.

STING-seq et au-delà

Alors que STING-seq peut identifier le gène cible et la variante causale en faisant taire les variantes, cela n’explique pas la way de l’effet – si une variante non codante spécifique augmentera ou réduira l’expression d’un gène voisin. Les chercheurs ont poussé leur approche un peu plus loin pour créer une approche complémentaire qu’ils appellent beeSTING-seq (édition de foundation STING-seq) qui utilise CRISPR pour insérer précisément une variante génétique au lieu de simplement inhiber cette région du génome.

Les chercheurs envisagent d’utiliser STING-seq et beeSTING-seq pour identifier les variantes causales d’un large éventail de maladies qui peuvent être traitées soit par l’édition de gènes – comme cela a été utilisé dans l’anémie falciforme – soit avec des médicaments qui ciblent des gènes ou des cellules spécifiques. voies.

“Maintenant que nous pouvons connecter des variantes non codantes à des gènes cibles, cela nous donne la preuve que de petites molécules ou des thérapies par anticorps pourraient être développées pour modifier l’expression de gènes spécifiques”, a déclaré Lappalainen.

Parmi les autres auteurs de l’étude figurent Christina Caragine, Zharko Daniloski, Lu Lu et Kyrie Davis, de NYU et du New York Genome Center Júlia Domingo, Marcello Ziosi, Dafni Glinos, Stephanie Hao, Eleni P. Mimitou et Peter Smibert du New York Genome Center  Timothy Barry et Kathryn Roeder de l’Université Carnegie Mellon et Eugene Katsevich de l’Université de Pennsylvanie.

La recherche a été soutenue par les Nationwide Institutes of Health (DP2HG010099, R01CA279135, R01CA218668, R01AI176601, R01MH106842, UM1HG008901, R01GM122924, K99HG012792, R01MH123184), la Nationwide Science Basis (DMS-2113 072), les Instituts de recherche en santé du Canada, l’European Molecular Biology Business (ALTF 345-2021), l’American Heart Affiliation (20Article35220040), la Simons Basis for Autism Investigate, le MacMillan Center for the Study of the Non-Coding Cancer Genome, le Wharton Details Science and Small business Analytics Fund, New York College, et le New York Genome Middle.