Des milliers de marqueurs génétiques ont déjà été solidement associés à des attributes humains complexes, tels que la maladie d’Alzheimer, le cancer, l’obésité ou la taille. Pour découvrir ces associations, les chercheurs doivent comparer les génomes de nombreux individus à des thousands and thousands de localisations génétiques ou de marqueurs et nécessitent donc des technologies de génotypage rentables. Une nouvelle méthode statistique, développée par le groupe d’Olivier Delaneau au SIB Institut Suisse de Bioinformatique et à l’Université de Lausanne (UNIL), offre des possibilités qui changent la donne. Pour moins de 1 $ en coût de calcul, GLIMPSE est capable de déduire statistiquement un génome humain complet à partir d’une très petite quantité de données. La méthode offre une première different réaliste aux approches actuelles reposant sur un ensemble prédéfini de marqueurs génétiques, et permet ainsi une inclusion additionally massive des populations sous-représentées. L’étude, qui suggère un changement de paradigme pour la génération de données dans la recherche biomédicale, est publiée dans Mother nature Genetics.



Une approche rentable pour sonder les marqueurs génétiques

Le séquençage du génome entier à faible couverture (LC-WGS) suivi de l’imputation du génotype est une méthode par laquelle un génome entier peut être déduit statistiquement à partir d’un work de séquençage très faible. Il a été proposé comme une alternate moins biaisée et plus puissante aux tableaux SNP (voir encadré), mais son coût de calcul élevé l’a empêché de devenir une option largement utilisée. L’équipe de scientifiques dirigée par Olivier Delaneau, chef de groupe au SIB et à l’UNIL, a développé un logiciel open supply, appelé GLIMPSE, qui surmonte enfin ces problèmes. « GLIMPSE fournit un cadre qui est 10 à 1000 fois additionally rapide, et donc moins cher, que les autres méthodes LC-WGS, tout en étant beaucoup as well as précis pour les marqueurs génétiques rares », explique Olivier Delaneau. « GLIMPSE est capable d’améliorer considérablement une faible couverture génome à des hundreds of thousands de marqueurs pour moins de 1 $ en coût de calcul, ce qui en fait la première véritable substitute aux tableaux SNP.  »

Des données impartiales aux soins de santé non biaisés Les études d’association à l’échelle du génome se sont jusqu’à présent principalement concentrées sur les Européens: 80% de tous les individuals au GWAS sont des individus d’origine européenne, mais ceux-ci ne représentent que 16% de la populace mondiale. Il s’agit d’une query éthique importante en termes d’inclusion des soins de santé et d’accès équitable aux avantages de la recherche biomédicale, motor vehicle la manière dont les marqueurs génétiques contribuent à la vulnérabilité aux maladies varie d’une populace humaine à l’autre. LC-WGS contourne naturellement le biais inhérent aux ensembles préétablis de marqueurs génétiques (tableaux SNP). Il peut ainsi être appliqué avec succès à des populations sous-représentées, comme le montre cette étude pour une inhabitants afro-américaine comme preuve de concept. « En furthermore de briser la barrière financière pour permettre des études GWAS basées sur LC-WGS, ce qui est vraiment passionnant dans cette approche est qu’elle permet aux chercheurs de découvrir efficacement des associations dans des populations sous-étudiées », explique Simone Rubinacci, chercheuse postdoctorale dans le groupe Olivier Delaneau et leading auteur de l’article.



Tirer parti des génomes déjà séquencés « Notre réflexion initiale était: pouvons-nous utiliser la richesse des génomes séquencés pour améliorer ceux qui viennent d’être séquencés ? En d’autres termes, furthermore pour moins: c’est exactement ce que fait GLIMPSE », explique Diogo Ribeiro, Chercheur postdoctoral au sein du Groupe Olivier Delaneau et co-auteur de l’article. Remark ça marche ? En s’appuyant sur l’idée que nous partageons tous des ancêtres communs relativement récents, dont de petites portions de notre ADN sont héritées. En bref, GLIMPSE exploite de grandes collections de génomes humains qui ont été séquencés très précisément (WGS à couverture élevée) pour identifier des parties d’ADN qui sont partagées avec des génomes nouvellement séquencés. De cette manière, GLIMPSE peut combler de manière fiable les lacunes des données à faible couverture.

Un nouveau paradigme pour les futures études génomiques avec des applications de grande envergure

Mis à disposition dans le cadre d’une suite d’outils open resource, GLIMPSE ouvre la voie à une huge adoption du WGS à faible couverture, promouvant un changement de paradigme dans la génération de données pour les futures études génomiques. Depuis la première edition du logiciel sous forme de pré-impact en avril 2020, des recherches en cours ont déjà commencé à utiliser l’outil, par exemple pour reconstruire les génomes de personnes vivant il y a des milliers d’années à partir d’ADN ancien ou de sufferers atteints de COVID-19 du SRAS- Écouvillons nasopharyngés CoV-2 dans le cadre d’une étude GWAS.