Publication :
Intégration d'annotations fonctionnelles dans les tests d'agrégation de variants rares sous vraisemblance rétrospective dans le cadre de devis familiaux

En cours de chargement...
Vignette d'image
Date
2022
Direction de publication
Direction de recherche
Titre de la revue
ISSN de la revue
Titre du volume
Éditeur
Projets de recherche
Structures organisationnelles
Numéro de revue
Résumé
Depuis ces vingt dernières années et la démocratisation des technologies de séquençage haut débit de l'ADN, l'accessibilité des données génomiques a permis le développement de nouveaux outils analytiques, notamment dans l'étude des maladies complexes. Au-delà de la simple perspective descriptive, il y a un intérêt croissant des chercheurs à étudier les phénomènes biologiques menant à l'émergence ou au développement de maladies chez l'humain. En effet, la vaste majorité des troubles complexes sont la résultante de la combinaison de variations rares et communes situées dans des régions non codantes du génome, rendant l'interprétation des mécanismes biologiques en jeu difficile. Ce dernier point a été l'occasion pour les chercheurs de caractériser, à travers de nouvelles technologies, certaines régions du génome selon leur profil épigénétique et d'intégrer cette information dans de nouveaux outils statistiques dans une optique de détection de variants impliqués dans les maladies. Premièrement, à l'heure actuelle les modèles existant pour caractériser les régions non codantes et les lier à leur(s) gènes cibles n'intègrent pas la notion de réseaux d'interaction. Ainsi il devient critique de proposer un modèle computationnel, valide biologiquement, capable de capturer les contacts entre gènes et éléments de régulation à travers des réseaux, afin de mettre en lumière les mécanismes biologiques impliqués dans les maladies complexes. D'un autre côté, bien que des modèles permettant de tenir compte de la rareté des variants et de leur implication fonctionnelle dans les maladies ont déjà été proposés, ces derniers ne se limitent qu'aux devis cas-témoins d'individus non apparentés, pouvant nécessiter des tailles d'échantillon souvent élevées pour détecter des associations. Il y a alors un réel besoin méthodologique d'étendre ces approches aux études familiales, lorsque ces dernières sont plus performantes pour identifier des variants rares impliqués dans les maladies. Ainsi, dans cette perspective, nous proposons un nouveau modèle de réseaux intégrant l'information épigénétique au travers des contacts physiques entre gènes et enhancers, appelé pôles de régulation cis. Aussi, parce que cette information peut être exploiter afin de mettre en lumière de nouvelles régions associées avec des maladies, nous proposons un nouveau test d'association de variants rares, appelé RetroFun-RVS, exploitant la structure familiale et permettant l'intégration des annotations fonctionnelles sous forme de réseaux. Enfin, nous avons démontré que notre modèle de pôles de régulation cis en plus d'être biologiquement valide est capable de mieux cerner les mécanismes épigénétiques impliqués dans l'étiologie de maladies complexes. Par ailleurs, RetroFun-RVS en incorporant les pôles de régulation cis, en tant qu'annotations fonctionnelles et l'information familiale, a été démontré une approche puissante pour détecter de nouveaux variants causaux. Dans une perspective mécanistique, proposer des modèles unifiant approches familiales et information fonctionnelle ouvre alors de nouvelles voies dans l'étude des maladies complexes, notamment en permettant de cibler plus précisément les phénomènes de régulation impliqués.
Over the past few years, with the development of whole-genome sequencing technologies, improvements have been made in the understanding of complex diseases. Indeed, most phenotypes are characterized by a combination of common and rare variants, mainly located within noncoding regions, making the underlying biological mechanisms difficult to interpret. The increased availability of genomics data has provided opportunities for researchers to characterize noncoding regions and assess their roles in diseases, by incorporating this information in analytical tools to detect new causal variants involved in diseases. On the one side, to date, methods to detect enhancers and link to their target genes do not integrate complex networks of interactions. Indeed, no network-based model integrating physical contacts between genes and enhancers has been proposed. Thus, it remains crucial to provide a computational model which is biologically relevant and able to capture complex regulatory interactions, in order to gain insights in epigenetics mechanisms involved in the etiology of complex diseases. On the other side, although rare-variant association tests integrating functional information have already been proposed, models currently available suffer from two major limitations. Firstly, they are restricted to case-control designs of unrelated people, where tens or hundreds thousand of individuals are often required to reach sufficient power, limiting their applicability in practice. Secondly, these approaches have been mainly evaluated using continuous scores. Indeed, no functional annotations corresponding to regions with regulatory impacts have been assessed. To overcome these limitations, there is an important need to provide family-based rare-variant association tests, incorporating functional annotations through active noncoding regions. Hence, in this thesis, we are firstly proposing Cis-Regulatory Hubs (CRHs), a new 3D-based model integrating contacts between genes and enhancers within networks of complex interactions. Also, we argue that this information can be used to highlight new risk variants involved in complex diseases. Thus, we have developed a new family-based rare variant association test, called RetroFun-RVS, integrating 3D-based functional annotations, such as CRHs. We have demonstrated that CRHs represent biological relevant structures to gain insights into complex disease etiology, such as schizophrenia. Moreover, RetroFun-RVS incorporating CRHs as functional annotations has been shown to be powerful in detecting new risk variants. We argue that these aspects are crucial to highlighting epigenetics mechanisms involved in complex traits. Finally, by proposing an unified framework combining both family-based studies and functional annotations, progress is made in the understanding of the etiology of complex diseases.
Description
Revue
DOI
URL vers la version publiée
Mots-clés
Citation
Type de document