Spelling suggestions: "subject:"nettoyage dde données génétique"" "subject:"nettoyage dee données génétique""
1 |
Approches bio-informatiques appliquées aux technologies émergentes en génomiqueLemieux Perreault, Louis-Philippe 02 1900 (has links)
Les études génétiques, telles que les études de liaison ou d’association, ont permis d’acquérir une plus grande connaissance sur l’étiologie de plusieurs maladies affectant les populations humaines. Même si une dizaine de milliers d’études génétiques ont été réalisées sur des centaines de maladies ou autres traits, une grande partie de leur héritabilité reste inexpliquée. Depuis une dizaine d’années, plusieurs percées dans le domaine de la génomique ont été réalisées. Par exemple, l’utilisation des micropuces d’hybridation génomique comparative à haute densité a permis de démontrer l’existence à grande échelle des variations et des polymorphismes en nombre de copies. Ces derniers sont maintenant détectables à l’aide de micropuce d’ADN ou du séquençage à haut débit. De plus, des études récentes utilisant le séquençage à haut débit ont permis de démontrer que la majorité des variations présentes dans l’exome d’un individu étaient rares ou même propres à cet individu. Ceci a permis la conception d’une nouvelle micropuce d’ADN permettant de déterminer rapidement et à faible coût le génotype de plusieurs milliers de variations rares pour un grand ensemble d’individus à la fois.
Dans ce contexte, l’objectif général de cette thèse vise le développement de nouvelles méthodologies et de nouveaux outils bio-informatiques de haute performance permettant la détection, à de hauts critères de qualité, des variations en nombre de copies et des variations nucléotidiques rares dans le cadre d’études génétiques. Ces avancées permettront, à long terme, d’expliquer une plus grande partie de l’héritabilité manquante des traits complexes, poussant ainsi l’avancement des connaissances sur l’étiologie de ces derniers.
Un algorithme permettant le partitionnement des polymorphismes en nombre de copies a donc été conçu, rendant possible l’utilisation de ces variations structurales dans le cadre d’étude de liaison génétique sur données familiales. Ensuite, une étude exploratoire a permis de caractériser les différents problèmes associés aux études génétiques utilisant des variations en nombre de copies rares sur des individus non reliés. Cette étude a été réalisée avec la collaboration du Wellcome Trust Centre for Human Genetics de l’University of Oxford. Par la suite, une comparaison de la performance des algorithmes de génotypage lors de leur utilisation avec une nouvelle micropuce d’ADN contenant une majorité de marqueurs rares a été réalisée. Finalement, un outil bio-informatique permettant de filtrer de façon efficace et rapide des données génétiques a été implémenté. Cet outil permet de générer des données de meilleure qualité, avec une meilleure reproductibilité des résultats, tout en diminuant les chances d’obtenir une fausse association. / Genetic studies, such as linkage and association studies, have contributed greatly to a better understanding
of the etiology of several diseases. Nonetheless, despite the tens of thousands of genetic
studies performed to date, a large part of the heritability of diseases and traits remains unexplained.
The last decade experienced unprecedented progress in genomics. For example, the use of
microarrays for high-density comparative genomic hybridization has demonstrated the existence
of large-scale copy number variations and polymorphisms. These are now detectable using DNA
microarray or high-throughput sequencing. In addition, high-throughput sequencing has shown
that the majority of variations in the exome are rare or unique to the individual. This has led to
the design of a new type of DNA microarray that is enriched for rare variants that can be quickly
and inexpensively genotyped in high throughput capacity.
In this context, the general objective of this thesis is the development of methodological approaches
and bioinformatics tools for the detection at the highest quality standards of copy number polymorphisms
and rare single nucleotide variations. It is expected that by doing so, more of the
missing heritability of complex traits can then be accounted for, contributing to the advancement
of knowledge of the etiology of diseases.
We have developed an algorithm for the partition of copy number polymorphisms, making it feasible
to use these structural changes in genetic linkage studies with family data. We have also conducted
an extensive study in collaboration with the Wellcome Trust Centre for Human Genetics of the
University of Oxford to characterize rare copy number definition metrics and their impact on study
results with unrelated individuals. We have conducted a thorough comparison of the performance
of genotyping algorithms when used with a new DNA microarray composed of a majority of very
rare genetic variants. Finally, we have developed a bioinformatics tool for the fast and efficient
processing of genetic data to increase quality, reproducibility of results and to reduce spurious
associations.
|
2 |
Approches bio-informatiques appliquées aux technologies émergentes en génomiqueLemieux Perreault, Louis-Philippe 02 1900 (has links)
Les études génétiques, telles que les études de liaison ou d’association, ont permis d’acquérir une plus grande connaissance sur l’étiologie de plusieurs maladies affectant les populations humaines. Même si une dizaine de milliers d’études génétiques ont été réalisées sur des centaines de maladies ou autres traits, une grande partie de leur héritabilité reste inexpliquée. Depuis une dizaine d’années, plusieurs percées dans le domaine de la génomique ont été réalisées. Par exemple, l’utilisation des micropuces d’hybridation génomique comparative à haute densité a permis de démontrer l’existence à grande échelle des variations et des polymorphismes en nombre de copies. Ces derniers sont maintenant détectables à l’aide de micropuce d’ADN ou du séquençage à haut débit. De plus, des études récentes utilisant le séquençage à haut débit ont permis de démontrer que la majorité des variations présentes dans l’exome d’un individu étaient rares ou même propres à cet individu. Ceci a permis la conception d’une nouvelle micropuce d’ADN permettant de déterminer rapidement et à faible coût le génotype de plusieurs milliers de variations rares pour un grand ensemble d’individus à la fois.
Dans ce contexte, l’objectif général de cette thèse vise le développement de nouvelles méthodologies et de nouveaux outils bio-informatiques de haute performance permettant la détection, à de hauts critères de qualité, des variations en nombre de copies et des variations nucléotidiques rares dans le cadre d’études génétiques. Ces avancées permettront, à long terme, d’expliquer une plus grande partie de l’héritabilité manquante des traits complexes, poussant ainsi l’avancement des connaissances sur l’étiologie de ces derniers.
Un algorithme permettant le partitionnement des polymorphismes en nombre de copies a donc été conçu, rendant possible l’utilisation de ces variations structurales dans le cadre d’étude de liaison génétique sur données familiales. Ensuite, une étude exploratoire a permis de caractériser les différents problèmes associés aux études génétiques utilisant des variations en nombre de copies rares sur des individus non reliés. Cette étude a été réalisée avec la collaboration du Wellcome Trust Centre for Human Genetics de l’University of Oxford. Par la suite, une comparaison de la performance des algorithmes de génotypage lors de leur utilisation avec une nouvelle micropuce d’ADN contenant une majorité de marqueurs rares a été réalisée. Finalement, un outil bio-informatique permettant de filtrer de façon efficace et rapide des données génétiques a été implémenté. Cet outil permet de générer des données de meilleure qualité, avec une meilleure reproductibilité des résultats, tout en diminuant les chances d’obtenir une fausse association. / Genetic studies, such as linkage and association studies, have contributed greatly to a better understanding
of the etiology of several diseases. Nonetheless, despite the tens of thousands of genetic
studies performed to date, a large part of the heritability of diseases and traits remains unexplained.
The last decade experienced unprecedented progress in genomics. For example, the use of
microarrays for high-density comparative genomic hybridization has demonstrated the existence
of large-scale copy number variations and polymorphisms. These are now detectable using DNA
microarray or high-throughput sequencing. In addition, high-throughput sequencing has shown
that the majority of variations in the exome are rare or unique to the individual. This has led to
the design of a new type of DNA microarray that is enriched for rare variants that can be quickly
and inexpensively genotyped in high throughput capacity.
In this context, the general objective of this thesis is the development of methodological approaches
and bioinformatics tools for the detection at the highest quality standards of copy number polymorphisms
and rare single nucleotide variations. It is expected that by doing so, more of the
missing heritability of complex traits can then be accounted for, contributing to the advancement
of knowledge of the etiology of diseases.
We have developed an algorithm for the partition of copy number polymorphisms, making it feasible
to use these structural changes in genetic linkage studies with family data. We have also conducted
an extensive study in collaboration with the Wellcome Trust Centre for Human Genetics of the
University of Oxford to characterize rare copy number definition metrics and their impact on study
results with unrelated individuals. We have conducted a thorough comparison of the performance
of genotyping algorithms when used with a new DNA microarray composed of a majority of very
rare genetic variants. Finally, we have developed a bioinformatics tool for the fast and efficient
processing of genetic data to increase quality, reproducibility of results and to reduce spurious
associations.
|
Page generated in 0.0718 seconds