Global ETD Search

1	Caractérisation des différences de structures chromosomiques dans l'espèce Musa acuminata par re-séquençage NGS : le cas de l'accession "Pahan" / Characterization of differences in structure of chromosomes in Musa acuminata by re-sequencing NGS Martin, Guillaume Eric 18 December 2014 (has links) Les cultivars de bananiers sont dérivés d'hybridations entre sous-espèces de Musa acuminata (génome A) et pour certains avec l'espèce M. balbisiana (génome B). Ces hybrides présentent une fertilité réduite, des méioses perturbées et de fortes distorsions de ségrégation. Ces caractéristiques attribuées à des réarrangements chromosomiques entre espèces et sous-espèces compliquent les analyses génétiques et les programmes d'amélioration variétale. Au cours de cette thèse, nous avons mis en place et testé de nouvelles approches, basées sur la récente disponibilité d'une séquence de référence du bananier et des technologies de séquençage haut-débit, pour caractériser ces différences de structures chromosomiques et comprendre leur impact sur les ségrégations chromosomiques. Ces approches ont nécessité l'amélioration de la séquence de référence du bananier. Pour cela, des outils ont été développés. Ils sont applicables à d'autres génomes et modulables en fonction des données disponibles. Le nombre de scaffolds a été divisé par 5 et 90% de la séquence est maintenant ancré aux chromosomes. Les scaffolds correspondant au génome mitochondrial ont été identifiés et le génome chloroplastique a été assemblé et annoté. Des données de re-séquençage de l'accession ‘Pahang' et de génotypage dense de sa descendance ont été utilisées pour explorer l'origine des distorsions de ségrégation impliquant les chromosomes 1 et 4. L'ensemble des données (profils de distorsion et de recombinaison, appariements à la méiose, re-séquençage), nous orientent vers l'hypothèse d'une translocation réciproque en orientation inversée, entre régions distales des chromosomes 1 et 4. Le test de nos outils de recherche de variations structurales pour comparer les génomes A et B du bananier, dont les différences de structure sont connues, montre que nos outils détectent directement les signatures de certaines variations structurales mais que pour d'autres il ne détecte que des signatures partielles. Ces dernières peuvent néanmoins être informatives en complément d'autres types d'informations provenant de cartographie génétique et d'analyses cytogénétiques. / Banana cultivars are derived from hybridization between Musa acuminata subspecies (A genome) and, for some of them, with the species M. balbisiana (B genome). These hybrids have reduced fertility, disturbed meiosis and strong segregation distortions. These characteristics attributed to chromosomal rearrangements between species and subspecies complicate genetic analyses and breeding programs. In this thesis, we have developed and tested new approaches based on the recent availability of a banana reference genome sequence and high-throughput sequencing technologies, to characterize these differences in chromosomal structures and understand their impact on chromosomal segregation. These approaches needed improvement of the banana reference genome sequence. New bioinformatics tools were developed for this purpose. They are applicable to other genomes and are flexible according to available data. The scaffolds number was divided by 5 and 90% of the assembly is now anchored to the chromosomes. Scaffolds corresponding to the mitochondrial genome were identified and the chloroplast genome was assembled and annotated. Re-sequencing data from the 'Pahang' accession and dense genotyping of its progeny were used to explore the origin of segregation distortion involving chromosomes 1 and 4. Distortion and recombination profiles, chromosomal pairing at meiosis and re-sequencing data direct us to the hypothesis of a reciprocal translocation in inverted orientation between distal portions of chromosomes 1 and 4. We tested our structural variation research tools to compare the A and B genomes of banana, for which structural differences are known. The results showed that our tools detected complete signatures of some structural changes but for others, they only detected partial signatures. The latter can still be informative in addition to other informations derived from genetic mapping and cytogenetic studies. Bananier Variations structurales Distorsions de segregations Re-Séquençage Bioinformatique Banana tree Structural variations Segregation distortions Re-Sequencing Bioinformatics
2	Contribution des variations structurales de type insertions/délétions à l'adaptation, la variation des caractères et les performances hybrides chez le maïs / Contribution of insertions/deletions-type structural variations to adaptation, phenotypic variation and hybrid performances in maize Mabire, Clément 23 April 2019 (has links) Le récent développement des méthodes de séquençage permet aujourd’hui d’identifier des variations structurales chez de nombreuses espèces. Chez le maïs, des milliers de grandes insertions et délétions (InDel) de quelques pb à plusieurs centaines de Kbp ont été découvertes entre le génome de référence B73 et de nombreux autres génomes reséquencés. Ces InDel peuvent changer la composition des gènes entre les individus et donc être impliquées dans la variation du phénotype, mais cet effet sur le phénotype reste mal connu. L’objectif de cette thèse était d'étudier la contribution des InDel à l'adaptation, aux variations phénotypiques et aux performances hybrides chez le maïs. Nous avons développé une puce de génotypage des InDel Affymetrix® Axiom® capable de génotyper 105 927 InDel de 35bp à 129,7Kbp. 79 969 de ces InDel ont leur séquences absentes du génome de référence B73 et ont été identifiées par l’assemblage 3 génomes (F2, C103, and PH207). Nous avons sélectionné 61 492 InDel polymorphiques pour génotyper 362 lignées de maïs représentant une large gamme de diversité pour étudier la contribution des InDel à la diversité génétique, l’adaptation et la variation des caractères. Nous avons également génotypé 1 million de SNP à partir de deux puces de génotypage et du génotypage par séquençage pour étudier la complémentarité entre les InDel et les SNP. Qu’ils soient calculés avec les InDel ou les SNP la structuration génétique et les valeurs d’apparentement entre les lignées sont très similaires, ce qui suggère que la plupart des InDel ont suivi la même trajectoire évolutive que les SNP. 51% des InDel ne sont pas en déséquilibre de liaison élevé (>0.8) avec aucun SNP proche donc l’effet de ces InDel n’est donc a priori pas capturé pas des SNP à cette densité. Parmi les 294 régions génomiques associées au phénotype (QTL), 13 nouveaux QTL ont été détectés grâce aux InDel par rapport aux SNP par une approche de génétique d’association (GA). Nous avons détecté un enrichissement en InDel sous sélection entre les lignées tropicales, cornées et dentées par rapport aux SNP, avec 56 sur 188 régions sous sélection détectées avec les InDel. Ces régions contiennent des gènes impliqués dans l’adaptation et/ou la tolérance aux stress. De plus, le plus grand nombre d’associations a été découvert pour la floraison, caractère adaptatif chez le maïs. Ces résultats suggèrent que les InDel sont plus souvent impliquées dans l’adaptation et la tolérance aux stress. Nous avons enfin testé l’effet des InDel sur les performances hybride en analysant un panel de 287 hybrides issus du croisement de 210 lignées tempérées du panel précédent. Nous avons décomposé la variance des performances hybrides en distinguant les effets de dominance et d’additivité pour la floraison femelle (FF), la hauteur (PH) et le rendement (GY). La plus forte part de dominance et d’interaction génotype-environnement a été observée pour le GY et la plus faible pour la FF. L’effet additif et de dominance de 51,844 InDel et 469 267 SNP a été testé pour 4 combinaisons d’environnements par une approche de GA. 78 et 133 QTL avec un effet additif et dominant respectivement ont été identifiés, dont 6 et 11 avec des InDel. 83% de ces QTL ont été identifiés dans une seule combinaison d’environnements. Un des QTL de rendement identifié avec des InDel est situé dans un large cluster d’InDel sur le chromosome 6 et colocalise avec un QTL déjà identifié avec des SNP avec un effet fort dans l’augmentation du rendement sous des températures élevées. L’ajout de l’effet de dominance en plus de l’effet additif permet d’augmenter la précision des prédictions génomiques jusqu’à 5,6% pour le rendement. Cependant, l’ajout du génotypage des InDel en plus de celui des SNP n’a pas permis d’améliorer les prédictions des phénotypes hybrides. / In the last decades, the rapid development of genome sequencing allowed to identify structural variations in many species. In maize, thousands of large insertions and deletions (InDels) from few bp to hundreds of Kbp were discovered by comparing the reference genome B73 and many other resequenced genomes. These InDel sequences can carry genes and therefore be involved in phenotypic variation by changing the gene composition between individuals, but their effect on phenotype was not well studied. The aim of this thesis was to study the contribution of InDels to adaptation, phenotypic variations and hybrid performances in maize. We developed an Affymetrix® Axiom® genotyping array that allowed to genotype 105,947 InDels sequences ranging from 35bp to 129,7Kbp of size. 79,969 out 105,947 sequences of these InDels were not present in B73 reference genome and have been discovered by assembling three genomes (F2, C103, and PH207). We selected 61,492 polymorphic InDels to genotype a 362 maize inbred lines panel representing a broad range of diversity to study the contribution of InDels to genetic diversity, adaptation and trait variation. We also assembled one million of SNPs from two genotyping arrays and genotyping by sequencing to study the complementarity between InDels and SNPs. Genetic structuration and relatedness between inbred lines displayed by SNPs or by InDels were highly similar suggesting that almost all indels and SNPs followed a similar evolutionary trajectory. 51% of InDels were not in high linkage disequilibrium (LD>0.8) with any nearby SNP suggesting that the effect of these InDels was not be well captured using this density of SNP. Thanks to InDels, we detected 13 new quantitative trait loci (QTLs) among 294 QTLs identified for 23 traits by a genome wide association studies (GWAS). Similarly, 56 out 188 regions under selection between tropical, dent and flint maize lines were identified by InDels leading to an enrichment of genomic regions under selection detected by InDels compared to SNPs. These InDels include genes involved in tolerance to biotic and abiotic stress and/or adaptive traits as flowering time. Accordingly, the highest number of associated InDels was found for flowering time. These results suggest that InDels were often involved in adaptation and stress tolerance. In order to study the effect of InDels on hybrid performances, we analyzed a panel of 287 hybrids derived from the crossing of 210 maize temperate inbred lines from the previous panel. We decomposed the variance of female flowering (FF), plant height (PH) and grain yield (GY) by distinguishing the additive and dominant genetic effects. We observed the highest dominance and genotype by environment effects for GY and the lowest for FF. We performed GWAS on this panel by testing additive and dominance effects of 51,844 InDels and 469,267 SNPs on these three traits in 4 different environment combinations. We identified 78 and 133 QTLs with an additive and dominance effect, respectively including 6 and 11 QTLs discovered only by InDels. 83% of all QTLs were found with only one environment combination. One QTL for GY detected with InDels was located in a large cluster of InDels on chromosome 6, previously identified to have a strong effect on GY in heat conditions. We finally used InDels and/or SNPs genotyping to predict hybrid performances. Whereas including a dominance effect in genomic prediction models increased by 1.5 to 5.6% predictive abilities (PA) for GY, including InDels genotyping did not increased PA. Maïs Variations structurales Insertions Délétions Génétique d'association Génotypage Maize Structural variations Insertions Deletions Genome wide association studies Genotyping
3	Identification of causal factors for recessive lethals in dairy cattle with special focus on large chromosomal deletions / Etude de délétions chromosomiques et de variants génétiques responsables de mortalité embryonnaire chez les bovins laitiers Uddin, Md Mesbah 17 September 2019 (has links) L'objectif général de cette thèse est d'identifier les variants causaux ou, à défaut, un ensemble de marqueurs prédictifs - qui présentent un déséquilibre de liaison élevé avec les variants causaux - pour la fertilité des vaches laitières. Nous avons abordé cet objectif général dans cinq articles: (i) décrit une approche systématique de cartographie des variants létaux récessifs chez les bovins Normands français basée sur la recherche de déficit en haplotypes homozygotes (HHD). Cette étude montre l’influence de la taille de l’échantillon, de la qualité des génotypes, de la qualité du phasage des génotypes en haplotypes et de l’imputation, de l’âge de l’haplotype et enfin, de la définition des seuils de signification prenant en compte les tests multiples, sur la découverte et la reproductibilité des résultats de HHD. Elle illustre également l’importance de la cartographie fine avec les données de généalogie et de séquence de génome entier (WGS), l’annotation intégrative (entre espèces) pour hiérarchiser les mutations candidates et, enfin, le génotypage à grande échelle de la mutation candidate, pour valider ou invalider les mutations initiales. (ii) décrit une cartographie à haute résolution de grandes délétions chromosomiques de séquences du génome dans une population de 175 animaux appartenant à trois races laitières nordiques. Cette étude utilise trois approches différentes pour valider les résultats de la cartographie. Le chapitre décrit les propriétés génétiques des populations et l’importance fonctionnelle des délétions identifiées. (iii) traite de trois questions liées à l’imputation de variants structuraux, ici de délétions chromosomiques importantes: la disponibilité des génotypes de délétion, la taille du panel de référence d'haplotypes et, enfin, l’imputation elle-même. Pour aborder les deux premières questions, cette étude décrit une approche basée sur un modèle de mélange gaussien dans laquelle les données de profondeur de lecture provenant de fichiers au format VCF (variant call format) sont utilisées pour génotyper un locus de délétion connu, en l’absence d’information sur la séquence brute. Enfin, il présente un pipeline pour l'imputation conjointe de variants WGS et de grandes délétions chromosomiques. (iv) décrit des études d'association pangénomiques de la fertilité femelle dans trois races de bovins laitiers nordiques à l'aide de variants WGS imputés et de grandes délétions chromosomiques. Cette étude concerne huit caractères de fertilité et utilise des analyses d'association mono-marqueur, conditionnelles et conjointes. Cette étude montre qu’une surestimation, ou « inflation », des statistiques de test peut être observée même après correction pour la stratification de la population à l'aide de composantes principales génomiques et pour les structures familiales à l'aide de matrices de relations génomiques. Ce biais était connu pour les caractères très polygéniques. Enfin, cette étude présente plusieurs locus de traits quantitatifs (QTL) nouveaux et confirme plusieurs autres déjà connus. Elle souligne également l’importance d’inclure les grandes délétions (imputées) pour la cartographie par association des caractères de fertilité. (v) décrit la prédiction des valeurs génomiques de fertilité (ou indice de fertilité) à l'aide de génotypes à puces SNP, de QTL sélectionnés et de délétions chromosomiques importantes. En utilisant la méthode de meilleure prédiction linéaire sans biais génomique (GBLUP) avec une ou plusieurs matrices de relations génomiques dérivées d'un ensemble de marqueurs sélectionnés, cette étude rapporte une précision de prédiction améliorée. Cette étude met également en évidence l’influence de la sélection des marqueurs les plus prédictifs, en particulier pour une race ayant une population d’apprentissage réduite, sur la précision des prédictions génomiques. Enfin, les résultats démontrent que les grandes délétions ont en général un pouvoir prédictif élevé. / The overall aim of this PhD thesis is to identify causal variants for recessive lethal mutations and select a set of predictive markers that are in high linkage-disequilibrium with the causal variants for female fertility in dairy cattle. We addressed this broad aim under five articles: (i) describes a systematic approach of mapping recessive lethals in French Normande cattle using homozygous haplotype deficiency (HHD). This study shows the influence of sample size, quality of genotypes, quality of (genotype) phasing and imputation, age of haplotype (of interest), and last but not the least, multiple testing corrections, on discovery and replicability of HHD results. It also illustrates the importance of fine-mapping with pedigree and whole-genome sequence (WGS) data, (cross-species) integrative annotation to prioritize candidate mutation, and finally, large-scale genotyping of the candidate mutation, to validate or invalidate initial results. (ii) describes a high-resolution population-scale mapping of large chromosomal deletions from whole-genome sequences of 175 animals from three Nordic dairy breeds. This study employs three different approaches to validate identified deletions. Next, it describes population genetic properties and functional importance of these deletions. (iii) deals with three main issues related to imputation of structural variants, in this case, large chromosomal deletions, e.g. availability of deletion genotypes, size of haplotype reference panel, and finally, imputation itself. To address the first two issues, this study describes a Gaussian mixture model-based approach where read-depth data from the variant call format (VCF) file is used to genotype a known deletion locus, without the need for raw sequence (BAM) file. Finally, it presents a pipeline for joint imputation of WGS variants along with large chromosomal deletions. (iv) describes genome-wide association studies for female fertility in three Nordic dairy cattle breeds using imputed WGS variants including large chromosomal deletions. This study is based on the analyses of eight fertility related traits using single-marker association, conditional and joint analyses. This study illustrates that inflation in association test-statistics could be seen even after correcting for population stratification using (genomic) principal components, and relatedness among the samples using genomic relationship matrices; however, this was known for traits with strong polygenic effects, among other factors. Finally, mapping of several new quantitative trait loci (QTL), along with the previously known ones, are reported in this study. This study also highlights the importance of including (imputed) large deletions for association mapping of fertility traits. (v) describes prediction of genomic breeding values for fertility using SNP array-chip genotypes, selected QTL and large chromosomal deletion. Using genomic best linear unbiased prediction (GBLUP) method with one or several genomic-relationship matrices derived from a set of selected markers, this study reports higher prediction accuracy compared with previous report. This study also highlights the influence of selecting markers with best predictability, especially for a breed with small training population, in accuracy of genomic prediction. The results demonstrate that large deletions in general have a high predictive performance. Mortalité embryonnaire Variations structurales Bovins laitiers Sélection génomique Recessive lethal Structural variants Dairy cattle Genomic prediction 636.0821
4	Variations structurales du génome et du transcriptome humains induites par les rétrotransposons LINE-1 / Structural variations of the human genome and transcriptome induced by LINE-1 retrotransposons Mir, Ashfaq Ali 04 December 2015 (has links) Les rétrotransposons sont des éléments génétiques mobiles qui constituent presque la moitié de notre génome. Seule la sous-famille L1HS appartenant à la classe des Long Interspersed Element-1(LINE-1 ou L1) a gardé une capacité de mobilité autonome chez l’Homme. Leur mobilisation dans la lignée germinale, mais Aussi dans certains tissus somatiques, contribue à la diversité du génome humain ainsi qu’à certaines maladies comme le cancer. Ainsi, de nouvelles copies de L1 peuvent directement s'intégrer dans des séquences codantes ou régulatrices, et altérer leur fonction. De plus, les séquences L1 contiennent elles-mêmes plusieurs éléments cis-régulateurs et leur insertion à proximité ou dans un gène peut produire des altérations génétiques plus subtiles. Afin d'explorer l'ensemble de ces altérations à l'échelle du génome, nous avons développé un logiciel dédié à l’analyse des données de séquençage d'ARN qui permet d'identifier des transcrits chimériques ou antisens impliquant les L1 et d'annoter ces isoformes en fonction des différents événements d’épissage alternatif subits. Au cours de ce travail, il est apparu que la compréhension du lien entre polymorphisme des insertions et phénotype nécessite une vue complète des différentes copies L1HS présentes chez un individu donné. Afin de disposer d'un catalogue aussi complet que possible de ces polymorphismes identifiés dans des échantillons humains sains ou pathologiques et publiés dans des journaux scientifiques, nous avons développé euL1db, la base de données des insertions de rétrotransposon L1HS chez l’Homme. En conclusion, ce travail aidera à comprendre l’impact des L1 sur l’expression des gènes, à l'échelle du génome. / Retrotransposons are mobile genetics elements, which form almost half of our genome. Only the L1HS subfamily of the Long Interspersed Element-1 class (LINE-1 or L1) has retained the ability to jump autonomously in humans. Their mobilization in the germline – but also in some somatic tissues – contributes to human genetic diversity and to diseases, such as cancer. L1 reactivation can be directly mutagenic by disrupting genes or regulatory sequences. In addition, L1 sequences themselves contain many regulatory cis-elements. Thus, L1 insertions near a gene or within intronic sequences can also produce more subtle genic alterations. To explore L1-mediated genic alterations in a genome-wide manner, we have developed a dedicated RNA-seq analysis software able to identify L1 chimeric or antisense transcripts and to annotate these novel isoforms with their associated alternative splicing events. During the course of this work, it appeared that understanding the link between L1HS insertion polymorphisms and phenotype or disease requires a comprehensive view of the different L1HS copies present in a given individual or sample. To provide a comprehensive summary of L1HS insertion polymorphisms identified in healthy or pathological human samples and published in peer-reviewed journals, we developed euL1db, the European database of L1HS retrotransposon insertions in humans. This work will help understanding the overall impact of L1 insertions on gene expression, at a genome-wide scale. Rétrotransposons Transcription antisens Transcrits chimériques Séquençage d'ARN Génomique ARN non-codant Épissage alternaif Variations structurales Bioinformatique Retrotransposons Antisense transcription Chimeric transcripts RNA-seq Genomics Noncoding RNA Alternative splicing Structural variations Bioinformatics

1

Page generated in 0.1074 seconds