41 |
Les enjeux soulevés par la pharmacogénomique revisités à la lumière de la responsabilité telle qu'envisagée par Paul RicoeurGagnon, Jacynthe January 2004 (has links)
Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.
|
42 |
Génomique des Flavivirus : Contribution à l'analyse taxonomique et phylogéniqueMoureau, Grégory 17 January 2012 (has links)
Les virus à ARN - à l'exception des rétrovirus - représentent plus de 200 pathogènes humains et/ou vétérinaires majeurs. Ils sont pour la plupart considérés comme émergents, durant les dernières années ils ont été retrouvés au-delà de leur territoire d'origine, dans de nouvelles régions du monde. Les plus connus de ces virus sont le virus du West Nile, le virus chikungunya, la grippe, le coronavirus SRAS, l'entérovirus 71 (agent responsable de la fièvre aphteuse), les virus de la dengue, l'hépatite C virus, le virus de la fièvre hémorragique de Crimée Congo, le virus de la vallée du Rift, l'encéphalite japonaise et plusieurs entérovirus humains. En terme de mortalité et morbidité ils sont à l'origine de plus 100 millions de cas par an et la menace a tendance à augmenter. Ces statistiques sont démoralisantes quand on considère les immenses progrès de la médecine et de la science durant ces dernières dizaines d'années. Les recherches présentées dans ma thèse portent sur le genre Flavivirus, au sein duquel on retrouve le virus de la fièvre jaune, un pathogène humain responsable d'épidémies majeures en Afrique et en Amérique latine durant les 300 à 400 dernières années. Ce virus est toujours responsable d'épidémies majeures en Afrique malgré un vaccin très bien toléré et des plus efficaces. On assiste au même scénario avec le virus de l'encéphalite japonaise en Inde. / Without including the retroviruses, there are in excess of 200 RNA viruses that are recognised human and/or animal pathogens, many of which are considered to be emerging viruses because during recent years they have dispersed beyond their original territories causing epidemics in new regions of the World. The more well known of these emerging viruses include, West Nile virus, chikungunya virus, influenza virus, SARS coronavirus, EV71 virus (the aetiological agent of hand foot and mouth disease), dengue virus, hepatitis C virus, Crimean Congo haemorrhagic fever virus, Rift Valley fever virus, Japanese encephalitis virus and many human enteroviruses from a variety of genera. The combined global morbidity and mortality figures for these viruses add up to 100s of millions per year and the current trend appears to be upwards. This is a depressing statistic when one considers the amazing medical and scientific achievements that we have witnessed during the past decades. The studies described in my thesis were focused on the genus Flavivirus the type species of which is yellow fever virus, another terrifyingly virulent human pathogen that has caused so much suffering in Africa and Latin America during the past 300 to 400 years. This virus continues to cause major epidemics in Africa despite the availability of one of the safest and most effective vaccines with which to control infections due to yellow fever virus. Indeed similar comments can be made in the context of the flavivirus Japanese encephalitis virus in India.
|
43 |
Analyse génomique intégrée du cancer colique et impact thérapeutique / Integrated genomics analysis of colon cancer and therapeutic impactLaibe, Sophy 17 December 2013 (has links)
Le cancer du côlon (CC) est le 3ème cancer le plus fréquent en France avec plus de 40 000 nouveaux cas diagnostiqués par an. Vingt-cinq à 40% des CC sont diagnostiqués à un stade II. La majorité des CC de stade II ne nécessite pas de traitement adjuvant par chimiothérapie, cependant, environ 20% de ces patients vont évoluer avec l'apparition de métastases viscérales. Or, seuls les facteurs histopathologiques ou la détermination du statut avec instabilité des microsatellites (type MSI) permettent d’orienter ou non vers une chimiothérapie complémentaire à la chirurgie. La majorité des CC de stade II ont un profil avec stabilité des microsatellites (type MSS) et les facteurs pronostiques actuels sont mal définis. La découverte de marqueurs pronostiques pour ces patients est donc un enjeu majeur de la prise en charge du CC. De cette façon, notre équipe a mis en évidence l’existence d’une signature moléculaire sur 166 tumeurs, portant sur l’expression différentielle de 7 gènes, entre les tumeurs de CC de stade II et les tumeurs de CC de stade III. Ensuite, le statut mutationnel des gènes KRAS et BRAF, effectué sur 803 CC métastatiques, a mis en évidence que la mutation BRAF V600E est principalement associée au CC de type MSS suggérant un impact pronostique négatif. Enfin, l’étude du statut du gène APC (mutations, LOH, hyperméthylation du promoteur) sur 183 CC de stade II montre que ce gène n’est vraisemblablement pas impliqué dans le développement de métastases du CC. En perspective de ce travail, l’arrivée de techniques de séquençage de nouvelle génération permet d’envisager un traitement adapté à la tumeur, orientant vers une médecine personnalisée. / Colon cancer (CC) is the third most common cancer in France with 40000 new cases diagnosed every year. For thirty years, death-rate has decreased through better therapeutic and screening management, and 40% of CC are diagnosed of stage II. Most of stage II CC do not require chemiotherapy adjuva,t to surgical resection. About 20% of patients with stage II CC relapse within 5 years following the diagnosis. Except microsatelitte instability (MSI) incombination with few hispathologic parameters, the molecular prognosis factors are not well defined and remain a major biological challenge in stage II CC. Our study analyzed the molecular signature of 166 tumors and determined the different expression of seven genes between stage II and stage III CC. KRAS and BRAF mutations were determined on 803 metastatic CC showing an association between V600E BRAF mutation and tumors with microsatellite stability (MSS). This result suggests a negative prognostic impact of BRAF mutation in MSS CC. Finally, the APC gene statut (mutations, LOH, promoter hypermethylation) of 183 stage II CC shows that this gene is probably not involved in the metastatic process. Further developments will consist in applying the next generation sequencing to allow the simultaneous analysis of hundreds target genes. In this way, the treatment will be adapted to each tumor, moving towards personalized medicine.
|
44 |
Analyses bioinformatiques et classements consensus pour les données biologiques à haut débit / Bioinformatics analysis and consensus ranking for biological high throughput dataYang, Bo 30 September 2014 (has links)
Cette thèse aborde deux problèmes relatifs à l’analyse et au traitement des données biologiques à haut débit: le premier touche l’analyse bioinformatique des génomes à grande échelle, le deuxième est consacré au développement d’algorithmes pour le problème de la recherche d’un classement consensus de plusieurs classements.L’épissage des ARN est un processus cellulaire qui modifie un ARN pré-messager en en supprimant les introns et en raboutant les exons. L’hétérodimère U2AF a été très étudié pour son rôle dans processus d’épissage lorsqu’il se fixe sur des sites d’épissage fonctionnels. Cependant beaucoup de problèmes critiques restent en suspens, notamment l’impact fonctionnel des mutations de ces sites associées à des cancers. Par une analyse des interactions U2AF-ARN à l’échelle génomique, nous avons déterminé qu’U2AF a la capacité de reconnaître environ 88% des sites d’épissage fonctionnels dans le génome humain. Cependant on trouve de très nombreux autres sites de fixation d’U2AF dans le génome. Nos analyses suggèrent que certains de ces sites sont impliqués dans un processus de régulation de l’épissage alternatif. En utilisant une approche d’apprentissage automatique, nous avons développé une méthode de prédiction des sites de fixation d’UA2F, dont les résultats sont en accord avec notre modèle de régulation. Ces résultats permettent de mieux comprendre la fonction d’U2AF et les mécanismes de régulation dans lesquels elle intervient.Le classement des données biologiques est une nécessité cruciale. Nous nous sommes intéressés au problème du calcul d’un classement consensus de plusieurs classements de données, dans lesquels des égalités (ex-aequo) peuvent être présentes. Plus précisément, il s’agit de trouver un classement dont la somme des distances aux classements donnés en entrée est minimale. La mesure de distance utilisée le plus fréquemment pour ce problème est la distance de Kendall-tau généralisée. Or, il a été montré que, pour cette distance, le problème du consensus est NP-difficile dès lors qu’il y a plus de quatre classements en entrée. Nous proposons pour le résoudre une heuristique qui est une nouvelle variante d’algorithme à pivot. Cette heuristique, appelée Consistent-pivot, s’avère à la fois plus précise et plus rapide que les algorithmes à pivot qui avaient été proposés auparavant. / It is thought to be more and more important to solve biological questions using Bioinformatics approaches in the post-genomic era. This thesis focuses on two problems related to high troughput data: bioinformatics analysis at a large scale, and development of algorithms of consensus ranking. In molecular biology and genetics, RNA splicing is a modification of the nascent pre-messenger RNA (pre-mRNA) transcript in which introns are removed and exons are joined. The U2AF heterodimer has been well studied for its role in defining functional 3’ splice sites in pre-mRNA splicing, but multiple critical problems are still outstanding, including the functional impact of their cancer-associated mutations. Through genome-wide analysis of U2AF-RNA interactions, we report that U2AF has the capacity to define ~88% of functional 3’ splice sites in the human genome. Numerous U2AF binding events also occur in other genomic locations, and metagene and minigene analysis suggests that upstream intronic binding events interfere with the immediate downstream 3’ splice site associated with either the alternative exon to cause exon skipping or competing constitutive exon to induce inclusion of the alternative exon. We further build up a U2AF65 scoring scheme for predicting its target sites based on the high throughput sequencing data using a Maximum Entropy machine learning method, and the scores on the up and down regulated cases are consistent with our regulation model. These findings reveal the genomic function and regulatory mechanism of U2AF, which facilitates us understanding those associated diseases.Ranking biological data is a crucial need. Instead of developing new ranking methods, Cohen-Boulakia and her colleagues proposed to generate a consensus ranking to highlight the common points of a set of rankings while minimizing their disagreements to combat the noise and error for biological data. However, it is a NP-hard questioneven for only four rankings based on the Kendall-tau distance. In this thesis, we propose a new variant of pivot algorithms named as Consistent-Pivot. It uses a new strategy of pivot selection and other elements assignment, which performs better both on computation time and accuracy than previous pivot algorithms.
|
45 |
Analyse intégrative génomique et épigénomique de tumeurs hypophysaires à prolactine / Genomics and epigenomics integrative analysis of prolactin pituitary tumorsRoche, Magali 19 December 2013 (has links)
De nombreux modèles ont été proposés pour expliquer les mécanismes de développement et de progression tumorale, néanmoins certains aspects comme la nature et la hiérarchie des altérations primaires et secondaires sont encore discutés. Pour répondre à ces questions, nous nous sommes intéressés à la progression tumorale des tumeurs hypophysaires à prolactine humaines. Ces tumeurs d'origine monoclonale sont souvent bénignes mais certaines présentent un phénotype agressif voire malin. Afin d'identifier les mécanismes impliqués dans la progression vers le phénotype agressif nous avons utilisé des techniques de génomique intégrative (puces à ADN, séquençage haut débit) couplant l'étude du transcriptome, du génome (variation du nombre de copie chromosomique, polymorphismes) et du miRNome à partir des mêmes échantillons tumoraux. Par cette stratégie nous avons identifié et hierarchisé des altérations spécifiques des tumeurs agressives et / ou malignes dans un modèle expliquant la progression tumorale des tumeurs hypophysaires à prolactine humaines. Nous avons montré que la sous-expression des microARNs miR-183, miR-744 et miR-98 stimule la prolifération via la surexpression de leurs cibles KIAA0101, TGFB1 et E2F2 spécifiquement dans les tumeurs agressives. Ceci entraine l'acquisition d'altérations chromosomiques (perte du chromosome 11 et le gain du chromosome 1q) permettant l'activation de la dissémination métastatique. Enfin, ce travail montre que l'approche de génomique intégrative multidimensionnelle permet d'apporter de nouveaux éléments pour la caractérisation des phénotypes tumoraux, le diagnostic des tumeurs agressives et la prédiction du comportement tumoral / Numerous models have been proposed to explain the mechanisms of tumor development and progression. Nevertheless some aspects such as the nature and hierarchy of primary and secondary alterations are still debated. To answer these questions, we decided to focus on the tumoral progression of human prolactin pituitary tumors. These monoclonal tumors are usually benign but some present an aggressive or malignant phenotype. To identify the molecular events involved in tumoral progression of human PRL towards aggressive phenotype we used an integrative genomics approach (microarrays, high-throughput sequencing) coupling analysis of transcriptome, genome (variation in the number of chromosomal copy polymorphisms) and miRNome from the same human tumor. Using this strategy we identified and prioritized specific alterations of aggressive and / or malignant tumors in a model explaining the tumor progression of human prolactin pituitary tumors. We have shown that under-expression of micro-RNA miR-183, miR-744 and miR-98 stimulates proliferation through overexpression of their targets KIAA0101, TGFB1 and E2F2 specifically in aggressive tumors. This leads to the acquisition of chromosomal damage (loss of chromosome 11 and gain of chromosome 1q) which allowed the activation of the metastatic processes. Finally, this work shows that the integrative genomic multi-dimensional approach can provide new clues for the characterization of tumor phenotypes, diagnosis of aggressive tumors and prediction of tumor behavior
|
46 |
Heterochromatin dynamics upon release from stationary phase in budding yeast / La reprogrammation de l'hétérochromatine à la sortie de la phase stationaire chez la levure bourgeonnanteGalic, Hrvoje 29 May 2019 (has links)
La complexe protéique Sir (Silent Information Regulator) de la levure bourgeonnante est l’acteur principal dans la formation de l’hétérochromatine, qui provoque l’atténuation de l’expression génique par un mécanisme épigénétique. Le complexe Sir lié à la chromatine maternelle est démonté lors de la réplication génomique et puis réformé sur les deux brins nouvellement répliqué. La dynamique de maintien de Sir sur la chromatine pendant le cycle cellulaire et dans de variables conditions de croissance n’est pas bien comprise. Pour comprendre comment la structure chromatinienne telle que l’hétérochromatine peut être héritée et par conséquent comment les structures épigénétiques sont transmises d’une génération cellulaire à l’autre, nous avons besoin de mesurer la vitesse d’échange des sous-unités du complexe Sir au cours du cycle cellulaire dans différentes conditions de croissance. Nous avons donc utilisé le système RITE qui permet d’échanger deux épitopes attachés à Sir3 (une des sous-unités de Sir) et par la suite mesurer la cinétique de remplacement de Sir3. Nous avons constaté que la Sir3 maternelle est complètement remplacée par la Sir3 nouvellement synthétisées dans les régions télomériques durant le premier cycle cellulaire après la sortie de la phase stationnaire. Nous proposons que cette reprogrammation du complexe hétérochromatique est un mécanisme d’adaptation qui assure l’activation des gènes de réponse au stress par la déstabilisation transitoire de la structure hétérochromatinienne. / The budding yeast SIR complex (Silent Information Regulator) is the principal actor in heterochromatin formation, which causes epigenetically regulated gene silencing phenotypes. The maternal chromatin bound SIR complex is disassembled during replication and then, if heterochromatin is to be restored on both daughter strands, the SIR complex has to be reformed on both strands to pre-replication levels. The dynamics of SIR complex maintenance and re-formation during the cell-cycle and in different growth conditions are however not clear. Understanding exchange rates of SIR subunits during the cell cycle and their distribution pattern to daughter chromatids after replication has important implications for how heterochromatic states may be inherited and therefore how epigenetic states are maintained from one cellular generation to the next. We therefore used the tag switch RITE system to measure genome wide turnover rates of the SIR subunit Sir3 before and after exit from stationary phase and show that maternal Sir3 subunits are completely replaced with newly synthesized Sir3 at subtelomeric regions during the first cell cycle after release from stationary phase. We propose that the observed “reset” of the heterochromatic complex is an adaptive mechanism that ensures the activation of subtelomeric stress response genes by transiently destabilizing heterochromatin structure.
|
47 |
Bioinformatic analysis of the genomes of epidemic pseudomonas aeruginosa / Analyse bioinformatique des génomes d'une souche épidémique de pseudomonas aeruginosaTreepong, Panisa 10 October 2017 (has links)
Le Pseudomonas aeruginosa est un pathogène nosocomial majeur. Le clone ST235 est le plus prévalent des clones internationaux dits à hautris que. Ce clone est très fréquemment multi résistant aux antibiotiques, ce qui complique la prise en charge des infections dont il est à l’origine.Malgré son importance clinique, la base moléculaire Du succès du clone ST235 n’est pas comprise.Dans ce travail, nous avons cherché à comprendre l’origine spacio temporelle de ce clone et les bases moléculaires de son succès. A l’aide d’outils bio informatiques existants ,nous avons trouvé que le clone ST235 a émergé en Europe en 1984 et que tous les isolates ST235 produisent l’exotoxine ExoU. Nous avons également identifié 22 gènes Contigus spécifiques de ce clone et impliqués dans l’efflux transmembranaire, dans le traitement de l’ADN et dans la transformation bactérienne. Cette combinaison unique de gènes a pu contribuer à la gravité des infections dues à ce clone et à sa capacité à acquérir des gènes de résistance aux antibiotiques. Ainsi, la diffusion mondiale de ce clone a probablement été favorisée par l’utilisation extensive des fluoroquinolones, puis il est de venu localement résistant aux amino glycosides, aux β-lactamines, et aux carbapénèmes par mutation et acquisition d’éléments de résistance. Nous avons majoritairement utilisé des outils existants,mais avons découvert que les programmes de détection des séquences d’insertions (IS, ayant un rôle important dans l’évolution des génomes bactériens) ne sont pas adaptés aux données dont nous disposions. Nous avons ainsi mis au point un outil (appelé panISa) qui détecte de façon précise et sensible les IS à partir de données brutes de séquençage de génomes bactériens. / Pseudomonas aeruginosa is a major nosocomial pathogen with ST235 being the most prevalent of the so-called ‘international’ or ‘high-risk’ clones. This clone is associated with poor clinical outcomes in part due to multi- and high-level antibiotic resistance. Despite its clinical importance, the molecular basis for the success of the ST235 clone is poorly understood. Thus this thesis aimed to understand the origin of ST235 and the molecular basis for its success, including the design of bioinformatics tools for finding insertion sequences (IS) of bacterial genomes.To fulfill these objectives, this thesis was divided into 2 parts.First, the genomes of 79 P. aeruginosa ST235 isolates collected worldwide over a 27-year period were examined. A phylogenetic network was built using Hamming distance-based method, namely the NeighborNet. Then we have found the Time to the Most Recent Common Ancestor (TMRCA) by applying a Bayesian approach. Additionally, we have identified antibiotic resistance determinants, CRISPR-Cas systems, and ST235-specific genes profiles. The results suggested that the ST235 sublineage emerged in Europe around 1984, coinciding with the introduction of fluoroquinolones as an antipseudomonal treatment. The ST235 sublineage seemingly spreads from Europe via two independent clones. ST235 isolates then appeared to acquire resistance determinants to aminoglycosides, β-lactams, and carbapenems locally. Additionally, all the ST235 genomes contained the exoU-encoded exotoxin and identified 22 ST235-specific genes clustering in blocks and implicated in transmembrane efflux, DNA processing and bacterial transformation. These unique genes may have contributed to the poor outcome associated with P. aeruginosa ST235 infections and increased the ability of this international clone to acquire mobile resistance elements.The second part was to design a new Insertion Sequence (IS) searching tool on next-generation sequencing data, named panISa. This tool identifies the IS position, direct target repeats (DR) and inverted repeats (IR) from short read data (.bam/.sam) by investigating only the reference genome (without any IS database). To validate our proposal, we used simulated reads from 5 species: Escherichia coli, Mycobacterium tuberculosis, Pseudomonas aeruginosa, Staphylococcus aureus, and Vibrio cholerae with 30 random ISs. The experiment set is constituted by reads of various lengths (100, 150, and 300 nucleotides) and coverage of simulated reads at 20x, 40x, 60x, 80x, and 100x. We performed sensitivity and precision analyses to evaluate panISa and found that the sensitivity of IS position is not significantly different when the read length is changed, while the modifications become significant depending on species and read coverage. When focusing on the different read coverage, we found a significant difference only at 20x. For the other situations (40x-100x) we obtained a very good mean of sensitivity equal to 98% (95%CI: 97.9%-98.2%). Similarly, the mean of DR sensitivity of DR identification is high: 99.98% (95%CI: 99.957%-99.998%), but the mean of IR sensitivity is 73.99% (95%CI: 71.162%-76.826%), which should be improved. Focusing on precision instead of sensibility, the precision of IS position is significantly different when changing the species, read coverage, or read length. However, the mean of each precision value is larger than 95%, which is very good.In conclusion, P. aeruginosa ST235 (i) has become prevalent across the globe potentially due to the selective pressure of fluoroquinolones and (ii) readily became resistant to aminoglycosides, β-lactams, and carbapenems through mutation and acquisition of resistance elements among local populations. Concerning the second point, our panISa proposal is a sensitive and highly precise tool for identifying insertion sequences from short reads of bacterial data, which will be useful to study the epidemiology or bacterial evolution.
|
48 |
Caractérisation génomique et génétique des gliomes diffus de bas grade de l’adulte / Genomic and genetic characterisation of adult low-grade gliomasAlentorn, Agusti 10 March 2014 (has links)
La caractérisation moléculaire multidimensionnelle des tumeurs et des tumeurs gliales en particulier est une étape importante pour l’identification de biomarqueurs (diagnostique, pronostique, théranostique et/ou de prédisposition), pour l’identification de cibles thérapeutiques et pour une meilleure compréhension de l’oncogénèse moléculaire.Nos travaux ont permis de confirmer et de consolider certaines données de la littérature comme par exemple : (i) la valeur pronostique favorable de la codélétion 1p/19q, (ii) la valeur pronostique favorable de la mutation IDH, (iii) le caractère mutuellement exclusive des mutations TP53 et de la codélétion 1p/19q et (iv) la rareté des altérations génétiques du PDGFRA dans les gliomes de bas grade (GDBG). De manière plus originale, nous avons identifié plusieurs sous-groupes génomiques de GDBG pertinents sur le plan clinico-biologique, notamment au sein des GDBG non 1p/19q codélétés : (i) 19q-délété ; (ii) 11p-délété, (iii) 7-gagné, (iv) 19-gagné et (v) inclassés. La perte du bras chromosomique 19q annule la valeur pronostique favorable de la mutation IDH dans les GDBG non 1p/19q codélétés. Nous avons également identifié des mutations géniques originales dans les GDBG (i.e. mutation TEP1 et RNF40) qui renforcent le rôle des télomères et du remodelage de la chromatine au sein des GDBG.Enfin, nous nous sommes concentrés sur la caractérisation des GDBG 11p-délétés qui sont de phénotype majoritairement astrocytaire et de moins bon pronostic. Ces GDBG surexpriment des gènes des cellules immunitaires (les GIM -Glioma infiltrating microglia-, les macrophages de type 1, les macrophages de type 2) et sont infiltrés par des cellules macrophagiques et microgliales. Ce microenvironnement dérégulé peut constituer une cible thérapeutique au sein des GDBG 11p-délétés. En conclusion, nos travaux participent à la dissection clinico-moléculaire des GDBG et à préciser la biologie d’un sous-type de GDBG caractérisé la perte du bras chromosomique 11p. / Multildimensional molecular characterization of tumors and more specifically of gliomas is of pivotal importance to identify: (i) new biomarkers (i.e. diagnostic, prognostic, theranostic or predisposing), (ii) new therapeutic targets and (iii) to improve our understanding of molecular oncogenesis.Our work has confirmed and consolidated previous data published in the literature, for example that: (i) 1p/19q co-deletion is associated with better prognosis, (ii) IDH mutation is associated with better prognosis, (iii) TP53 mutations and 1p/19q codeletion are mutually exclusive and (iv) PDGFRA is rarely altered, at genomic level, in low-grade gliomas (LGG).More originally, we have identified several genomic groups, with clinical and biological relevances, in LGG and more specifically in LGG without 1p/19q co-deletion: (i) 19q-deleted, (ii) 11p-deleted, (iii) 7-gained, (iv) 19-gained and (v) unclassified. Interestingly, 19q deletion abrogates the positive prognostic value of IDH mutation in LGG without 1p/19q codeletion.We have also identified new recurrent somatic gene mutations in LGG (i.e. TEP1 and RNF40 mutations), supporting the critical role of telomeres and chromatin remodelling in LGG.Finally, we have characterized further 11p-deleted LGG that exhibit mostly astrocytic phenotype and poor prognosis. This subgroup includes LGG overexpressing genes of inflammatory/immune cells (GIM -Glioma infiltrating microglia-, M1 macrophages and M2 macrophages) and infiltrated by macrophagic/microglial cells. This peculiar microenvironment detected in 11p-deleted LGG might be used as a therapeutic target. In conclusion, our work participates to characterize clinico-biological portrait of LGG and to describe a singular genomic subgroup of LGG characterized by 11p loss.
|
49 |
Génomique des populations : étude comparative au sein du sous-phylum des Saccharomycotina / Population genomics : comparative study within the Saccharomycotina subphylumGounot, Jean-Sébastien 21 September 2018 (has links)
Les améliorations des technologies de séquençage offrent aujourd’hui la possibilité d’explorer la variabilité intraspécifique au sein d’une espèce à travers le séquençage complet du génome d’un grand nombre d’individus. Dans ce contexte, mes travaux de thèse se sont basés sur l’étude et la comparaison de la variabilité génomique à travers des études de génomique des populations au sein de plusieurs espèces de levures. Dans un premier temps, j’ai réalisé une étude systématique de la variabilité intraspécifique au sein de 6 espèces de levures, me donnant notamment la possibilité d’étudier la variabilité du contenu en gènes entre les espèces. Dans un second temps, je me suis focalisé sur l’utilisation des dernières technologies de séquençage dans l’objectif de produire une séquence de référence de Dekkera bruxellensis, dont l’absence pour un grand nombre d’espèces limite l’établissement d’étude de génomique des populations. Cette séquence a été utilisée dans un dernier temps afin d’étudier l’évolution de l’espèce. Dans l’ensemble, ces travaux apportent de solides fondations dans l’exploration de la diversité génétique au sein d’espèces non-modèles. / Advent of high throughput technologies as well as the reduction of their price open the way to the exploration of the intraspecific genetic variation at the species level by sequencing the complete genome of a wide range of individuals. Doing so, I first produced populations genomics studies of 6 yeast species based on the same framework, allowing the exploration and comparison of the genes repository of each species. I then used new sequencing technologies to produce a reference sequence for the yeast species Dekkera bruxellensis. Using this sequence, I was then able to produce for the first time a population genomic study at the genome wide scale for this species.
|
50 |
Insertion de la sélection génomique dans un processus de sélection variétale : application à un oléoprotéagineux, le soja / Insertion of genomic selection in a varietal selection process : application to an oleoproteaginous crop, soybeanDuhnen, Alexandra 06 November 2017 (has links)
La sélection variétale a pour objectif la génération de variétés toujours plus performantes pour des caractères agronomiques d'intérêt. Pour les caractères quantitatifs, qui sont sous contrôle génétique polygénique, la sélection variétale consiste à réunir progressivement dans les nouvelles variétés des allèles favorables pour un maximum de gènes. Les processus de sélection évoluent, notamment par l'intégration des progrès concernant les connaissances génétiques et outils biotechnologiques. La sélection génomique est une méthode qui peut prédire la valeur génétique d'individus à partir de données génomiques et d'un modèle d'effets génétiques appris sur une population de référence. Nos études ont porté sur la possibilité d'insérer la sélection génomique dans le processus de sélection pour en augmenter l'efficacité. Notre sujet a été appliqué à un programme privé qui vise l'obtention de variétés de soja performantes pour le rendement et le contenu des graines en protéines, pour répondre à un besoin de protéines d'origine végétale. Des études génétiques sur une population de lignées générées lors de cycles de sélection successifs ont mis en évidence une structuration génétique en deux sous-populations qui ne sont pas "hermétiques". Nous avons étudié par échantillonnages de populations de test la précision de prédiction obtenue dans nos deux groupes avec différents modèles de GS : des modèles GBLUP additifs avec différentes populations d'apprentissage, puis des modèles d'architectures génétiques plus complexes. Les précisions de prédiction de nos modèles étaient proches les unes des autres. Cependant, nos résultats suggèrent que le modèle GBLUP le plus adapté pour obtenir des prédictions précises au sein de nos deux groupes est un modèle appris sur une population représentative du groupe à prédire et comprenant une composante additive et une composante épistatique additive x additive. Nous avons mis en place une application de la GS dans un cycle de sélection en cours de réalisation. Nous avons estimé le potentiel des croisements de départ par simulation de descendants virtuels et prédiction génomique de leurs performances, ce qui nous a permis de choisir trois populations biparentales prometteuses à l'intérieur desquelles nous avons effectué une sélection sur la base de prédictions génomiques. Nous avons développé un outil permettant de simuler des schémas de sélection sur plusieurs cycles consécutifs. Il s'agit d'un outil flexible et générique du point de vue de la définition des schémas de sélection. Cet outil permet notamment de comparer le gain génétique obtenu avec deux schémas différents à partir d'une même population de départ et d'un même modèle des effets génétiques et environnementaux agissant sur l'expression phénotypique d'un caractère. Avec cet outil, nous avons étudié la précision d'évaluation et les composantes de la variance de deux modèles GBLUP (avec ou sans modélisation de l'épistasie) après simulation de différentes architectures génétiques. Nous avons également comparé le schéma de sélection classique et différents schémas incluant une utilisation de la GS. Avec une comparaison sur un cycle, nous n'avons pas observé de gain à utiliser des schémas intégrant la GS pour augmenter l'efficacité de sélection de nouvelles variétés, à coût constant. Par contre, nous avons observé un gain à utiliser la GS pour choisir les croisements en début de cycle : la valeur génétique moyenne des lignées produites augmente de cycle en cycle. Concernant les alternatives au schéma de sélection classique du soja, des études plus approfondies seront nécessaires. Elles permettront notamment d'inclure la simulation des étapes de sélection sur le contenu des graines en protéines et d'étudier la question du gain génétique à long terme. / Varietal selection aims at the generation of increasingly more performing varieties for agronomic traits of interest. In the case of quantitative traits, which are under polygenic genetic control, varietal selection consists in gradually joining together in the new varieties favorable alleles for a maximum number of genes. Selection processes are evolving, in particular by integrating advances in genetic knowledge and biotechnological tools. Genomic selection is a method that can predict the genetic value of individuals from genomic data and a model of genetic effects learned on a reference population. Our studies have focused on the possibility of including genomic selection in the selection process to increase its efficiency. Our subject has been applied to a private program aimed at obtaining soybean varieties performing for yield and seed protein content to meet a need for proteins of plant origin. Genetic studies on a population of lines generated during successive breeding cycles have shown genetic structuration in two subpopulations that are not "hermetic". We studied by samplings of test populations the prediction accuracies obtained within our two groups with different GS models: additive GBLUP models with different learning populations, and then models of more complex genetic architectures. The prediction accuracies of our models were close to one another. However, our results suggest that the most suitable GBLUP model for obtaining accurate predictions within our two groups is a model learned on a population representative of the group to be predicted and including an additive component and an additive x additive epistatic component. We have implemented an application of GS in a selection cycle in progress. We evaluated the potential of initial crosses by simulation of virtual descendants and genomic prediction of their performances, which allowed us to select three promising biparental populations within which we made a selection based on genomic predictions. We have developed a tool to simulate selection schemes over several consecutive cycles. It is a flexible and generic tool from the point of view of selection schemes definition. This tool makes it possible, in particular, to compare the genetic gain obtained with two different schemes starting from a same starting population and from a same model of genetic and environmental effects acting on the phenotypic expression of a trait. With this tool, we studied evaluation accuracy and variance components of two GBLUP models (with or without epistasy modeling) after simulation of different genetic architectures. We also compared the classic selection scheme and different schemes including a use of GS. With a comparison on one cycle, we did not observe any gain in using schemes integrating GS to increase efficiency of selection of new varieties, at constant cost. On the other hand, we observed a gain in using GS to choose crosses at the beginning of cycle: mean genetic value of produced lines increases from one cycle to another. Regarding alternatives to the traditional soybean selection scheme, further studies will be required. In particular, they will include simulation of selection stages on seed protein content and study of long-term genetic gain.
|
Page generated in 0.0695 seconds