• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 35
  • 9
  • 6
  • 5
  • Tagged with
  • 71
  • 24
  • 22
  • 16
  • 15
  • 14
  • 13
  • 12
  • 11
  • 10
  • 9
  • 9
  • 8
  • 7
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
61

Viral metagenomics and phylogenomics for One Health

Silverj, Andrea 25 March 2024 (has links)
In recent years, the world has faced major health challenges, from the rise of antibiotic resistance to the emergence of new pathogens with pandemic potential. This highlights the importance of considering human health as inextricably intertwined with that of other animals and the environment in which they live. This paradigm is known as “One Health”, which is the integration of environmental sciences, veterinary science, and medicine. Within this perspective, viruses, the most abundant biological entities on Earth, play a central role in connecting different organisms, deeply influencing the health of their hosts. Despite their great importance, most viruses are still poorly understood, mainly because of the technical and economic limitations posed by isolation, cultivation, and single colony sequencing. However, recently developed genomic technologies offer a cheaper and more sensitive alternative to study viruses, allowing a better integration of data from various sources and making it possible to explore how they circulate among different hosts and environments. In this thesis, I hypotesise that, by combining different classes of genomic methods with One Health practices, it is possible to reveal much more of the entire picture of viral diversity and evolution that by simply using them in a separated way. I show that this is the case for each one of the scientific questions addressed in this work, which are organised in three main chapters: - In the second chapter I analysed 22 metatranscriptomes from tick samples from different parts of Italy, obtaining a set of 91 viral contigs for which I reconstructed the phylogeny, with the aim to identify the presence of possible pathogens and characterise the unexplored viral diversity in the country. This analysis not only clarified the molecular epidemiology of well-known pathogens such as Tick-borne encephalitis virus, but also allowed the discovery of at least 10 novel viral species. - In the third chapter, I investigated the origin and spread of West Nile virus, an emerging pathogen causing neurological disease worldwide. The goal was to expand the current knowledge of this virus by increasing the number of sequenced genomes and to reconstruct how the virus moved between Africa and Europe. Phylogeographic and phylodynamic methods showed that this pathogen originated in Africa and repeatedly invaded the European continent, revealing the dynamics of its evolution through space and time. - In the last chapter, I contributed to obtaining a set of DNA phages assembled from human microbiomes and viromes by manual curation and comparative genomics and developed a new approach to study their evolution in relation to their bacterial hosts. I found that the strength of co-phylogenetic patterns between viruses and their hosts is generally weak, suggesting that their ecological relationships emerge on short evolutionary timescales. Taken together, these results show how the integration of viral metagenomics and phylogenomics in One Health is essential to answer fundamental questions about the diversity of viruses and how they spread and evolve. Furthermore, the methods and protocols developed in these studies can be applied to similar cases, allowing a systematic exploration of many other datasets to expand our knowledge of the virosphere. This information can be used to implement containment strategies, public health policies, therapies, and biotechnologies.
62

The molecular phylogenomics of the Atyidae family / unveiling an ancient history among crustaceans

Chagas Bernardes, Samuel 30 September 2024 (has links)
Die Atyidae sind eine artenreiche Familie weit verbreiteter Süßwassergarnelen, zu der sowohl landumschlossene als auch amphidrome Arten gehören. Ein großer Teil der Atyidae ist im Indopazifik verbreitet, einer Region, die für ihre geologisch komplexe Geschichte bekannt ist. Die Evolution der Atyidae in Kombination mit der Taxonomie, die bis ins frühe 19. Jahrhundert zurückreicht, führt zu einem hohen Maß an taxonomischer Unsicherheit. Das zeigt sich darin, dass über 70 % der Artenvielfalt in einer Gattung – aus insgesamt 54 der gesamten Familie – enthalten sind. Diese Gattung, Caridina, ist nicht monophyletisch. Eine vollständige Überarbeitung fehlt jedoch noch aus mehreren Gründen; darunter unvollständige Kenntnisse über entsprechende Verwandtschaftsverhältnisse, das Abwägen zwischen der Arbeit mit Museumsexemplaren und dem Sammeln im weiten Verbreitungsgebiet der Familie sowie die Plastizität ihrer Morphologie. Ich führe eine Meta-Analyse der Biogeographie der Landmassen innerhalb der Grenzen des Indischen Ozeans durch. Die bei mehreren Taxa festgestellten Tendenzen belegen, dass die physische Verbindung zwischen den Landmassen für die Ausbreitung weniger wichtig war als der durch ökologische Bedingungen ausgeübte Druck. Dann vergleichen wir Extraktionsmethoden, abwägend zwischen DNA-Ausbeute und -Integrität sowie Probenkonservierung. Wir zeigen, dass die Maximierung der DNA-Ausbeute durch Ganzkörperlyse jedoch möglich ist, ohne die Merkmale im Exoskelett zu beschädigen. Abschließend verwenden wir einen Exon-Capture-Ansatz, um eine zeitkalibrierte Phylogenie der artenreichsten Gruppe innerhalb der Atyidae, d. h. Caridina und ihrer Verwandten, zu erstellen. Wir erläutern Details über die Evolution lebensgeschichtlicher Merkmale sowie der Biogeographie und zeigen, dass die Geschichte der Familie eng mit dem Indopazifik verbunden ist und schaffen einen robusten phylogenomischen Rahmen, der zukünftige Bemühungen zur Überarbeitung der Familie erleichtern wird. / The Atyidae is a speciose family of widely distributed freshwater shrimps that includes landlocked and amphidromous species. A large portion of the atyid diversity is distributed in the Indo-Pacific, a region known for its geologically complex history. Its evolution combined with a vast distribution range and a taxonomy that dates back to the early nineteenth century amounts to a high degree of taxonomic uncertainty, which is illustrated by the fact that over 70% of its diversity is contained within one genus out of the 54 in the family. This genus, Caridina, is not monophyletic, but a full revision is still lacking for several reasons, including incomplete knowledge about its relationships, the compromise between working with museum specimens and collecting new specimens along its wide distribution, and the plasticity of its morphology. My coauthors and I conduct a meta-analysis of the historical biogeography of the landmasses within the boundaries of the Indian Ocean. Trends shown by multiple taxa demonstrate that physical connectivity between said landmasses is less important to dispersal than the pressure exerted by ecological conditions. Then, we compare extraction methods in terms of the trade-off between DNA yield and integrity and specimen preservation. We show that, whereas traditional extraction methods are still useful to obtain viable DNA from museum samples a few decades old, maximising the DNA yield through whole-body lysis is possible without damaging characters in the exoskeleton. Finally, we proceed to use an exon-capture approach to produce a time-calibrated phylogeny of the most diverse group in Atyidae, i.e., Caridina and their kin. We reveal details about the evolution of life history traits as well as biogeography, showing that the history of the family is intimately linked to the Indo-Pacific and constructing a robust phylogenetic framework that will facilitate future endeavours to revise the family.
63

Phylogénomique des Archées

Grenier, Jean-Christophe 07 1900 (has links)
Les transferts horizontaux de gènes (THG) ont été démontrés pour jouer un rôle important dans l'évolution des procaryotes. Leur impact a été le sujet de débats intenses, ceux-ci allant même jusqu'à l'abandon de l'arbre des espèces. Selon certaines études, un signal historique dominant est présent chez les procaryotes, puisque les transmissions horizontales stables et fonctionnelles semblent beaucoup plus rares que les transmissions verticales (des dizaines contre des milliards). Cependant, l'effet cumulatif des THG est non-négligeable et peut potentiellement affecter l'inférence phylogénétique. Conséquemment, la plupart des chercheurs basent leurs inférences phylogénétiques sur un faible nombre de gènes rarement transférés, comme les protéines ribosomales. Ceux-ci n'accordent cependant pas autant d'importance au modèle d'évolution utilisé, même s'il a été démontré que celui-ci est important lorsqu'il est question de résoudre certaines divergences entre ancêtres d'espèces, comme pour les animaux par exemple. Dans ce mémoire, nous avons utilisé des simulations et analyser des jeux de données d'Archées afin d'étudier l'impact relatif des THG ainsi que l'impact des modèles d'évolution sur la précision phylogénétique. Nos simulations prouvent que (1) les THG ont un impact limité sur les phylogénies, considérant un taux de transferts réaliste et que (2) l'approche super-matrice est plus précise que l'approche super-arbre. Nous avons également observé que les modèles complexes expliquent non seulement mieux les données que les modèles standards, mais peuvent avoir un impact direct sur différents groupes phylogénétiques et sur la robustesse de l'arbre obtenu. Nos résultats contredisent une publication récente proposant que les Thaumarchaeota apparaissent à la base de l'arbre des Archées. / Horizontal gene transfer (HGT) had been demonstrated to play an important role in the evolution of prokaryotes. Their impact on phylogeny was the subject of a heated debate, with some proposing that the concept of a species tree should be abandoned. The phylogeny of prokaryotes does contain a major part of the historical signal, because stable and functional horizontal transmissions appear to be by far rarer than vertical transmissions (tens versus billions). However, the cumulative effect of HGT is non-negligible and can potentially affect phylogenetic inference. Therefore, most researchers base their phylogenetic inference on a low number of rarely transferred genes such as ribosomal proteins, but they assume the selection of the model of evolution as less important, this despite the fact that it has been shown of prime importance for much less deep divergences, e.g. like animals. Here, we used a combination of simulations and of real data from Archaea to study the relative impact of HGT and of the inference methods on the phylogenetic accuracy. Our simulations prove that (1) HGTs have a limited impact on phylogeny, assuming a realistic rate and (2) the supermatrix is much more accurate than the supertree approach. We also observed that more complex models of evolution not only have a better fit to the data, but can also have a direct impact on different phylogenetic groups and on the robustness of the tree. Our results are in contradiction to a recent publication proposing that the Thaumarchaeota are at the base of the Archaeal tree.
64

Amélioration de l'exactitude de l'inférence phylogénomique

Roure, Béatrice 04 1900 (has links)
L’explosion du nombre de séquences permet à la phylogénomique, c’est-à-dire l’étude des liens de parenté entre espèces à partir de grands alignements multi-gènes, de prendre son essor. C’est incontestablement un moyen de pallier aux erreurs stochastiques des phylogénies simple gène, mais de nombreux problèmes demeurent malgré les progrès réalisés dans la modélisation du processus évolutif. Dans cette thèse, nous nous attachons à caractériser certains aspects du mauvais ajustement du modèle aux données, et à étudier leur impact sur l’exactitude de l’inférence. Contrairement à l’hétérotachie, la variation au cours du temps du processus de substitution en acides aminés a reçu peu d’attention jusqu’alors. Non seulement nous montrons que cette hétérogénéité est largement répandue chez les animaux, mais aussi que son existence peut nuire à la qualité de l’inférence phylogénomique. Ainsi en l’absence d’un modèle adéquat, la suppression des colonnes hétérogènes, mal gérées par le modèle, peut faire disparaître un artéfact de reconstruction. Dans un cadre phylogénomique, les techniques de séquençage utilisées impliquent souvent que tous les gènes ne sont pas présents pour toutes les espèces. La controverse sur l’impact de la quantité de cellules vides a récemment été réactualisée, mais la majorité des études sur les données manquantes sont faites sur de petits jeux de séquences simulées. Nous nous sommes donc intéressés à quantifier cet impact dans le cas d’un large alignement de données réelles. Pour un taux raisonnable de données manquantes, il appert que l’incomplétude de l’alignement affecte moins l’exactitude de l’inférence que le choix du modèle. Au contraire, l’ajout d’une séquence incomplète mais qui casse une longue branche peut restaurer, au moins partiellement, une phylogénie erronée. Comme les violations de modèle constituent toujours la limitation majeure dans l’exactitude de l’inférence phylogénétique, l’amélioration de l’échantillonnage des espèces et des gènes reste une alternative utile en l’absence d’un modèle adéquat. Nous avons donc développé un logiciel de sélection de séquences qui construit des jeux de données reproductibles, en se basant sur la quantité de données présentes, la vitesse d’évolution et les biais de composition. Lors de cette étude nous avons montré que l’expertise humaine apporte pour l’instant encore un savoir incontournable. Les différentes analyses réalisées pour cette thèse concluent à l’importance primordiale du modèle évolutif. / The explosion of sequence number allows for phylogenomics, the study of species relationships based on large multi-gene alignments, to flourish. Without any doubt, phylogenomics is essentially an efficient way to eliminate the problems of single gene phylogenies due to stochastic errors, but numerous problems remain despite obvious progress realized in modeling evolutionary process. In this PhD-thesis, we are trying to characterize some consequences of a poor model fit and to study their impact on the accuracy of the phylogenetic inference. In contrast to heterotachy, the variation in the amino acid substitution process over time did not attract so far a lot of attention. We demonstrate that this heterogeneity is frequently observed within animals, but also that its existence can interfere with the quality of phylogenomic inference. In absence of an adequate model, the elimination of heterogeneous columns, which are poorly handled by the model, can eliminate an artefactual reconstruction. In a phylogenomic framework, the sequencing strategies often result in a situation where some genes are absent for some species. The issue about the impact of the quantity of empty cells was recently relaunched, but the majority of studies on missing data is performed on small datasets of simulated sequences. Therefore, we were interested on measuring the impact in the case of a large alignment of real data. With a reasonable amount of missing data, it seems that the accuracy of the inference is influenced rather by the choice of the model than the incompleteness of the alignment. For example, the addition of an incomplete sequence that breaks a long branch can at least partially re-establish an artefactual phylogeny. Because, model violations are always representing the major limitation of the accuracy of the phylogenetic inference, the improvement of species and gene sampling remains a useful alternative in the absence of an adequate model. Therefore, we developed a sequence-selection software, which allows the reproducible construction of datasets, based on the quantity of data, their evolutionary speed and their compositional bias. During this study, we did realize that the human expertise still furnishes an indispensable knowledge. The various analyses performed in the course of this PhD thesis agree on the primordial importance of the model of sequence evolution.
65

Apport de la phylogénomique pour l’étude des interactions moléculaires entre Henipavirus et leurs réservoirs : les chauves-souris du genre Pteropus / Contribution of phylogenomics to the study of molecular interactions between Henipaviruses and their reservoir : Pteropus Bats

Fouret, Julien 14 December 2018 (has links)
Les chauve-souris représentant un réservoir important pour de nombreux virus pathogènes pour l’homme, un ensemble d’études en évolution moléculaire converge vers l’évidence d’une forte pression de sélection au niveau de gènes impliqués dans l’immunité dans l’ordre Chiroptera. En particulier, les chauves-souris du genre Pteropus hébergent des virus de la famille Henipavirus: Nipah et Hendra. Ces virus sont responsables d'épidémies en Asie du sud-est, et bien qu'ayant un taux d'incidence bas, les maladies résultantes de l'infection ont un taux de létalité allant de 40% à 90% chez l'homme. L’infection atteint aussi la plupart des mammifères avec des symptômes clinique graves, (e.g. porc ou cheval : espèces d’intérêt agronomique). La particularité du genre Pteropus est de ne pas développer ces symptômes cliniques graves d’infection. Afin d'en identifier les bases génétiques, nous avons utilisé l'analyse de sélection positive sur l’ensemble du génome codant sans restreindre notre analyse aux gènes de l’immunité. Nous avons mis en place les outils informatiques innovants et nécessaires au déploiement de cette démarche. Ces analyses, reposent sur des séquences de références pour les génomes de différentes espèces, et en absence du génome de référence pour P. giganteus, nous l’avons préalablement séquencé et assemblé. Or, tous les gènes sous sélection ne sont pas forcément liés à notre phénotype d’intérêt mais possiblement à d’autres (e.g. capacité de vol). Nous avons mis en place un algorithme afin d’établir un lien fonctionnel potentiel entre ces gènes identifiés sous sélection positive et un phénotype d’intérêt. / Bats represent a considerable reservoir for an extensive group of human pathogenic viruses. A number of molecular evolution studies points toward the evidence of a strong selection pressure in Chiroptera immune-related genes. Notably, Pteropus bats host viruses from Henipavirus genus: Nipah and Hendra. These viruses are responsible for epidemics in South-Est Asia, and, while the incidence is low, the resulting diseases are highly lethal, ranging between 40 to 90% in humans. Most of mammals are susceptible to the infection (including pigs and horses, animals valued in agronomy), and develop severe clinical symptoms. Specificity of Pteropus genus lies in the absence of clinical symptoms following the infection. In order to identify the genetic basis of this interesting phenomenon, we applied positive selection analysis to the entire coding genome, without bounding our analysis to immune-regulating genes. We have set breakthrough computational tools, without which our analysis would not have been possible. Reference sequences from genome of several species are the groundwork for our analysis. As P. giganteus reference genome has not yet been resolved, we sequenced and assembled it. However, not all genes under positive selection are necessarily linked to a phenotype of interest, but may be linked to other phenotypes (such as the flying ability). We have thus developed an algorithm to establish a possible functional link between the genes identified under positive selection and a phenotype of interest, which allows new perspectives in phylogenomic research.
66

Phylogénie et évolution des Archaea, une approche phylogénomique / Phylogny and evolution of Archaea, a phylogenomic approach

Petitjean, Celine 27 September 2013 (has links)
En 1977, Carl Woese sépare les procaryotes en deux grands groupes en proposant une nouvelle classification basée sur des critères phylogénétiques. Les Archaea deviennent ainsi un domaine à part entière aux cotés des Bacteria et des Eucarya. Depuis, la compréhension de ce nouveau groupe et de ses relations avec les deux autres domaines, essentielles pour comprendre l’évolution ancienne du vivant, est largement passée par l’étude de leur phylogénie. Presque 40 ans de recherche sur les archées ont permis de faire évoluer leur image : de bactéries vivant dans des milieux spécialisés, souvent extrêmes, on est passé à un domaine indépendant, très diversifié aussi bien génétiquement, métaboliquement ou encore écologiquement. Ces dernières années la barre symbolique de cent génomes complets d’archées séquencés a été franchie et, parallèlement, les projets génomiques et métagénomiques sur des groupes peu caractérisés ou de nouvelles lignées de haut rang taxonomique (e.g. Nanohaloarchaea, Thaumarchaeota, ARMAN, Aigarchaeota, groupe MGC, groupe II des Euryarchaeota, etc.) se sont multipliés. Tout ceci apporte un matériel sans précédent pour l’étude de l’histoire évolutive et de la diversité des Archaea. Les protéines ribosomiques ont été utilisées de façon courante pour inférer la position phylogénétique des nouvelles lignées d’Archaea. Néanmoins, les phylogénies résultantes ne sont pas complètement résolues, laissant des interrogations concernant d’importantes relations de parenté. La recherche de nouveaux marqueurs est donc cruciale et c’est dans ce contexte que mon projet de thèse s’inscrit. À partir de l’analyse des génomes de deux Thaumarchaeota et d’une Aigarchaeota, nous avons identifié 200 protéines conservées et bien représentées dans les différents phyla d’archées. Ces protéines sont impliquées dans de nombreux processus cellulaires, ce qui peut apporter un signal phylogénétique complémentaire à celui des marqueurs de type informationnel utilisés par le passé. En plus de confirmer la plupart des relations phylogénétiques inférées à partir de ces derniers (i.e., protéines ribosomiques et sous unités de l’ARN polymérase), l’analyse phylogénétique de ces nouveaux marqueurs apporte un signal permettant une meilleure résolution de la phylogénie des archées et la clarification de certaines relations jusqu’ici confuses. Un certain nombre de ces nouveaux marqueurs sont aussi présents chez les bactéries. Les relations entre les grands phyla d’archées restant encore non résolues, nous avons utilisé ces protéines pour essayer de placer la racine de l’arbre des Archaea en utilisant comme groupe extérieur les bactéries. Nous avons ainsi pu identifier 38 protéines, parmi les 200 sélectionnées précédemment, ayant un signal phylogénétique suffisamment fiable pour cette étude, auxquelles nous avons ajouté 32 protéines ribosomiques universelles. L’utilisation conjointe de ces données nous a permis de placer la racine entre les Euryarchaeota, d’une part, et un groupe rassemblant les Thaumarchaeota, les Aigarchaeota, les Korarchaeota et les Crenarchaeota, d’autre part. Ce nouvel éclairage sur l’évolution ancienne des archées nous a amené à proposer une révision de leur taxonomie avec, principalement, la création du nouveau phylum "Proteoarchaeota" contenant les quatre phyla actuels que nous proposons de rétrograder en classes : Thaumarchaea, Aigarchaea, Korarchaea et Crenarchaea.Finalement, l’analyse des protéines codées dans les trois génomes qui ont servi de point de départ de ma thèse nous a permis de générer une masse considérable de données qui ont révélé des traits particuliers ou encore des histoires évolutives inattendues. Un exemple est l’histoire du complexe formé par la chaperonne DnaK et de ses co-chaperonnes GrpE, DnaJ, et DnaJ-Fer chez les Thaumarchaeota, impliquant plusieurs transferts horizontaux entre les trois domaines du vivant. / In 1977, Carl Woese proposed a new classification of organisms based on phylogenetic criteria where he divided prokaryotes into two major groups. Thus, Archaea were defined as a new domain, together with Bacteria and Eucarya. Since then, the study of this group and its relationships with the two other domains, essential to understand the early evolution of Life, has been largely done through the investigation of its phylogeny. Almost 40 years of research on the archaea have led to a significant evolution of the knowledge on this group: from considering them as bacteria living in specialized environments, most often extreme ones, to defining them as an independent domain, highly diversified in genetic, metabolic and ecological terms. During the last years, the symbolic barrier of 100 complete archaeal genome sequences has been reached and, simultaneously, many genome projects from poorly-known groups or new high-rank lineages (e.g., Nanohaloarchaea, Thaumarchaeota, ARMAN, Aigarchaeota, MGC, group II Euryarchaeota, etc.) have been launched. All this provides unprecedented information to study the evolutionary history of Archaea. Ribosomal proteins have been used recurrently to infer the phylogenetic position of new archaeal lineages. Nevertheless, the resulting phylogenies are not fully resolved and several important nodes remain uncertain. The identification of new phylogenetic markers is therefore crucial. This represents the framework of my PhD thesis project. On the basis of the analysis of the genome sequences of two Thaumarchaeota and one Aigarchaeota, we have identified 200 conserved proteins well represented among the different archaeal phyla. These proteins are involved in a number of cellular functions, thus providing a phylogenetic signal complementary to the one obtained from the informational proteins (i.e., ribosomal proteins and RNA polymerase subunits). The phylogenetic analysis of these new markers has led to a better resolution of the archaeal phylogeny, including several relationships that remained unclear. Several of the new markers are also present in bacteria. Since the relationships among the different archaeal phyla are not yet resolved, we have used those markers to try to place the root of the archaeal phylogeny using the bacterial sequences as outgroup. We have identified 38 proteins among the 200 detected before containing a phylogenetic signal useful for that purpose, to which we have added 32 universal ribosomal proteins. The use of this complete dataset allowed us locating the root between the Euryarchaeota and a large group joining the Thaumarchaeota, Aigarchaeota, Korarchaeota and Crenarchaeota. This new result on the ancient evolutionary history of Archaea has led us to propose a taxonomic revision for this domain, in particular the erection of a new phylum "Proteoarchaeota", containing the current four phyla that we propose to retrograde into classes (Thaumarchaeales, Aigarchaeales, Korarchaeales and Crenarchaeales). Finally, the analysis of the proteins encoded by the three reference genomes at the origin of this work has generated a large amount of data, which reveals particular traits in certain organisms or unexpected evolutionary histories. One example concerns the evolution in Thaumarchaeota of the protein complex composed of the DnaK chaperon and its co-chaperons GrpE, DnaJ, and DnaJ-Fer, which involves several horizontal gene transfer events among the three domains of Life.
67

Variação genética e morfológica das espécies de Thoropa Cope, 1865 (Anura : Cycloramphidae) /

Sabbag, Ariadne Fares. January 2019 (has links)
Orientador: Célio Fernando Baptista Haddad / Resumo: Thoropa Cope, 1865 (Anura: Cycloramphidae) é um gênero de rãs endêmicas do domínio Mata Atlântica e de ecótonos associados. Possui atualmente seis espécies (T. miliaris, T. petropolitana, T. taophora, T. lutzi, T. megatympanum e T. saxatilis), divididas em dois grupos morfológicos: grupo petropolitana (T. petropolitana e T. lutzi) e grupo miliaris (T. miliaris, T. taophora, T. megatympanum e T. saxatilis). Todas as espécies se reproduzem e se desenvolvem em rochas molhadas de água doce, encontradas em afloramentos rochosos, cachoeiras e riachos. Um estudo recente sobre a filogenia molecular mostrou que T. miliaris é parafilética a T. taophora, e que T. taophora, T. megatympanum e T. saxatilis são monofiléticas com alto suporte (Sabbag et al. 2018). Esse estudo também encontrou diversos clados dentro de cada uma das espécies, especialmente em T. miliaris. Porém, não foi possível estudarem molecularmente as espécies do grupo petropolitana porque existe apenas uma amostra de DNA disponível para o grupo. No presente trabalho, estudamos aspectos genéticos e morfológicos das seis espécies do gênero a fim de investigar a diversidade molecular previamente encontrada, a parafilia de T. miliaris e as características morfológicas das espécies que coincidam com a diversidade genética conhecida. Encontramos que os clados conhecidos de T. miliaris são linhagens evoluindo separadamente e que os clados conhecidos de T. taophora fazem parte de uma linhagem única. Thoropa miliaris e T. taophor... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Thoropa Cope, 1865 (Anura: Cycloramphidae) is a frog genus endemic to theAtlantic forest domain and associated ecotones. It comprises six species (T. miliaris, T. petropolitana, T. taophora, T. lutzi, T. megatympanum and T. saxatilis), divided in two morphological groups: petropolitana group (T. petropolitana and T. lutzi) and miliaris group (T. miliaris, T. taophora, T. megatympanum and T. saxatilis). All the species reproduce and develop in freshwater wet rocks that can be found in rock outcrops, waterfalls and streams. A recent study on molecular phylogeny has shown that T. miliaris is paraphyletic in respect to T. taophora and that T. taophora, T. megatympanum and T. saxatilis are monophyletic with high support. This study also found many clades inside each of those species, especially within T. miliaris. Nevertheless, it was not possible to study molecular aspects of the petropolitana group because there is only one DNA sample available for the group. In this work, we studied genetic and morphological aspects of all six species of the genus in order to investigate the molecular diversity found previously, the paraphyly found for T. miliaris, and the species morphological characteristics that coincide with the known genetic diversity. We found that the known clades of T. miliaris are separately evolving lineages and that the clades of T. taophora are part of a whole lineage. Thoropa miliaris and T. taophora are reciprocally monophyletic. We also found that the diversifica... (Complete abstract click electronic access below) / Doutor
68

Amélioration de l'exactitude de l'inférence phylogénomique

Roure, Béatrice 04 1900 (has links)
L’explosion du nombre de séquences permet à la phylogénomique, c’est-à-dire l’étude des liens de parenté entre espèces à partir de grands alignements multi-gènes, de prendre son essor. C’est incontestablement un moyen de pallier aux erreurs stochastiques des phylogénies simple gène, mais de nombreux problèmes demeurent malgré les progrès réalisés dans la modélisation du processus évolutif. Dans cette thèse, nous nous attachons à caractériser certains aspects du mauvais ajustement du modèle aux données, et à étudier leur impact sur l’exactitude de l’inférence. Contrairement à l’hétérotachie, la variation au cours du temps du processus de substitution en acides aminés a reçu peu d’attention jusqu’alors. Non seulement nous montrons que cette hétérogénéité est largement répandue chez les animaux, mais aussi que son existence peut nuire à la qualité de l’inférence phylogénomique. Ainsi en l’absence d’un modèle adéquat, la suppression des colonnes hétérogènes, mal gérées par le modèle, peut faire disparaître un artéfact de reconstruction. Dans un cadre phylogénomique, les techniques de séquençage utilisées impliquent souvent que tous les gènes ne sont pas présents pour toutes les espèces. La controverse sur l’impact de la quantité de cellules vides a récemment été réactualisée, mais la majorité des études sur les données manquantes sont faites sur de petits jeux de séquences simulées. Nous nous sommes donc intéressés à quantifier cet impact dans le cas d’un large alignement de données réelles. Pour un taux raisonnable de données manquantes, il appert que l’incomplétude de l’alignement affecte moins l’exactitude de l’inférence que le choix du modèle. Au contraire, l’ajout d’une séquence incomplète mais qui casse une longue branche peut restaurer, au moins partiellement, une phylogénie erronée. Comme les violations de modèle constituent toujours la limitation majeure dans l’exactitude de l’inférence phylogénétique, l’amélioration de l’échantillonnage des espèces et des gènes reste une alternative utile en l’absence d’un modèle adéquat. Nous avons donc développé un logiciel de sélection de séquences qui construit des jeux de données reproductibles, en se basant sur la quantité de données présentes, la vitesse d’évolution et les biais de composition. Lors de cette étude nous avons montré que l’expertise humaine apporte pour l’instant encore un savoir incontournable. Les différentes analyses réalisées pour cette thèse concluent à l’importance primordiale du modèle évolutif. / The explosion of sequence number allows for phylogenomics, the study of species relationships based on large multi-gene alignments, to flourish. Without any doubt, phylogenomics is essentially an efficient way to eliminate the problems of single gene phylogenies due to stochastic errors, but numerous problems remain despite obvious progress realized in modeling evolutionary process. In this PhD-thesis, we are trying to characterize some consequences of a poor model fit and to study their impact on the accuracy of the phylogenetic inference. In contrast to heterotachy, the variation in the amino acid substitution process over time did not attract so far a lot of attention. We demonstrate that this heterogeneity is frequently observed within animals, but also that its existence can interfere with the quality of phylogenomic inference. In absence of an adequate model, the elimination of heterogeneous columns, which are poorly handled by the model, can eliminate an artefactual reconstruction. In a phylogenomic framework, the sequencing strategies often result in a situation where some genes are absent for some species. The issue about the impact of the quantity of empty cells was recently relaunched, but the majority of studies on missing data is performed on small datasets of simulated sequences. Therefore, we were interested on measuring the impact in the case of a large alignment of real data. With a reasonable amount of missing data, it seems that the accuracy of the inference is influenced rather by the choice of the model than the incompleteness of the alignment. For example, the addition of an incomplete sequence that breaks a long branch can at least partially re-establish an artefactual phylogeny. Because, model violations are always representing the major limitation of the accuracy of the phylogenetic inference, the improvement of species and gene sampling remains a useful alternative in the absence of an adequate model. Therefore, we developed a sequence-selection software, which allows the reproducible construction of datasets, based on the quantity of data, their evolutionary speed and their compositional bias. During this study, we did realize that the human expertise still furnishes an indispensable knowledge. The various analyses performed in the course of this PhD thesis agree on the primordial importance of the model of sequence evolution.
69

Phylogénomique des Archées

Grenier, Jean-Christophe 07 1900 (has links)
Les transferts horizontaux de gènes (THG) ont été démontrés pour jouer un rôle important dans l'évolution des procaryotes. Leur impact a été le sujet de débats intenses, ceux-ci allant même jusqu'à l'abandon de l'arbre des espèces. Selon certaines études, un signal historique dominant est présent chez les procaryotes, puisque les transmissions horizontales stables et fonctionnelles semblent beaucoup plus rares que les transmissions verticales (des dizaines contre des milliards). Cependant, l'effet cumulatif des THG est non-négligeable et peut potentiellement affecter l'inférence phylogénétique. Conséquemment, la plupart des chercheurs basent leurs inférences phylogénétiques sur un faible nombre de gènes rarement transférés, comme les protéines ribosomales. Ceux-ci n'accordent cependant pas autant d'importance au modèle d'évolution utilisé, même s'il a été démontré que celui-ci est important lorsqu'il est question de résoudre certaines divergences entre ancêtres d'espèces, comme pour les animaux par exemple. Dans ce mémoire, nous avons utilisé des simulations et analyser des jeux de données d'Archées afin d'étudier l'impact relatif des THG ainsi que l'impact des modèles d'évolution sur la précision phylogénétique. Nos simulations prouvent que (1) les THG ont un impact limité sur les phylogénies, considérant un taux de transferts réaliste et que (2) l'approche super-matrice est plus précise que l'approche super-arbre. Nous avons également observé que les modèles complexes expliquent non seulement mieux les données que les modèles standards, mais peuvent avoir un impact direct sur différents groupes phylogénétiques et sur la robustesse de l'arbre obtenu. Nos résultats contredisent une publication récente proposant que les Thaumarchaeota apparaissent à la base de l'arbre des Archées. / Horizontal gene transfer (HGT) had been demonstrated to play an important role in the evolution of prokaryotes. Their impact on phylogeny was the subject of a heated debate, with some proposing that the concept of a species tree should be abandoned. The phylogeny of prokaryotes does contain a major part of the historical signal, because stable and functional horizontal transmissions appear to be by far rarer than vertical transmissions (tens versus billions). However, the cumulative effect of HGT is non-negligible and can potentially affect phylogenetic inference. Therefore, most researchers base their phylogenetic inference on a low number of rarely transferred genes such as ribosomal proteins, but they assume the selection of the model of evolution as less important, this despite the fact that it has been shown of prime importance for much less deep divergences, e.g. like animals. Here, we used a combination of simulations and of real data from Archaea to study the relative impact of HGT and of the inference methods on the phylogenetic accuracy. Our simulations prove that (1) HGTs have a limited impact on phylogeny, assuming a realistic rate and (2) the supermatrix is much more accurate than the supertree approach. We also observed that more complex models of evolution not only have a better fit to the data, but can also have a direct impact on different phylogenetic groups and on the robustness of the tree. Our results are in contradiction to a recent publication proposing that the Thaumarchaeota are at the base of the Archaeal tree.
70

Exploration of microbial diversity and evolution through cultivation independent phylogenomics

Martijn, Joran January 2017 (has links)
Our understanding of microbial evolution is largely dependent on available genomic data of diverse organisms. Yet, genome-sequencing efforts have mostly ignored the diverse uncultivable majority in favor of cultivable and sociologically relevant organisms. In this thesis, I have applied and developed cultivation independent methods to explore microbial diversity and obtain genomic data in an unbiased manner. The obtained genomes were then used to study the evolution of mitochondria, Rickettsiales and Haloarchaea. Metagenomic binning of oceanic samples recovered draft genomes for thirteen novel Alphaproteobacteria-related lineages. Phylogenomics analyses utilizing the improved taxon sample suggested that mitochondria are not related to Rickettsiales but rather evolved from a proteobacterial lineage closely related to all sampled alphaproteobacteria. Single-cell genomics and metagenomics of lake and oceanic samples, respectively, identified previously unobserved Rickettsiales-related lineages. They branched early relative to characterized Rickettsiales and encoded flagellar genes, a feature once thought absent in this order. Flagella are most likely an ancestral feature, and were independently lost during Rickettsiales diversification. In addition, preliminary analyses suggest that ATP/ADP translocase, the marker for energy parasitism, was acquired after the acquisition of type IV secretion systems during the emergence of the Rickettsiales. Further exploration of the oceanic samples yielded the first draft genomes of Marine Group IV archaea, the closest known relatives of the Haloarchaea. The halophilic and generally aerobic Haloarchaea are thought to have evolved from an anaerobic methanogenic ancestor. The MG-IV genomes allowed us to study this enigmatic evolutionary transition. Preliminary ancestral reconstruction analyses suggest a gradual loss of methanogenesis and adaptation to an aerobic lifestyle, respectively. The thesis further presents a new amplicon sequencing method that captures near full-length 16S and 23S rRNA genes of environmental prokaryotes. The method exploits PacBio's long read technology and the frequent proximity of these genes in prokaryotic genomes. Compared to traditional partial 16S amplicon sequencing, our method classifies environmental lineages that are distantly related to reference taxa more confidently. In conclusion, this thesis provides new insights into the origins of mitochondria, Rickettsiales and Haloarchaea and illustrates the power of cultivation independent methods with respect to the study of microbial evolution.

Page generated in 0.0689 seconds