• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 82
  • 44
  • 37
  • 14
  • 4
  • 3
  • 2
  • 1
  • Tagged with
  • 209
  • 70
  • 53
  • 52
  • 40
  • 23
  • 21
  • 20
  • 18
  • 15
  • 15
  • 15
  • 15
  • 14
  • 14
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
81

Efficient algorithms for de novo assembly of alternative splicing events from RNA-seq data / Algorithmes efficaces pour l’assemblage de novo d’événements d’épissage alternatif dans des données de RNA-seq

Tominaga Sacomoto, Gustavo Akio 06 March 2014 (has links)
Dans cette thèse, nous abordons le problème de l'identification et de la quantification de variants (épissage alternatif et polymorphisme génomique) dans des données de RNA-seq sans génome de référence, et sans faire un assemblage complet des transcripts. Basé sur l'idée que chaque variant correspond à un motif reconnaissable, qu'on appelle une bulle, dans un graphe de Bruijn construit à partir des lectures de RNA-seq, nous proposons un modèle pour les variants dans de tels graphes. Nous introduisons ensuite une méthode, appelé KisSplice, pour extraire les événements d'épissage alternatif, et nous montrons qu'il trouve plus d'événements corrects que les assembleurs de transcriptome traditionnels. Afin d'améliorer son temps d'exécution, nous proposons un nouvel algorithme polynomial pour énumérer les bulles. On montre qu'il est plusieurs ordres de grandeur plus rapide que les approches précédentes. Afin de réduire sa consommation en mémoire, nous proposons une nouvelle façon de représenter un graphe de Bruijn. Nous montrons que notre approche utilise 30% à 40% moins de mémoire que l'état de l'art. Nous appliquons les techniques développées pour énumérer les bulles à deux problémes classiques. Nous donnons le premier algorithme optimal pour énumérer les cycles dans des graphes non orientés. Il s'agit de la première amélioration à ce probléme en près de 40 ans. Nous considérons ensuite une variante du problème des K chemins plus courts: au lieu de limiter le nombre des chemins, nous limitons leurs poids. Nous présentons de nouveaux algorithmes qui utilisent exponentiellement moins mémoire que les approches précédentes / In this thesis, we address the problem of identifying and quantifying variants (alternative splicing and genomic polymorphism) in RNA-seq data when no reference genome is available, without assembling the full transcripts. Based on the idea that each variant corresponds to a recognizable pattern, a bubble, in a de Bruijn graph constructed from the RNA-seq reads, we propose a general model for all variants in such graphs. We then introduce an exact method, called KisSplice, to extract alternative splicing events and show that it outperforms general purpose transcriptome assemblers. We put an extra effort to make KisSplice as scalable as possible. In order to improve the running time, we propose a new polynomial delay algorithm to enumerate bubbles. We show that it is several orders of magnitude faster than previous approaches. In order to reduce its memory consumption, we propose a new compact way to build and represent a de Bruijn graph. We show that our approach uses 30% to 40% less memory than the state of the art, with an insignificant impact on the construction time. Additionally, we apply the techniques developed to list bubbles in two classical problems: cycle enumeration and the K-shortest paths problem. We give the first optimal algorithm to list cycles in undirected graphs, improving over Johnson’s algorithm. This is the first improvement to this problem in almost 40 years. We then consider a different parameterization of the K-shortest (simple) paths problem: instead of bounding the number of st-paths, we bound the weight of the st-paths. We present new algorithms using exponentially less memory than previous approaches
82

Investigating cancer aetiology through the analysis of somatic mutation signatures / Analyse des empreintes mutationnelles pour la recherche sur l'étiologie des cancers humains

Ardin, Maude 30 November 2016 (has links)
Les cellules cancéreuses sont caractérisées par des altérations de l'ADN causées par des facteurs exogènes, comme l'exposition à des agents environnementaux tels que le tabac ou les UV, ou par des mécanismes endogènes tels que les erreurs de polymérase lors de la réplication de l'ADN. L'analyse des causes et des conséquences de ces altérations permet de mieux comprendre les facteurs et mécanismes à l'origine du développement d'un cancer. Les technologies de séquençages à haut débit offrent l'opportunité d'étudier la nature précise de ces altérations à l'échelle du génome et permettent de révéler des signatures mutationnelles distinctes et spécifiques de cancérigènes, fournissant ainsi des hypothèses sur l'étiologie des cancers.L'objectif de ma thèse a consisté à développer des méthodes et des outils bioinformatiques accessibles et conviviaux permettant de faciliter l'analyse et l'interprétation des signatures mutationnelles à partir de données de séquençage à haut débit. L'application de ces outils et méthodes à des séries originales de tumeurs humaines et de systèmes expérimentaux de mutagénèse et carcinogénèse a permis de mieux caractériser la signature mutationnelle de l'acide aristolochique (AA) ainsi que d'autres cancérigènes d'intérêt / Cellular genomes accumulate alterations following exposures to exogenous factors, like environmental agents such as tobacco smoking or UV, or to endogenous mechanisms such as DNA replication errors. Analysing the causes and consequences of these changes allows a better understanding of the mechanisms underlying cancer development and progression. Next-generation sequencing (NGS) technologies provide the opportunity tostudy the nature of the resulting alterations on a genome-wide scale and started to reveal distinct mutational signatures specific to past carcinogenic exposures providing clues on cancer aetiology.The aim of my thesis was to develop user-friendly bioinformatic tools and methods for facilitating the analysis and interpretation of carcinogen-specific mutational signatures from NGS data. Applying these tools and methods to human tumours and experimental models of mutagenesis led to a better characterisation the mutational signature of aristolochic acid (AA), as well as other carcinogens of interest
83

Analysis of NGS Data from Immune Response and Viral Samples

Gerasimov, Ekaterina 08 August 2017 (has links)
This thesis is devoted to designing and applying advanced algorithmical and statistical tools for analysis of NGS data related to cancer and infection diseases. NGS data under investigation are obtained either from host samples or viral variants. Recently, random peptide phage display libraries (RPPDL) were applied to studies of host's antibody response to different diseases. We study human antibody response to breast cancer and mouse antibody response to Lyme disease by sequencing of the whole antibody repertoire profiles which are represented by RPPDL. Alternatively, instead of sequencing immune response NGS can be applied directly to a viral population within an infected host. Specifically, we analyze the following RNA viruses: the human immunodeficiency virus (HIV) and the infectious bronchitis virus (IBV). Sequencing of RNA viruses is challenging because there are many variants inside population due to high mutation rate. Our results show that NGS helps to understand RNA viruses and explore their interaction with infected hosts. NGS also helps to analyze immune response to different diseases, trace changing of immune response at different disease stages.
84

Identification de gènes candidats impliqués dans la régulation de la teneur en acide ascorbique chez la tomate : impacts sur le potentiel antioxydant et la qualité post-récolte du fruit / Identification of candidate genes involved in the regulation of the ascorbic acid content in tomato fruit : impacts on the antioxidant potential and postharvest fruit quality

Bournonville, Celine 03 March 2015 (has links)
L’acide ascorbique (AsA) est un antioxydant essentiel à la fois pour l’homme et les végétaux. L’AsA provenant des plantes représente la source principale de vitamine C dans l’alimentation quotidienne. Au-delà de son impact nutritionnel, augmenter la teneur en AsA dans le fruit de tomate serait susceptible d’influencer la qualité des fruits après la récolte, en termes de conservation mais également de résistance à des pathogènes. Bien que le métabolisme de l’AsA soit bien caractérisé, les mécanismes impliqués dans sa régulation restent jusqu'à présent peu compris. Des études récentes menées sur des feuilles d’Arabisdopsis thaliana montrent que certaines protéines seraient capables de réguler la teneur en AsA, en agissant au niveau transcriptionnel ou post-transcriptionnel. A ce jour, ce type de régulation n’a pas été encore décrit chez les fruits. Dans ce but, une approche de génétique directe a été développée afin d’étudier les mécanismes impliqués dans la régulation de la teneur en AsA et ceci dans le fruit de tomate (Solanum lycopersicum). L’analyse d’une population de mutants EMS de tomate Micro-Tom a permis l’identification de lignées de mutants présentant des teneurs en AsA de 2,5 à 4 fois plus importantes que celles observées dans les fruits de tomate sauvage. La caractérisation de ces lignées a conduit à des résultats prometteurs pour l’étude de la qualité des fruits après la récolte. Une stratégie de NGS-mapping a permis l’identification des mutations causales responsables du phénotype AsA observé. Ainsi, le criblage de mutants EMS a permis la découverte de nouvelles protéines inattendues, permettant de confirmer au niveau moléculaire l’existence d’une interaction directe en la signalisation lumineuse et la régulation de la voie de biosynthèse de l’AsA. / The ascorbic acid (AsA) is an essential antioxidant in both plants and humans. Plant-derived AsA is the major source of vitamin C in the human diet. In addition to its effect on tomato nutritional value, increasing tomato AsA content would likely affect postharvest storage and resistance to pathogens of the fruit. While AsA metabolism is well characterized, the mechanisms involved in its regulation remain poorly understood. Recent studies in Arabidopsis leaves indicate that few regulatory proteins can regulate this pathway at transcriptional and post-transcriptional levels. Still nothing equivalent has been described in fruits. In that aim, a forward genetic approach has been carried out to investigate the regulation of AsA in tomato (Solanum lycopersicum) fruit. The screening of an EMS tomato mutant population in the miniature cultivar Micro-Tom for identifying mutant lines with AsA-enriched fruits was done. Among the 500 M2 mutant families screened, four mutant lines with higher AsA content ranging from 2.5 to 4 fold were selected. These mutant lines have been characterized for postharvest traits quality and showed promising results. A method based on NGS-mapping allowed the identification of the putative AsA-enriched related gene. Thus, the screening of EMS mutants led to original findings such as the discovery of new unexpected proteins regulating AsA in plants, and particularly in fruits. Our work confirms at the molecular level the direct interaction between light signaling component and the regulation of the AsA biosynthesis pathway.
85

Identification of risk factors contributing to venous thromboembolism by Ion Torrent sequencing using an AmpliSeq strategy

Lucchesi, Patrik January 2017 (has links)
Venous thromboembolism (VTE) is a common cardiovascular disease that frequently recurs and is associated with significant numbers of death annually. The influence of the hereditary risk factors is not yet firmly established but twin and family studies suggest that heritability is about 50%. Several genetic risk factors have been identified by genomeHwide association studies (GWAS) but they do not explain all of the missing heritability of VTE. NextHgeneration sequencing (NGS) has revolutionized the genetic analysis of disease and has been used to discover the genes underlying unsolved Mendelian disorders. It has also been used to identify rare alleles which may help explain the missing heritability for complex diseases. The study population of this study consisted of 32 randomly chosen VTE patients from the MATSHstudy (Malmö Thrombophilia Study). The seventeen genes that in earlier studies have been shown to be associated with VTE were examined and the identified VTEHrelated mutations were compared to the general population. The results showed that Ion TorrentHsequencing effectively provided good coverage and read depth in all of the sequenced genes. Optimization of the primer panels resulted in higher and more balanced coverage and the quality of the results in this study was on an overall high level. A total of 215 variants were detected – 62 in exons, 8 in splice and 145 in introns. One Mendelian mutation was detected in PROC and rare variants were found in F2 and FGG. The most common risk factor (F5 Leiden) was highly enriched with 25% in this study compared to 3% in a background population. / Venös tromboembolism (VTE) är en vanlig, ofta återkommande, kardiovaskulär sjukdom som associeras med åtskilliga dödsfall årligen. De ärftliga riskfaktorernas påverkan är inte fullständigt kartlagda ännu men tvillingH och familjestudier antyder att ärftligheten kan vara runt 50%. Ett flertal genetiska riskfaktorer har identifierats genom genome$wide association studies (GWAS) men de förklarar inte hela den saknade ärftlighetskomponenten för VTE. NästaHgenerationsHsekvensering (NGS) har revolutionerat den genetiska sjukdomsanalysen och har använts för att upptäcka de gener som ligger bakom tidigare olösta Mendelska sjukdomstillstånd. Man har även använt NGS för att identifiera rara alleler som kan hjälpa till att förklara de saknade ärftlighetskomponenterna för nedärvning av komplexa sjukdomar. Studiepopulationen I den här undersökningen utgjordes av 32 slumpmässigt utvalda VTEHpatienter från Malmö Thrombophilia Study (MATS). De sjutton gener som I tidigare studier har visat sig vara associerade med VTE undersöktes och de identifierade VTEHrelaterade mutationerna jämfördes med en normalpopulation. Resultaten visade att Ion TorrentHsekvensering ger bra täckningsgrad och läsdjup i alla de sekvenserade generna. Optimering av primerHpanelerna resulterade i en mer balanserad täckningsgrad och resultatkvaliteten i den här studien var på en generellt hög nivå. Totalt 215 varianter detekterades – 62 i exon, 8 i splice och 145 i introner. En Mendelsk mutation detekterades I PROC och rara varianter hittades i F2 och FGG. Den starkaste och vanligaste riskfaktorn (F5 Leiden) var högt anrikad i den här studien med 25% jämfört med 3% i en bakgrundspopulation.
86

Étude de la diversité neutre et adaptative chez l'anémone de mer symbiotique Anemonia viridis : apport de techniques de type Next-Generation Sequencing dans les questions de délimitation d’espèces et d’adaptation locale / Study of neutral and adaptive diversity in the symbiotic sea anemone Anemonia viridis : contribution of Next-Generation Sequencing techniques in the questions of species delimitation and local adaptation

Mallien, Cédric 04 December 2017 (has links)
L’anémone de mer symbiotique Anemonia viridis possède cinq morphes définis à l’aide de critères morphologiques. Premièrement, le statut taxonomique de trois des morphes d’A. viridis (var. rufescens, rustica et smaragdina) a été précisé à l’aide de marqueurs moléculaires basés sur des gènes de stress et des marqueurs RAD. Nous avons pu déterminer que ces trois morphes ne formaient qu’une seule espèce et mis en évidence quatre lignées génétiques indépendantes sur base de la géographie (trois en mer Méditerranée, une dans la Manche). Par l’utilisation des variations des séquences ITS2, nous n’avons pu détecter aucune implication du symbiote (Symbiodinium sp.) dans la différenciation des morphes, mais nous avons révélé une composition en symbiotes divergente entre les lignées génétiques indépendantes de l’hôte animal. Par ailleurs, A. viridis se développe dans des environnements particulièrement contrastés, faisant d’elle un modèle d’étude idéal pour l’étude de l’adaptation locale chez les Cnidaires. Par conséquent, l’adaptation locale chez A. viridis a été testée en comparant des populations venant de sites aux conditions environnementales contrastées (surface vs. profondeur et lagune vs. mer). Une recherche de loci outliers sur des marqueurs RAD et des marqueurs de gènes de stress n’a toutefois révélé aucun gène candidat dans l’adaptation locale par rapport aux conditions environnementales testées. Ce travail a donc permis de définir A. viridis comme un organisme extrêmement plastique capable de posséder un fort polymorphisme intrinsèque et de s’acclimater à des habitats contrastés. / The symbiotic sea anemone Anemonia viridis has five morphs described using morphological traits. First, the taxonomical status of three of the morphs of A. viridis (var. rufescens, rustica and smaragdina) was studied using stress gene markers and RAD markers. We revealed that the three morphs were not different species, but that A. viridis was split into four polymorphic independent genetic lineages based on geographical origin (three in the Mediterranean Sea, one in the English Channel). Using ITS2 sequence variation, we could not detect any implication of the symbiont (Symbiodinium sp) in the morph differentiation, but we revealed a divergence in symbiont composition among the geographic independent lineages of the animal host. If no effect of the symbiont was detected, a variable distribution of the ITS2 variants based on geography was revealed. Moreover, A. viridis lives in highly contrasted environments, making it an ideal species to study local adaptation. Thus, local adaptation was tested on A. viridis by comparing populations coming from contrasted environments (shallow vs. deep and lagoon vs. sea). Using RAD and stress genes markers in a search for outlier loci, we revealed no candidate adaptive genes under our environmental conditions. In conclusion, Anemonia viridis seems to be a very plastic organism, with a high intrinsic polymorphism and a high acclimation potential.
87

Next-Generation Sequencing in the Identification of Biomarkers in Cutaneous Melanoma According to the Etiopathogenic Development Pathway and their Potential Clinical Relevance

Millán Esteban, David 12 May 2022 (has links)
Tesis por compendio / [ES] El melanoma es el tipo de cáncer de piel más mortífero y peligroso, ya que tumores de pequeño tamaño pueden generar metástasis. Hasta la fecha, se ha tratado de clasificar desde el punto de vista clínico, epidemiológico y molecular, empleándose actualmente el nivel de exposición solar y la localización del tumor como criterios principales para dividir en distintos grupos a los pacientes de melanoma. En 1998, David Whiteman y colaboradores propusieron un "modelo de vías divergentes" para el desarrollo del melanoma. Este presentaba dos vías: una vinculada a la proliferación melanocítica (nevogénica) y otra relacionada con la exposición solar crónica (CSD). Corroborado desde el punto de vista clínico y epidemiológico, todavía no se ha aportado una caracterización molecular en profundidad. A nivel general se habían identificado genes cuyas mutaciones eran relevantes para el desarrollo del melanoma, como por ejemplo KIT. Sin embargo, todavía se había de estudiar con más detalle la distribución de estas mutaciones entre los distintos subgrupos de melanoma, así como su posible valor pronóstico. En esta tesis se han empleado técnicas de secuenciación - masiva y tradicional - para caracterizar los perfiles mutacionales de las poblaciones del modelo de vías divergentes. Encontramos diferencias tanto en el número de mutaciones como en los genes afectados. También hemos visto cómo los melanomas con mutaciones en KIT parecen desarrollarse por una vía independiente de la etiopatogenia conocida, careciendo el estatus mutacional de este gen de valor pronóstico para la supervivencia de los pacientes. / [CA] El melanoma és el tipus de càncer de pell més mortífer i perillós, ja que fins els tumors de menor mida poden acabar generant metàstasi. Al llarg dels anys, s'ha tractat de classificar des del punt de vista clínic, epidemiològic i molecular. Les classificacions actuals utilitzen el nivell d'exposició solar i la localització tumoral per dividir en diferents grups als pacients de melanoma. Al 1998, David Whiteman i col·laboradors proposaren un model de desenvolupament del melanoma que anomenaren "model de vies divergents". Aquest presentava dos vies per la melanomagènesi: una vinculada a la proliferació melanocítica (nevogènica) i l'altra relacionada amb l'exposició solar crònica (CSD). Malgrat aquest model fou corroborat des del punt de vista clínic i epidemiològic, encara no s'ha aportat una caracterització molecular en profunditat. A nivell general s'havien identificat gens les mutacions dels quals eren rellevants per al desenvolupament del melanoma, com el gen KIT. Però, encara s'havia d'estudiar amb més cura la distribució d'estes mutacions entre els distints subgrups de melanoma, així com el seu possible valor pronòstic. En aquesta tesi s'han emprat tècniques de seqüenciació -massiva i tradicional- per caracteritzar els perfils mutacionals de les dues poblacions proposades pel model de vies divergents, trobant diferències tant al nombre de mutacions com als gens afectats. També hem vist com els melanomes mutats en KIT semblen desenvolupar-se per una via independent de l'etiopatogènia coneguda, mancant l'estatus mutacional d'aquest gen de valor pronòstic per la supervivència dels pacients. / [EN] Melanoma is the deadliest and most dangerous type of skin cancer, given that a small tumor can spread and result in metastasis. Over the years, classifications have been made either from a clinical, epidemiological or molecular point of view. Current classifications use the degree of solar exposure and tumoral location to divide into different melanoma groups. In 1998, David Whiteman and collaborators proposed the divergent pathway model for melanoma development. This presented two pathways to melanomagenesis: one related to melanocytic proliferation (nevogenic) and the other related to chronic sun exposure (CSD). Despite corroborations of this model from the clinic and epidemiology, it is yet to be molecularly characterized in depth. At a general level, different genes had been identified with relevant mutations for the development of melanoma, as is the gene KIT. However, there was a lack of knowledge on how these mutations were distributed among different melanoma subgroups, as well as the potential prognostic value. In this thesis we have implemented sequencing techniques - both massive and traditional - to characterize the mutational profile of the two populations proposed by the divergent pathways model. We found differences both in the number of mutations and in the genes carrying the mutations. We have also seen how melanomas harboring KIT mutations seem to develop in a way which is independent from the known etiology, and how the mutational status of this gene lacks prognostic value on the outcome of the patients. / Millán Esteban, D. (2022). Next-Generation Sequencing in the Identification of Biomarkers in Cutaneous Melanoma According to the Etiopathogenic Development Pathway and their Potential Clinical Relevance [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/182977 / TESIS / Compendio
88

Evolution of Penicillium fungi : Adaptation and Degeneration in Fermented Food Environments / L'évolution des Penicillium : adaptation et dégénérescence dans lesenvironnements alimentaires fermentés

Lo, Ying-Chu 25 June 2019 (has links)
La domestication est un modèle idéal pour étudier les processus évolutifs car elle implique des événements d'adaptation récents avec une sélection forte. Les champignons sont de bons organismes modèles pour étudier la domestication et plus généralement l’adaptation, grâce à leurs petits génomes et leur facilité de manipulation. Ils sont utilisés depuis longtemps pour la transformation alimentaire, par exemple P. camemberti et P. roqueforti pour la fabrication du fromage, et la levure Saccharomyces pour la fermentation du vin et de la bière. Chez ces champignons, des caractéristiques bénéfiques ont été acquises pour la transformation alimentaire, et les transferts horizontaux de gènes se sont révélés être un moyen essentiel d’adaptation rapide dans l’environnement alimentaire. Ici, j’ai étudié principalement l’adaptation de deux espèces de Penicillium relativement distantes phylogénétiquement - P. nalgiovense et P. salamii, toutes deux utilisées pour la maturation de la viande séchée. J’ai étudié si ces champignons ont été domestiqués, c’est-à-dire si les populations alimentaires se sont adaptées à l’environnement de la viande séchée, et s’il y a eu une différenciation génétique par rapport à d’autres populations; j’ai aussi recherché si des traces génomiques d’adaptation pouvaient être détectées. En analysant des génomes complets, j’ai trouvé peu de diversité génétique et de structure de population chez P. salamii et encore moins chez P. nalgiovense. Des expériences ont montré que les populations de P. salamii et P. nalgiovense provenant de viande séchée présentaient des taux de protéolyse et de lipolyse plus faibles et des couleurs différentes de celles des populations de viande non séchée. De plus, nous avons trouvé des transferts de gènes horizontaux partagés par P. salamii et P. nalgiovense et absents chez d’autres espèces de Penicillium. En résumé, ces résultats indiquent une évolution convergente et une adaptation des populations de P. salamii et P. nalgiovense à la viande séchée. J'ai également étudié les conséquences de la domestication chez le champignon utilisé pour la production de fromages bleus, P. roqueforti, montrant une faible fertilité des souches fromagères par rapport aux souches non fromagères. Les résultats de la thèse soulignent donc l'importance des transferts de gènes horizontaux pour une adaptation rapide chez les champignons et renforcent l'idée que les champignons domestiqués pour la production de nourriture sont de bons modèles pour étudier l'adaptation et l'évolution. / Domestication is an ideal model to study evolutionary processes due to the recent adaptation events and strong selection it implies. Fungi in particular are good model organisms to study domestication and more generally adaptation, with their small genomes and experimental tractability. Fungi have been used for food production, e.g., P. camemberti and P. roqueforti for cheesemaking, and Saccharomyces yeast for wine and beer fermentation. In these fungi, beneficial traits have been acquired for food production, and horizontal gene transfers (HGTs) have been shown to be a major way to rapid adaptation in food environment. Here, I mainly studied the adaptation of food Penicillium fungi using two distantly related Penicillium species - P. nalgiovense and P. salamii, both used for dry-cured meat maturation, to assess whether these fungi have been domesticated, i.e., whether food populations adapted to the dry-cured meat environment, whether were genetically differentiated from other populations, and whether we could find genomic footprints of adaptive events. Using genome sequencing, we found little diversity and population structure in P. salamii and even less in P. nalgiovense. Experiments showed that both P. salamii and P. nalgiovense dry-cured meat populations had lower proteolysis and lipolysis rates and different colors from non-dry-cured meat populations. Furthermore, we found HGTs shared by P. salamii and P. nalgiovense while lacking in other Penicillium species. Altogether, these results indicate convergence evolution and adaptation in P. salamii and P. nalgiovense dry-cured meat populations, as was previously found in cheese Penicillium fungi. I also studied the consequences of domestication in the blue cheese fungus P. roqueforti, showing lower fertility of cheese strains compared to non-cheese strains. The results of the thesis thus point out the importance of HGTs for rapid adaptation in fungi and reinforce the view that fungi are ideal models to study adaptation and evolution.
89

Distance-based methods for the analysis of Next-Generation sequencing data

Otto, Raik 14 September 2021 (has links)
Die Analyse von NGS Daten ist ein zentraler Aspekt der modernen genomischen Forschung. Bei der Extraktion von Daten aus den beiden am häufigsten verwendeten Quellorganismen bestehen jedoch vielfältige Problemstellungen. Im ersten Kapitel wird ein neuartiger Ansatz vorgestellt welcher einen Abstand zwischen Krebszellinienkulturen auf Grundlage ihrer kleinen genomischen Varianten bestimmt um die Kulturen zu identifizieren. Eine Voll-Exom sequenzierte Kultur wird durch paarweise Vergleiche zu Referenzdatensätzen identifiziert so ein gemessener Abstand geringer ist als dies bei nicht verwandten Kulturen zu erwarten wäre. Die Wirksamkeit der Methode wurde verifiziert, jedoch verbleiben Einschränkung da nur das Sequenzierformat des Voll-Exoms unterstützt wird. Daher wird im zweiten Kapitel eine publizierte Modifikation des Ansatzes vorgestellt welcher die Unterstützung der weitläufig genutzten Bulk RNA sowie der Panel-Sequenzierung ermöglicht. Die Ausweitung der Technologiebasis führt jedoch zu einer Verstärkung von Störeffekten welche zu Verletzungen der mathematischen Konditionen einer Abstandsmetrik führen. Daher werden die entstandenen Verletzungen durch statistische Verfahren zuerst quantifiziert und danach durch dynamische Schwellwertanpassungen erfolgreich kompensiert. Das dritte Kapitel stellt eine neuartige Daten-Aufwertungsmethode (Data-Augmentation) vor welche das Trainieren von maschinellen Lernmodellen in Abwesenheit von neoplastischen Trainingsdaten ermöglicht. Ein abstraktes Abstandsmaß wird zwischen neoplastischen Entitäten sowie Entitäten gesundem Ursprungs mittels einer transkriptomischen Dekonvolution hergestellt. Die Ausgabe der Dekonvolution erlaubt dann das effektive Vorhersagen von klinischen Eigenschaften von seltenen jedoch biologisch vielfältigen Krebsarten wobei die prädiktive Kraft des Verfahrens der des etablierten Goldstandard ebenbürtig ist. / The analysis of NGS data is a central aspect of modern Molecular Genetics and Oncology. The first scientific contribution is the development of a method which identifies Whole-exome-sequenced CCL via the quantification of a distance between their sets of small genomic variants. A distinguishing aspect of the method is that it was designed for the computer-based identification of NGS-sequenced CCL. An identification of an unknown CCL occurs when its abstract distance to a known CCL is smaller than is expected due to chance. The method performed favorably during benchmarks but only supported the Whole-exome-sequencing technology. The second contribution therefore extended the identification method by additionally supporting the Bulk mRNA-sequencing technology and Panel-sequencing format. However, the technological extension incurred predictive biases which detrimentally affected the quantification of abstract distances. Hence, statistical methods were introduced to quantify and compensate for confounding factors. The method revealed a heterogeneity-robust benchmark performance at the trade-off of a slightly reduced sensitivity compared to the Whole-exome-sequencing method. The third contribution is a method which trains Machine-Learning models for rare and diverse cancer types. Machine-Learning models are subsequently trained on these distances to predict clinically relevant characteristics. The performance of such-trained models was comparable to that of models trained on both the substituted neoplastic data and the gold-standard biomarker Ki-67. No proliferation rate-indicative features were utilized to predict clinical characteristics which is why the method can complement the proliferation rate-oriented pathological assessment of biopsies. The thesis revealed that the quantification of an abstract distance can address sources of erroneous NGS data analysis.
90

Dynamics of Napier stunt phytoplasma between the cultivated and wild graminae in East Africa / George Ochieng Asudi

Asudi, George Ochieng January 2015 (has links)
Cultivation of Napier grass, Pennisetum purpureum, the most important livestock crop in East Africa is severely constrained by Napier Grass Stunt (NGS) disease. The disease spreads via an insect vector or vegetative propagation of infected plant material and is caused by a phytoplasma. This necessitates the development of an integrated management approach for the disease. Therefore, objectives of this study were to assess the incidence of the disease and its severity, to identify its wild hosts and farmers‟ knowledge on these hosts, to assess the threat of NGS disease to cultivated grasses and to establish the role of wild inoculum sources in its spread. The study showed NGS incidence ranging from 33% in Uganda to 95% in Kenya with 49% of the farmers interviewed, being able to discern NGS disease by its symptoms. Most farmers cited roguing and use of alternative fodder grasses as control measures, making these strategies the likely components of an integrated management approach for the disease. Responders named Sedge grass (Cyperus spp.) and Star grass (Cynodon dactylon) as the likely hosts of diseases caused by phytoplasma. Phytoplasmas were detected in leaves of 11 of 33 wild grass species collected using polymerase chain reaction (PCR) based on the highly conserved phytoplasma-specific 16S ribosomal DNA fragment. Sequence determination of amplified PCR fragments revealed the presence of NGS-related phytoplasmas in 11 grass species, Bermuda grass white leaf (BGWL) phytoplasmas in three and goosegrass white leaf (GGWL) in two wild grass species, showing that the geographical distribution and diversity of phytoplasmas and their grass hosts are greater than previously thought. The relationships between NGS and Hyparrhenia grass white leaf (HGWL) phytoplasmas were determined using sequences based on secA gene and immunodominant protein (imp). Results showed a very low genetic diversity between NGS and HGWL and produced a phylogenetic tree congruent to that produced by the 16S, affirming the inclusion of HGWL in the 16SrXI group. NGS phytoplasma was transmissible to food crops through Maiestas banda Kramer (Hemiptera: Cicadellidae) under screen-house conditions. With 56.3%, Saccharum officinarum showed the highest infection level followed by Eleusine coracana with 50%, Sorghum bicolor with 43.8%, Oryza sativa with 31.3% and Zea mays with 18.8%. All the phytoplasma-infected plants were asymptomatic except S. officinarum plants, which showed mild to moderate symptoms consisting of foliar yellow leaves and bright white or yellow midribs. This hints that besides wild hosts, food crops may also serve as alternative source of inoculum enabling a complex NGS disease cycle, which may add to challenges in the development of the disease control strategies. However, failure by M. banda to transmit HGWL and BGWL phytoplasmas back to Napier grass is an indication that it could be the exclusive vector of NGS. Therefore, there is need to initiate transmission trials using planthoppers and leafhoppers occurring on HGWL and BGWL phytoplasma-infected grasses to determine whether insect vectors capable of transmitting phytoplasmas from native grasses to Napier grass, are present in the region. / PhD (Environmental Sciences), North-West University, Potchefstroom Campus, 2015

Page generated in 0.0805 seconds