• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 205
  • 96
  • 42
  • 29
  • 8
  • 5
  • 4
  • 2
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 470
  • 470
  • 86
  • 85
  • 82
  • 75
  • 71
  • 53
  • 49
  • 45
  • 41
  • 37
  • 35
  • 35
  • 32
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
111

Analyzing TCGA Genomic and Expression Data Using SVM with Embedded Parameter Tuning

Zhao, Haitao January 2014 (has links)
No description available.
112

A Journey Through the Developing Kidney:Analysis of normal and Hoxa9,10,11-/-Hoxd9,10,11-/- Mouse Models

Magella, Bliss 07 June 2018 (has links)
No description available.
113

Gene Expression Regulation in the Mouse Liver by Mechanistic Target Of Rapamycin Complexes I and II

Poluyanoff, Anthony 15 July 2020 (has links) (PDF)
The mechanistic target of rapamycin (mTOR) is a key serine/threonine protein kinase that functions in complexes mTORC1 and mTORC2. mTORC1, originally discovered due to its sensitivity towards the mTOR inhibitor rapamycin, responds to extracellular growth factor signaling, WNT signaling, and nutrient abundance via glucose and amino acid-triggered signaling. Downstream effectors of mTORC1 include autophagy, mitochondrial metabolic function, protein synthesis, and ribosome biogenesis. mTORC2, initially discovered as a rapamycin-insensitive complex of mTOR, responds to insulin, growth factor signaling, and inflammatory signaling such as tumor necrosis factor-alpha, with its downstream effectors being Akt, a key serine/threonine kinase that functions in cell division and is frequently dysregulated in many types of cancer, the NFkB pathway, and cytoskeletal reorganization and protein synthesis. Much research has been devoted to mTORC1 signaling, with mTORC2 receiving significantly less attention, despite both complexes’ regulation of key cellular activities and response to rapamycin, as well as to other rapamycin-derived drugs (rapalogs). We have targeted both mTORC1 and mTORC2 for hepatocyte-specific deletion during the gestational period of mice, with the goal of describing mTORC1 and mTORC2 signaling and its perturbation in the adult mouse hepatocyte. Our model has shown that deletion of RAPTOR, the regulatory associated protein of mTOR, and RICTOR, the rapamycin insensitive component of mTOR, in mTORC1 and mTORC2 respectively, leads to widespread effects on the hepatocyte transcriptome. We have found that a subset of genes responds both to Raptor and Rictor knockout, and an analysis of these genes indicates their function in key disorders of the liver, such as non-alcoholic fatty liver disease and hepatocellular carcinoma. Bioinformatic analysis following hepatocyte RNA sequencing of mTORC1 and mTORC2 knockout mice has revealed an unexpected upregulation of genes known to be regulated by these respective complexes. We have also found that cross talk exists between both complexes, in which the knockout of one yields the activation of the other. We have additionally found translationally relevant enrichments following Ingenuity Pathway Analysis (IPA) of RNA sequencing data. These results provide a key mechanistic discovery of mTOR signaling activity, and allow for a better understanding of the potential physiological effects of mTOR inhibition in human patients.
114

Identifying Novel Contributors to RNA Interference in Aedes aegypti

Saadat, Angela P. 02 September 2015 (has links)
Aedes aegypti is an important vector of human pathogens including the viruses yellow fever, dengue and chikungunya. The small interfering RNA (siRNA) pathway is a critical immune response for controlling viral replication in Aedes aegypti. The goal of this research is to identify components of the Aedes aegypti genome that influence this pathway. A transgenic mosquito strain that reports the status of the siRNA pathway via enhanced green fluorescent protein (EGFP) intensity was employed to differentiate silencing abilities among individuals. Extreme EGFP expression phenotypes, representing efficient and poor silencing abilities, were enriched over five generations. Transcriptome sequencing and analyses were performed from pools of individuals from each enriched phenotype, revealing potential RNAi contributors. 1,120 transcripts were significantly different (FDR<0.0001) among the extreme phenotypes. Four genes were chosen, amplified, sequenced for SNP analysis. These analyses were performed on samples obtained by crossing enriched, extreme phenotype F0 individuals, intercrossing their progeny, then selecting individuals representing the extreme phenotypes from the F2 population. Though further verification is needed, findings from these analyses imply the regions of Aedes aegypti, Liverpool strain (AAEL) gene identifiers AAEL005026, AAEL013438 and AAEL011704 amplified do not contribute to the two extreme, opposite RNAi silencing in the sensor strain used here. SNP analyses of AAEL000817 indicate this gene either influences extreme RNAi phenotypes or is closely linked to a gene(s) that contributes to RNAi in Aedes aegypti. The 1,120 genes identified can be validated or eliminated as potential targets in the quest to mitigate the impact of Aedes aegypti. / Master of Science in Life Sciences
115

Development of bioinformatic tools for massive sequencing analysis

Furió Tarí, Pedro 19 October 2020 (has links)
[EN] Transcriptomics is one of the most important and relevant areas of bioinformatics. It allows detecting the genes that are expressed at a particular moment in time to explore the relation between genotype and phenotype. Transcriptomic analysis has been historically performed using microarrays until 2008 when high-throughput RNA sequencing (RNA-Seq) was launched on the market, replacing the old technique. However, despite the clear advantages over microarrays, it was necessary to understand factors such as the quality of the data, reproducibility and replicability of the analyses and potential biases. The first section of the thesis covers these studies. First, an R package called NOISeq was developed and published in the public repository "Bioconductor", which includes a set of tools to better understand the quality of RNA-Seq data, minimise the impact of noise in any posterior analyses and implements two new methodologies (NOISeq and NOISeqBio) to overcome the difficulties of comparing two different groups of samples (differential expression). Second, I show our contribution to the Sequencing Quality Control (SEQC) project, a continuation of the Microarray Quality Control (MAQC) project led by the US Food and Drug Administration (FDA, United States) that aims to assess the reproducibility and replicability of any RNA-Seq analysis. One of the most effective approaches to understand the different factors that influence the regulation of gene expression, such as the synergic effect of transcription factors, methylation events and chromatin accessibility, is the integration of transcriptomic with other omics data. To this aim, a file that contains the chromosomal position where the events take place is required. For this reason, in the second chapter, we present a new and easy to customise tool (RGmatch) to associate chromosomal positions to the exons, transcripts or genes that could regulate the events. Another aspect of great interest is the study of non-coding genes, especially long non-coding RNAs (lncRNAs). Not long ago, these regions were thought not to play a relevant role and were only considered as transcriptional noise. However, they represent a high percentage of the human genes and it was recently shown that they actually play an important role in gene regulation. Due to these motivations, in the last chapter we focus, first, in trying to find a methodology to find out the generic functions of every lncRNA using publicly available data and, second, we develop a new tool (spongeScan) to predict the lncRNAs that could be involved in the sequestration of micro-RNAs (miRNAs) and therefore altering their regulation task. / [ES] La transcriptómica es una de las áreas más importantes y destacadas en bioinformática, ya que permite ver qué genes están expresados en un momento dado para poder explorar la relación existente entre genotipo y fenotipo. El análisis transcriptómico se ha realizado históricamente mediante el uso de microarrays hasta que, en el año 2008, la secuenciación masiva de ARN (RNA-Seq) fue lanzada al mercado y comenzó a desplazar poco a poco su uso. Sin embargo, a pesar de las ventajas evidentes frente a los microarrays, resultaba necesario entender factores como la calidad de los datos, reproducibilidad y replicabilidad de los análisis así como los potenciales sesgos. La primera parte de la tesis aborda precisamente estos estudios. En primer lugar, se desarrolla un paquete de R llamado NOISeq, publicado en el repositorio público "Bioconductor", el cual incluye un conjunto de herramientas para entender la calidad de datos de RNA-Seq, herramientas de procesado para minimizar el impacto del ruido en posteriores análisis y dos nuevas metodologías (NOISeq y NOISeqBio) para abordar la problemática de la comparación entre dos grupos (expresión diferencial). Por otro lado, presento nuestra contribución al proyecto Sequencing Quality Control (SEQC), una continuación del proyecto Microarray Quality Control (MAQC) liderado por la US Food and Drug Administration (FDA) que pretende evaluar precisamente la reproducibilidad y replicabilidad de los análisis realizados sobre datos de RNA-Seq. Una de las estrategias más efectivas para entender los diferentes factores que influyen en la regulación de la expresión génica, como puede ser el efecto sinérgico de los factores de transcripción, eventos de metilación y accesibilidad de la cromatina, es la integración de la transcriptómica con otros datos ómicos. Para ello se necesita generar un fichero que indique las posiciones cromosómicas donde se producen estos eventos. Por este motivo, en el segundo capítulo de la tesis presentamos una nueva herramienta (RGmatch) altamente customizable que permite asociar estas posiciones cromosómicas a los posibles genes, transcritos o exones a los que podría estar regulando cada uno de estos eventos. Otro de los aspectos de gran interés en este campo es el estudio de los genes no codificantes, especialmente los ARN largos no codificantes (lncRNAs). Hasta no hace mucho, se pensaba que estos genes no jugaban ningún papel fundamental y se consideraban como simple ruido transcripcional. Sin embargo, suponen un alto porcentaje de los genes del ser humano y se ha demostrado que juegan un papel crucial en la regulación de otros genes. Por este motivo, en el último capítulo nos centramos, en un primer lugar, en intentar obtener una metodología que permita averiguar las funciones generales de cada lncRNA haciendo uso de datos ya publicados y, en segundo lugar, generamos una nueva herramienta (spongeScan) que permite predecir qué lncRNAs podrían estar secuestrando determinados micro-RNAs (miRNAs), alterando así la regulación llevada a cabo por estos últimos. / [CA] La transcriptòmica és una de les àrees més importants i destacades en bioinformàtica, ja que permet veure quins gens s'expressen en un moment donat per a poder explorar la relació existent entre genotip i fenotip. L'anàlisi transcriptòmic s'ha fet històricament per mitjà de l'ús de microarrays fins l'any 2008 quan la tècnica de seqüenciació massiva d'ARN (RNA-Seq) es va fer pública i va començar a desplaçar a poc a poc el seu ús. No obstant això, a pesar dels avantatges evidents enfront dels microarrays, resultava necessari entendre factors com la qualitat de les dades, reproducibilitat i replicabilitat dels anàlisis, així com els possibles caires introduïts. La primera part de la tesi aborda precisament estos estudis. En primer lloc, es va programar un paquet de R anomenat NOISeq publicat al repositori públic "Bioconductor", el qual inclou un conjunt d'eines per a entendre la qualitat de les dades de RNA-Seq, eines de processat per a minimitzar l'impact del soroll en anàlisis posteriors i dos noves metodologies (NOISeq i NOISeqBio) per a abordar la problemàtica de la comparació entre dos grups (expressió diferencial). D'altra banda, presente la nostra contribució al projecte Sequencing Quality Control (SEQC), una continuació del projecte Microarray Quality Control (MAQC) liderat per la US Food and Drug Administration (FDA) que pretén avaluar precisament la reproducibilitat i replicabilitat dels anàlisis realitzats sobre dades de RNA-Seq. Una de les estratègies més efectives per a entendre els diferents factors que influïxen a la regulació de l'expressió gènica, com pot ser l'efecte sinèrgic dels factors de transcripció, esdeveniments de metilació i accessibilitat de la cromatina, és la integració de la transcriptómica amb altres dades ómiques. Per això es necessita generar un fitxer que indique les posicions cromosòmiques on es produïxen aquests esdeveniments. Per aquest motiu, en el segon capítol de la tesi presentem una nova eina (RGmatch) altament customizable que permet associar aquestes posicions cromosòmiques als possibles gens, transcrits o exons als que podria estar regulant cada un d'aquests esdeveniments regulatoris. Altre dels aspectes de gran interés en aquest camp és l'estudi dels genes no codificants, especialment dels ARN llargs no codificants (lncRNAs). Fins no fa molt, encara es pensava que aquests gens no jugaven cap paper fonamental i es consideraven com a simple soroll transcripcional. No obstant això, suposen un alt percentatge dels gens de l'ésser humà i s'ha demostrat que juguen un paper crucial en la regulació d'altres gens. Per aquest motiu, en l'últim capítol ens centrem, en un primer lloc, en intentar obtenir una metodologia que permeta esbrinar les funcions generals de cada lncRNA fent ús de dades ja publicades i, en segon lloc, presentem una nova eina (spongeScan) que permet predeir quins lncRNAs podríen estar segrestant determinats micro-RNAs (miRNAs), alterant així la regulació duta a terme per aquests últims. / Furió Tarí, P. (2020). Development of bioinformatic tools for massive sequencing analysis [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/152485
116

A genomic approach to the evolution, diversification and domestication of the genus Citrus

Borredá Fernández, Carles 04 November 2021 (has links)
[EN] Citrus is a diverse genus within the Aurantioideae subfamily that comprises an undetermined number of pure species natively found in a vast territory extending from India to Japan and Australia. Besides pure species, countless citrus admixtures of commercial interest such as mandarins, oranges and lemons have been traditionally included in this genus, even though they are the product of several interspecific crosses between pure species. Recently, a genome-wide analysis provided the backbone of the Citrus phylogeny, showing that the wild species diverged from an ancestral citrus in a rapid radiation during the Late Miocene. Understanding the processes that shaped the evolution and domestication of the genus will provide novel insights in the field of plant genome evolution. In this doctoral thesis, multiple genomic approaches have been used to expand the existing knowledge on major determinants driving the processes of evolution, diversification and domestication in Citrus. First, a genome-wide Aurantioideae phylogeny was generated, revealing the existence of several independent dispersal events in this subfamily in the last 10 million years, from Asia to Africa and Australia, and rooting the Citrus genus within this subfamily. The Citrus phylogeny was then studied under the multispecies coalescent model, which can capture the variability generated during fast radiations. The dating of the speciation events allowed to advance original proposals on the paleogeographic events triggering the migration of the Citrus species through the South East Asian region. The Citrus radiation generated the great genetic and phenotypic diversity found in this genus. To investigate the effects of the Late Miocene climate change on the genomic structure of the Citrus pure species, the activity and evolution of retrotransposons, which can significantly alter the genome of their hosts, was analyzed. Most of the Citrus retrotransposon families are shared with Severinia buxifolia, an Aurantioideae species that diverged from Citrus more than 10 million years ago, implying that few retrotransposon families are specific to the genus Citrus. However, estimations of the retrotransposon insertion rates within Citrus revealed that, shortly after the radiation, the transposon activity rapidly changed among the different species. Hence, the data indicates that retrotransposon dynamics are linked to the stress caused by the Late Miocene climate change and the Citrus speciation, although specific responses likely depend on the particular evolutionary history of each species. The differences of gene expression in fruits of domesticated and wild cultivars were then studied to understand the role of interspecific hybridizations during Citrus domestication. The results presented suggest that these events, together with asexual propagation, were key for the domestication process. Different mechanisms explaining commercially relevant Citrus traits are also proposed. For example, pulp acidity in citrons and lemons is linked to an increased proton influx to the pulp vacuoles. The data also indicate that the peel pigmentation might be controlled by the additive effect of several minor genes, and not by a single gene or mechanism. Finally, an allele-dependent expression pattern of a chalcone synthase, involved in the flavonoid biosynthesis, advocates for the existence of a stepwise evolution in the mandarin flavonoid accumulation. All in all, the transcriptomic approach used in this work allowed to generate broader hypotheses that stand from a genus-wide perspective. Overall, the results provide a comprehensive framework of Citrus phylogenetic relationships, the effect of the mobile elements during its diversification and the role of interspecific hybridizations in the citrus domestication. The insights here exposed reveal the inherent complexity of the evolutionary history of this fascinating genus. / [ES] El género Citrus (Aurantioideae) abarca un número desconocido de especies puras, nativas en buena parte del sudeste asiático y Oceanía. Muchas variedades comerciales, como mandarinas o naranjas, también forman parte de este género. Recientemente, la estructura de la filogenia del género Citrus ha sido publicada en un estudio el que se propone que los cítricos actuales surgieron en un proceso de radiación rápida durante el Mioceno tardío, hace 8 millones de años. Una mejor comprensión de los procesos involucrados en la evolución y posterior domesticación del género Citrus proporcionaría nuevas perspectivas en el ámbito de la genómica de plantas. En esta Tesis Doctoral se han empleado diversas estrategias genómicas para ampliar el conocimiento existente sobre los procesos implicados en la evolución, diversificación y domesticación de los cítricos. En primer lugar, se generó un árbol filogenético de las Aurantioideae, anclando el género Citrus dentro esta subfamilia. Esta filogenia reveló varios eventos de dispersión entre estas especies, generalmente desde Asia hacia África u Oceanía. Después, se estudió la filogenia del género Citrus empleando el modelo coalescente de multiespecie, que refleja la variabilidad inherente a los procesos de radiación. La datación de los distintos eventos de especiación ha permitido hacer nuevas propuestas sobre la paleogeografía y su papel en la distribución actual de los cítricos a lo largo del sudeste asiático. Para investigar los efectos del cambio climático del Mioceno tardío en el genoma de los cítricos, se analizó la actividad y la evolución de los retrotransposones como fuente de variabilidad genética en distintas especies de cítricos. Muchos de los retrotransposones de los cítricos también se encuentran en Severinia¿ un género de las aurantioideas que divergió del ancestro de los cítricos hace 10 millones de años, sugiriendo que pocos de los retrotransposones de cítricos son exclusivos de este género. En cambio, las tasas de inserción de retrotransposones en cítricos revelaron que la actividad de estos elementos cambió drásticamente entre especies poco después de la radiación de los cítricos. Por tanto, es posible que dicha actividad esté ligada al estrés climático durante el Mioceno tardío, así como a la especiación de los cítricos, aunque también parece verse afectada por las condiciones evolutivas particulares de las especies estudiadas. Por último, se estudiaron las diferencias en la expresión génica entre variedades domesticadas y especies salvajes para conocer el papel de las hibridaciones interespecíficas en la domesticación de los cítricos. Los resultados obtenidos sugieren que dichas hibridaciones, junto a la propagación clonal, fueron clave para el proceso de domesticación. Estos resultados también permiten proponer un mecanismo que explica la acidez de la pulpa de cidros y limones basado en el flujo de protones al lumen vacuolar. Los datos también parecen indicar que el color de los cítricos no depende de un único gen, sino que depende del efecto aditivo de varios genes en conjunto. Finalmente, se descubrió una copia del gen de la chalcona sintasa, necesario para la síntesis de flavonoides, que tan solo se expresa en mandarinas y variedades derivadas, lo que sugiere que la acumulación de flavonoides en estas variedades proviene de un proceso evolutivo escalonado. La obtención de estos resultados fue posible gracias a la estrategia de análisis transcriptómico escogida, que abarca varias especies del género Citrus. En conclusión, los resultados presentados en este trabajo aportan un marco de trabajo global en la filogenia del género Citrus, además de realizar nuevas propuestas sobre el efecto de los elementos móviles en la diversificación de los cítricos y el papel de las hibridaciones interespecíficas durante su domesticación. Los datos presentados en este trabajo revelan la compl / [CAT] El gènere Citrus (Aurantioideae) comprèn un nombre desconegut d'espècies pures, natives en un ampli territori que s'estén pel sud-est asiàtic i Oceania. Un gran nombre de varietats comercials de cítrics, com mandarines, taronges o llimes, també s'inclouen dins del gènere Citrus. L'estructura bàsica de la filogènia del gènere Citrus ha sigut publicada recentment, a un estudi al que es proposa que els cítrics actuals sorgiren en un procés de radiació ràpida que va tindre lloc en el Miocè superior, fa 8 milions d'anys. Una millor comprensió dels processos involucrats en l'evolució i posterior domesticació del gènere Citrus podria proporcionar noves perspectives dins de l'àmbit de l'evolució del genoma de plantes. Al llarg d'aquesta Tesi Doctoral s'han emprat diverses estratègies genòmiques per a ampliar el coneixement existent sobre els processos que van dirigir l'evolució, diversificació i domesticació dels cítrics. En primer lloc, es va generar una filogènia de les aurantioideas, ancorant el gènere Citrus dins d'aquesta subfamília. Esta filogènia va revelar l'existència de diversos esdeveniments de dispersió en estes espècies, generalment des d'Àsia cap a Àfrica o Oceania. Després, la filogènia dels cítrics es va estudiar emprant el model evolutiu coalescent multiespècie, que reflecteix la variabilitat inherent als processos de radiació ràpida. La datació de la especiació dels cítrics han permès fer noves propostes sobre la paleografia i el seu paper en la distribució actual dels cítrics per tot el sud-est asiàtic. Per a investigar els efectes del canvi climàtic ocorregut durant el Miocè superior en l'estructura genòmica dels cítrics, s'analitzà l'activitat i evolució dels retrotransposons com a font de variabilitat genètica en distintes espècies de cítrics. La majoria dels retrotransposons dels cítrics també es troben en Severinia¿ un gènere de les aurantioidees que va divergir de l'avantpassat dels cítrics fa 10 milions d'anys, la qual cosa suggereix que tan sols unes poques famílies de retrotransposons son exclusives dels cítrics. En canvi, l'estimació de les taxes d'inserció dels retrotransposons revela que l'activitat d'aquests elements va patir canvis dràstics entre espècies poc després de la radiació dels cítrics. Per tant, l'esmenada activitat podria estar lligada a l'estrès climàtic de finals del Miocé, així com a l'especiació dels cítrics, encara que també sembla veure's afectada per les condicions evolutives particulars de cada espècie. Finalment, es van estudiar les diferències a l'expressió gènica entre varietats domesticades i espècies salvatges per a conèixer el paper de les hibridacions interespecífiques en el procés de domesticació dels cítrics. Els resultats suggereixen que aquestes hibridacions, junt a la propagació clonal de les varietats de interès, foren clau en la domesticació. Els resultats també han permès proposar un mecanisme que explica l'acidesa de la polpa de poncems i llimes basat en el flux de protons al lumen vacuolar. D'altra banda, el color dels cítrics no pareix dependre d'un únic gen, sinó de l'efecte additiu de diversos gens en conjunt. Finalment, s'ha trobat una còpia del gen de la chalcona sintasa, necessària per a la síntesi de flavonoides, que tan sols s'expressa en mandarines i varietats derivades, suggerint que l'acumulació de flavonoides en aquestes varietats és el resultat d'un procés evolutiu escalonat. L'obtenció d'aquests resultats fou possible gràcies a l'estratègia d'anàlisi escollida, que inclou diverses espècies del gènere Citrus. En conclusió, els resultats presentats en aquest treball aporten un marc de treball global a la filogènia dels cítrics, a banda de permetre realitzar noves propostes sobre el efecte dels elements mòbils en la diversificació dels cítrics i el paper de les hibridacions interespecífiques durant la seua domesticació. Les dades presenta / Borredá Fernández, C. (2021). A genomic approach to the evolution, diversification and domestication of the genus Citrus [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/176003
117

Analyse intégrative des ARN longs non-codants chez le chien et leurs implications dans le mélanome oral canin, modèle des mélanomes humains / Integrative analysis of long non-coding RNAs in dogs and their implications in canine oral melanoma, human melanoma model

Le Béguec, Céline 10 October 2018 (has links)
Les ARN longs non-codants (lncRNAs) constituent une famille d'ARN hétérogènes qui jouent un rôle majeur dans de nombreux cancers et notamment dans les mélanomes. Le chien est un modèle naturel et spontané pour l’analyse génétique comparée des cancers et, l'annotation du génome canin a récemment été enrichie avec l'identification de plus 10 000 lncRNAs. Afin de réaliser des prédictions fonctionnelles bioinformatiques des lncRNAs, nous avons caractérisé les profils d'expression des lncRNAs canins à partir de 26 tissus distincts. Nous avons défini la spécificité tissulaire de l’expression des lncRNAs et inféré leur fonctionnalité potentielle par des analyses de génomique et de transcriptomique comparatives avec des données humaines issues du projet ENCODE (ENCyclopedia Of DNA Elements). Comme chez l'homme et la souris, une grande proportion de lncRNAs canins (44 %) est exprimée de manière spécifique au sein d’un tissu. Par une approche de génomique comparative, nous avons identifié plus de 900 lncRNAs orthologues entre l’homme et le chien et pour 26 % d’entre eux, des patrons d'expression entre tissus significativement conservés (p < 0,05). Dans le cadre de l'étude des mélanomes canins, nous avons analysé les données de RNA-seq de 52 échantillons tumeurs/contrôles de mélanomes oraux. Nous avons identifié plus de 750 lncRNAs différentiellement exprimés entre la tumeur et le contrôle (FDR < 0,01), dont plus de 100 conservés avec l’homme. Ces lncRNAs constituent de bons candidats pour étudier la régulation de la progression tumorale des mélanomes chez le chien et pourront être évalués pour leurs potentiels diagnostic et thérapeutique en médecine humaine et vétérinaire. / Long non-coding RNAs (lncRNAs) are a family of heterogeneous RNAs that play a major role in many cancers, particularly in melanomas. The dog is a natural and spontaneous model for the comparative genetic analysis of cancers and, the annotation of the canine genome has recently been enriched with the identification of over 10,000 lncRNAs. In order to perform functional bioinformatic predictions of lncRNAs, we have characterized the expression patterns of canine lncRNAs from 26 distinct tissues representative of the major functions of the organism. We defined the tissue specificity of lncRNAs expression and inferred their potential functionality by comparative genomic and transcriptomic analyses with human data from the ENCODE project (ENCyclopedia Of DNA Elements). As in humans and mice, we show that a large proportion of canine lncRNAs (44%) are expressed specifically within a tissue. Using a comparative genomic approach, we have identified more than 900 orthologue lncRNAs between humans and dogs, and we show that for 26% of them, tissue expression patterns are also significantly conserved (p < 0.05). In the study of canine melanomas, we investigated the lncRNAs from RNA-seq data from 52 tumour/control samples of oral melanoma. We identified more than 750lncRNAs differentially expressed between tumour and control (FDR < 0.01), of which more than 100 were conserved with humans. These lncRNAs are good candidates to study the regulation of tumour progression of melanomas in dogs and can be evaluated for their diagnostic and therapeutic potential in human and veterinary medicine.
118

Assessment of supervised classification methods for the analysis of RNA-seq data / Développement, évaluation et application de méthodes statistiques pour l'analyse de données multidimensionnelles de comptage produites par les technologies de séquençage à haut débit ("Next Generation Sequencing")

Abuelqumsan, Mustafa 20 December 2018 (has links)
Les technologies « Next Generation Sequencing» (NGS), qui permettent de caractériser les séquences génomiques à un rythme sans précédent, sont utilisées pour caractériser la diversité génétique humaine et le transcriptome (partie du génome transcrite en acides ribonucléiques). Les variations du niveau d’expression des gènes selon les organes et circonstances, sous-tendent la différentiation cellulaire et la réponse aux changements d’environnement. Comme les maladies affectent souvent l’expression génique, les profils transcriptomiques peuvent servir des fins médicales (diagnostic, pronostic). Différentes méthodes d’apprentissage artificiel ont été proposées pour classer des individus sur base de données multidimensionnelles (par exemple, niveau d’expression de tous les gènes dans des d’échantillons). Pendant ma thèse, j’ai évalué des méthodes de « machine learning » afin d’optimiser la précision de la classification d’échantillons sur base de profils transcriptomiques de type RNA-seq. / Since a decade, “Next Generation Sequencing” (NGS) technologies enabled to characterize genomic sequences at an unprecedented pace. Many studies focused of human genetic diversity and on transcriptome (the part of genome transcribed into ribonucleic acid). Indeed, different tissues of our body express different genes at different moments, enabling cell differentiation and functional response to environmental changes. Since many diseases affect gene expression, transcriptome profiles can be used for medical purposes (diagnostic and prognostic). A wide variety of advanced statistical and machine learning methods have been proposed to address the general problem of classifying individuals according to multiple variables (e.g. transcription level of thousands of genes in hundreds of samples). During my thesis, I led a comparative assessment of machine learning methods and their parameters, to optimize the accuracy of sample classification based on RNA-seq transcriptome profiles.
119

Annotation des ARN longs non-codants chez la poule et les espèces d’élevage : Focus sur les ARNlnc régulateurs du métabolisme des lipides / Long noncoding RNAs annotation in chicken and livestock species : Focus on lncRNAs regulating lipid metabolism

Muret, Kévin 20 December 2018 (has links)
L’annotation des génomes est un défi majeur pour lier les génotypes aux phénotypes. Identifier les ARN longs non-codants (ARNlnc) dans les génomes fait partie de ce défi ; d’expression relativement faible, ils n’ont été mis en évidence que récemment (2012) par l’avènement des technologies de séquençage haut débit. Ces travaux de recherche ont permis à partir de données RNA-seq, de mettre en lumière un grand nombre d’ARNlnc chez les espèces d’élevage et en particulier chez la poule chez qui aucun ARNlnc n’était décrit au début de cette thèse (2015). Un premier travail a consisté à identifier ces ARNlnc en utilisant des échantillons de foie et tissu adipeux puis nous avons amélioré ce catalogue par intégration d’autres bases de données publiques d’ARNlnc disparates. De plus, d’après la littérature, les ARNlnc ont été décrits comme intervenant dans la régulation de tous les processus biologiques :de la structure cellulaire à l’expression des gènes. La problématique de l’équipe étant associée à la compréhension de la régulation du métabolisme des lipides chez la poule, mon second travail a consisté à établir la liste des ARNlnc connus dans le règne animal comme étant impliqués dans ce métabolisme ou dans le processus de stockage et de formation du tissu adipeux, l’adipogenèse. Les analyses de conservation par synténie ont permis de retrouver une vingtaine de ces ARNlnc chez la poule. Enfin, à partir de lignées divergentes pour le poids de gras abdominal, j’ai également mis en évidence de nouveaux ARNlnc potentiellement régulateurs de ce métabolisme lipidique. / Genome annotation is a major challenge in connecting genotypes with phenotypes. Identifying long noncoding RNAs (lncRNA) in genomes is part of this challenge; they are relatively low-expressed and have only been highlighted in 2012 thanks to the development of high throughput sequencing technologies. This research work has led to the identification of a large number of lncRNAs in livestock species, particularly in the chicken, in which no lncRNA had yet been described at the beginning of this thesis (2015). First, my aim was to identify these lncRNAs using liver and adipose tissue and to improve this catalogue by integrating other existing lncRNA public databases.Moreover, according to the literature, lncRNAs are involved in the regulation of any biological process, from gene expression to cell structure. One of the goals of our team is to understand the regulation of lipid metabolism in the chicken, I thus established the list of all lncRNAs known within the animal kingdom and involved in this metabolism or in adipogenesis, the process of storage and formation of adipose tissue. The conservation by synteny analyses revealed around twenty conserved lncRNAs in the chicken. From divergent abdominal fat weight chicken lines, I lastly identified new lncRNAs that potentially regulate this lipid metabolism.
120

Perfil transcricional da xilogênese em Eucalyptus grandis / Transcriptional profile of xylogenesis in Eucalyptus grandis

Pinto, Ana Paula Chiaverini 27 April 2017 (has links)
O eucalipto (Eucalyptus spp.) é a arbórea comercial mais importante do Brasil, tendo um papel marcante na indústria de papel e celulose. O aumento no rendimento da extração da polpa celulósica e a redução nos custos de produção são os principais objetivos dos programas de melhoramento genético de eucalipto. Como o processo de deslignificação é fundamental para a extração da celulose, é suma importante compreender a biossíntese e deposição da parede celular secundária durante a xilogênese. A diferenciação dos elementos traqueais é caracterizada pela deposição da parede celular secundária, logo estudos de expressão gênica envolvendo essas células xilemáticas é uma estratégia interessante. Foi realizado o sequenciamento do transcriptoma de células em suspensão em diferentes fases de desenvolvimento (células meristemáticas, células alongadas e elementos traqueais) gerando 348 milhões de leituras paired-end com 100 pb cada uma, com a maioria das leituras (80 %) alinhada e mapeada contra genoma de referência. A análise dos genes diferencialmente expressos (GDEs) identificou um total de 3426, 1044 e 4665 GDEs nas comparações M vs. A, A vs. T e M vs. T, respectivamente. Sendo 1316, 567, 2637 genes up-regulated e 2110, 476, 2028 genes down-regulated nas comparações M/A, T/A, T/M, respectivamente. Um total de 4229 genes foram anotados funcionalmente e mapeados em 310 rotas identificadas pelo KEGG, obtendo-se 40 sequências relacionadas à rota dos fenilpropanoides, a quinta rota mais representativa. Quando foram considerados os GDEs com log2 fold change &le; -1,5 e log2 fold change &ge; 1,5, 34 rotas metabólicas foram identificadas, destas, a principal foi a rota dos fenilpropanoides, com 14 sequências relacionadas a enzima lactoperoxidase. Foi realizado o enriquecimento dos termos GO e nas redes a biossíntese de celulose e xiloglucanos, rotas de sinalização de etileno, rotas de biogênese e organização da parede celular vegetal e de morte celular, entre outras, foram destaque. Identificaram-se 31 fatores de transcrição, sendo 3 fatores de transcrição MYB, 2 fatores de transcrição NAC e 10 fatores de transcrição WRKY. Além disso, 21, 7 e 23 genes da rota da celulose e hemiceluloses e 24, 8 e 21 genes da rota de síntese dos monômeros da lignina foram constatados nas comparações M vs. A, A vs. T e M vs. T, respectivamente. Assim como, foram encontrados genes codificadores de lacases e peroxidases, participantes da polimerização dos monômeros da lignina. Os resultados possibilitaram uma compreensão mais ampla da regulação transcricional da biossíntese da parede celular secundária nas células xilemáticas de eucalipto e revelou novos genes participantes da xilogênese. Este conjunto de dados transcricionais ajudará na realização de manipulações genéticas visando à obtenção de plantas de eucalipto com características de extratibilidade aspiradas pela indústria. / Eucalyptus (Eucalyptus spp.) is the most important commercial tree in Brazil, playing a significant role in the pulp and paper industry. An increase in the yield of cellulosic pulp extraction and a reduction of production cost are the main objectives of the eucalyptus breeding programs. As the delignification process is fundamental for the extraction of cellulose, it is highly important to understand the biosynthesis and deposition of the secondary cell wall during xylogenesis. The differentiation of the tracheary elements is characterized by the deposition of the secondary cell wall, so studies of gene expression involving these xylem cells is an interesting strategy. Sequencing of the transcriptome of cells in suspension at different stages of development (meristematic cells, elongated cells and tracheal elements) was performed generating 348 million paired-end reads with 100 bp each, with most readings (80%) aligned and mapped against reference genome. The analysis of differentially expressed genes (DEG) identified a total of 3426, 1044 and 4665 DEGs in the comparisons M vs. A, A vs. T and M vs. T, respectively. Being 1316, 567, 2637 up-regulated genes and 2110, 476, 2028 down-regulated genes in the M/A, T/A, T/M, respectively. A total of 4229 genes were functionally annotated and mapped in 310 routes identified by the KEGG, yielding 40 sequences related to the phenylpropanoid route, the fifth most representative route. When DEGs with log2 fold change &le; - 1.5 e log2 fold change &ge; 1.5 were considered, 34 metabolic routes were identified. From these, the main route was the phenylpropanoids pathway, with 14 sequences correlated to the enzyme lactoperoxidase. The GO terms enrichment was carried out and the networks of cellulose and xyloglucans biosynthesis, ethylene signaling routes, biogenesis routes and the plant cell wall organization and cell death, among others, were highlighted. Thirty-one transcription factors were identified, being 3 MYB transcription factors, 2 NAC transcription factors and 10 WRKY transcription factors. In addition, 21, 7 and 23 genes of the cellulose and hemicelluloses pathway and 24, 8 and 21 genes of lignin monomer synthesis route were found in the M vs. A, A vs. T and M vs. T comparisons, respectively. Besides this, encoding genes laccases and peroxidases were found, participating in the polymerization of lignin monomers. The results allowed a broader understanding of the transcriptional regulation of secondary cell wall biosynthesis in eucalyptus xylem cells and revealed new genes participating in xylogenesis. This set of transcriptional data will help in the accomplishment of genetic manipulations in order to obtain eucalyptus plants with extractability characteristics aspired by the industry.

Page generated in 0.0633 seconds