121 |
Integrative analysis of microRNAs and mRNAs involved in regulation of intramuscular fat deposition in Nelore cattle / Análise de integração de dados de microRNAs e mRNAs envolvidos na regulação da deposição de gordura intramuscular em bovinos NeloreOliveira, Gabriella Borba de 16 February 2017 (has links)
The amount of intramuscular fat can influence the sensory characteristics and nutritional value of beef, thus the selection of animals with adequate fat content for consumer becomes important. Intramuscular fat is a complex trait that is difficult to measure and there is growing knowledge about the genes and pathways that control the biological processes involved in fat deposition in muscle. MicroRNAs (miRNAs) are well conserved class of non-coding small RNAs that modulate gene expression of a range of functions in animal development and physiology. This study aimed to identify differentially expressed (DE) miRNAs, regulatory candidate genes and co-expression networks using mRNAs and miRNAs expression data from the Longissimus dorsi muscle of 30 Nelore steers with extreme genomic estimated breeding values (GEBV) for intramuscular fat (IMF) content. The differential expression analysis between the miRNA data from animals with extreme GEBV values for IMF identified six DE miRNAs. Functional annotation of target genes for these microRNAs indicates that PPARs signaling pathway is involved with IMF deposition. Regulatory candidate genes such as SDHAF4, FBXO17, ALDOA and PKM were identified by partial correlation with information theory (PCIT), phenotypic impact factor (PIF) and regulatory impact factor (RIF) approaches from integrated miRNAs-mRNAs expression data. Two DE miRNAs, bta-miR-143 and bta-miR-146b, upregulated in Low IMF group, were also correlated with regulatory candidate genes, which were functionally enriched for GO terms for fatty acids oxidation. Co-expression networks identified several modules related to immune system, protein metabolism, energy metabolism and glucose catabolism by weighted correlation network analysis (WGCNA), which showed possible interaction and regulation between mRNAs and miRNAs. This study contributes to our understanding of regulatory mechanisms of gene signaling networks involved in fat deposition process. Glucose metabolism and inflammation process were the main pathways found in integrative mRNAs-miRNAs analysis and showed to influence intramuscular fat content in beef cattle. / A quantidade de gordura intramuscular pode influenciar as características sensoriais e o valor nutricional da carne bovina, assim, a seleção de animais com conteúdo de gordura adequado para o consumidor torna-se importante. A gordura intramuscular é uma característica complexa, de difícil medição e há um conhecimento crescente sobre os genes e vias que controlam os processos biológicos envolvidos na deposição de gordura no músculo. MicroRNAs (miRNAs) são uma classe bem conservados de pequenos RNAs não-codificantes, que modulam a expressão gênica de uma gama de funções no desenvolvimento e fisiologia animal. Este estudo objetivou identificar miRNAs diferencialmente expressos (DE), genes reguladores candidatos e redes de co-expressão usando dados de expressão de mRNAs e miRNAs do músculo Longissimus dorsi de 30 novilhos Nelore com valores genéticos genômicos estimados (GEBV) extremos para conteúdo de gordura intramuscular (IMF). A análise de expressão diferencial entre os dados de miRNA de animais com valores extremos de GEBV para o IMF identificou seis miRNAs DE. A anotação funcional de genes alvos destes microRNAs indica que a via de sinalização de PPAR está envolvida com a deposição de IMF. Os genes reguladores candidatos, tais como SDHAF4, FBXO17, ALDOA e PKM foram identificados pelas abordagens de correlação parcial com teoria da informação (PCIT), fator de impacto fenotípico (PIF) e fator de impacto regulatório (RIF) a partir de dados integrados de expressão de mRNAs-miRNAs. Dois miRNAs, bta-miR-143 e bta-miR-146b, com alta expressão no grupo de baixo conteúdo de IMF, também foram correlacionados com genes reguladores candidatos, os quais foram funcionalmente enriquecidos para termos GO relacionados a oxidação de ácidos graxos. As redes de co-expressão identificaram vários módulos relacionados ao sistema imunológico, ao metabolismo das proteínas, ao metabolismo energético e ao catabolismo da glicose através da análise ponderada da rede de correlação (WGCNA), que mostrou possível interação e regulação entre mRNAs e miRNAs. Este estudo contribui com a compreensão dos possíveis mecanismos reguladores das redes de sinalização genética envolvidas no processo de deposição de gordura. O metabolismo da glicose e o processo de inflamação foram as principais vias encontrados na análise integrada de mRNA-miRNA e mostraram estar associadas ao conteúdo de gordura intramuscular em bovinos de corte.
|
122 |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania / In silico identification and analysis of Leishmania ncRNAs using RNA-seq dataRuy, Patrícia de Cássia 08 August 2017 (has links)
Análises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global. / High-throughput data analyses indicated that transcriptomes are more extensive and complex than previously supposed. Currently, it is evident that most eukaryotic genomes are almost entirely transcribed and under regulation tied to developmental stages. Control of gene expression involves regulatory non-coding RNAs (ncRNAs), including post-transcriptional processes. Post-transcriptional regulation is particularly relevant for the regulation of gene expression in trypanosomatids, as compared to other organisms. Parasites of the genus Leishmania (Order Kinetoplastidae, family Trypanosomatidae) causes infectious-parasitic diseases known as leishmaniasis, and their life cycle comprises three development stages: procyclic promastigotes, metacyclic promastigotes and amastigotes. This study aimed to computationally identify and characterize Leishmania putative ncRNAs at different stages of development. Large-scale approaches combined with bioinformatics tools allowed the identification of 11,376 putative ncRNAs in L. braziliensis and, in a preliminary study, of 37 putative ncRNAs in L. donovani. In addition, the L. braziliensis the complete transcriptome was analyzed comparatively between the parasite development stages. In L. donovani, of the 37 putative ncRNAs identified, 34 were in UTRs (Untranslated Regions) and 3 in intergenic regions. Predictors of ncRNAs specific characteristics were used and 32 putative ncRNAs had at least one positive prediction. All candidates are conserved, partially or entirely, in at least three Leishmania species. Five L. donovani ncRNAs were confirmed by Northern blotting experiments. Analysis of the L. braziliensis transcriptome revealed differences in gene expression levels between developmental stages, ranging from 52% to 71%, depending on the compared stages. The boundaries of the 5\'UTRs and 3\'UTRs were also defined for 81% and 38% of the annotated CDSs, respectively. We developed a methodology for the identification of putative ncRNAs using total RNA sequencing data. This methodology allowed the identification of 11,376 putative ncRNAs in L. braziliensis, and all candidates were analyzed by predictive programs of ncRNAs specific characteristics and presented at least one positive prediction, in addition to bearing no similarity to known protein domains. The analysis showed that from 27% to 41% of the putative ncRNAs identified are conserved in other Leishmania species. We found 27% to 38% of putative ncRNAs with regulation associated to the developmental stage, depending on the compared stages. Consequently, besides identification and characterization of ncRNAs in Leishmania, candidates with developmental-related regulation were found and patterns were uncovered with the proposed and implemented analysis. Thus, this work contributes significantly to improve understanding of gene expression regulation processes in Leishmania and will offer to the community important information about the parasite genetics and regulatory differences along the development, besides of L. braziliensis transcriptome information.
|
123 |
Análise global da expressão gênica durante a formação de celulases pelo fungo Trichoderma reesei / Global analysis of gene expression during the formation of cellulases by Trichoderma reeseiCastro, Lilian dos Santos 08 May 2015 (has links)
O fungo filamentoso Trichoderma reesei (Hypocrea jecorina) é o principal produtor de enzimas celulolíticas e hemicelulolíticas utilizadas para a produção de biocombustíveis a partir de biomassa lignocelulósica. Para que o custo de produção de etanol de segunda geração (2G), em escala industrial, seja competitivo, uma mistura eficiente de enzimas hidrolíticas é necessária para degradar a biomassa vegetal em açúcares fermentescíveis. Dada a crescente demanda pelo desenvolvimento de processos que reduzam os custos de enzimas de interesse biotecnológico, o presente trabalho se propôs a analisar o perfil global do transcriptoma de T. reesei em presença de celulose, soforose e glicose como fontes de carbono, a fim de prover um melhor entendimento de como essas enzimas são produzidas por esse microrganismo. Para isso, foi utilizada a abordagem RNA-seq e duas linhagens de T. reesei: QM9414 (parental) e xyr1 (mutante). No Capítulo I, foram anlisados 22 genes que codificam celulases e xilanases, com o intuito de verificar a regulação da expressão gênica pelo fator de transcrição XYR1 em diferentes fontes de carbono. Foi observada uma dependência da fonte de carbono e redução da expressão destes genes que codificam celulases e xilanases quando se comparou a linhagem mutante com a parental, cultivados na presença de celulose e soforose. Na presença de glicose, a maior parte dos genes analisados apresentou aumento de expressão no mutante xyr1. Por meio de análises in silico foi identificado o elemento regulatório cis para o fator de transcrição XYR1 usando quatro conjuntos de dados de genes dependente-condição envolvendo os experimentos RNA-seq e qPCR-TR. Foram identificados dois motivos com o consenso de ligação proposto para o regulador XYR1 (nomeado PWMXYR1). Ao usar esses motivos identificados, foi analisada a presença e disposição dos putativos elementos regulatórios cis nesses conjuntos de dados, sendo que sítios com intervalos curtos foram mais associados a promotores dependentes de XYR1 do que sítios simples. Além disso, a abordagem utilizada permitiu a identificação de sítios de ligação XYR1, na região promotora dos genes cel7a e xyn1 e mapear a potencial sequência alvo do regulador na região promotora do gene cel6a. Adicionalmente, sete outros promotores (genes cel7b, cel61a, cel61b, cel3c, cel3d, xyn3 e swo) apresentaram sítios de ligação putativos de XYR1. Usando a arquitetura do regulador PWMXYR1, foram identificados potenciais genes alvos de regulação direta por XYR1 no genoma de T. reesei. O mapeamento do referido sítio foi realizado, também, nos genes diferencialmente expressos na linhagem mutante xyr1, destacando que a regulação indireta desempenha um papel fundamental nas vias de sinalização. Estes resultados fornecem novas informações sobre os mecanismos de sinalização mediados por XYR1 na regulação de promotores de celulases. No Capítulo II, foi analisado o transcriptoma global da linhagem parental (QM9414) em diferentes fontes de carbono: celulose; soforose e glicose. Aplicando limites rigorosos de corte, 2060 genes foram identificados como diferencialmente expressos em pelo menos uma das fontes de carbono analisadas. Clusterização hierárquica desses genes diferencialmente expressos identificaram-se três possíveis regulons, representando 123 genes controlados por celulose, 154 genes controlados por soforose e 402 genes controlados por glicose. A análise da rede regulatória demonstrou a inter-relação existente entre as condições, permitindo a identicação de 75 genes específicos do crescimento em soforose e 107 de celulose. Esses resultados revelaram novos genes envolvidos na degradação da celulose, tais como: proteínas acessórias, transportadores, fatores de transcrição e CAZymes que respondem especificamente a presença de celulose ou soforose. No Capítulo III, analisou-se o perfil transcricional da linhagem mutante xyr1 comparando com a linhagem parental (QM9414), na presença das três fontes de carbono. As análises de expressão gênica revelaram que 2185 genes foram diferencialmente expressos na condição celulose, 2124 genes na condição soforose e 46 genes em glicose. Esses genes foram utilizados para analisar a inter-relação existente entre as condições, com destaque para grande número de genes exclusivos nas condições de indução (celulose e soforose). Por meio da clusterização hierárquica foram identificados 6 possíveis regulons, sendo 3 deles compostos por genes up-regulados e 3 regulons por genes down-regulados. Na ausência do regulador XYR1, a expressão de genes CAZys, fatores de transcrição, transportadores, entre outros, foram afetadas de modo dependente da fonte de carbono. Essas análises permitiram verificar que o fator de transcrição XYR1 é fundamental no processo de indução de enzimas de interesse biotecnológico, além de participar de outros processos bioquímicos/moleculares. Desse modo, todos os resultados obtidos fornecem informações sobre os eventos moleculares envolvidos na regulação da expressão gênica durante a adaptação de T. reesei frente a diferentes condições ambientais como: diferentes fontes de carbono e necessidades nutricionais. Contribuindo, assim, para uma melhor caracterização desse fungo filamentoso em relação à produção de enzimas e o desenvolvimento de mutantes metabólicos para utilização industrial. / The filamentous fungus Trichoderma reesei (Hypocrea jecorina) is a major producer of cellulolytic enzymes used for biofuels production from lignocellulosic biomass. In order to achieve a low cost second generation ethanol production in industrial scale, an efficient mix of hydrolytic enzymes are required for the degradation of plant biomass into fermentable sugars. Given the growing demand for development of processes in order to reduce the cost of enzymes production, the present work proposes a large-scale transcriptomic analysis of T. reesei in presence of cellulose, sophorose, and glucose as carbon sources, in order to provide insights about the mechanisms of enzymes production by this microorganism. For this purpose, RNA-seq approach was employed, as well, as two T. reesei strains: QM9414 (parental) and xyr1 (mutant). In Chapter I, 22 genes encoding cellulases and xylanases were analyzed regarding the regulation through the transcription factor XYR1. This regulation seems to occur in a carbon source dependence manner, and the expression of cellulases and xylanases was diminished in the mutant strain compared to the parental strain in the presence of cellulose and sophorose. In glucose, most of the analyzed genes showed higher expression in the mutant compared to the parental strain. In silico analysis identified a cis regulatory element for XYR1 using four datasets of condition-dependent genes based on RNA-seq and qPCR experiments. Two binding motifs have been identified with the proposed consensus for the XYR1 (named PWMXYR1). Using these motifs, the presence and arrangement of putative cis regulatory elements was analyzed, and the results indicate that the sites with short intervals were stronger associated with XYR1 dependent promoters than single sites, even with high scores. Moreover, this approach allowed the identification of XYR1 binding sites in the promoter region of cel7a and xyn1, as well as, map the potential target sequence in the promoter of cel6a gene. In addition, seven other promoters from genes cel7b, cel61a, cel61b, cel3c, cel3d, xyn3 and swo presented XYR1 putative binding sites. Using the cis-regulatory architecture of PWMXYR1, potential targets for direct regulation by XYR1were identified in a genome wide manner. The putative binding sites were also mapped in the differentially expressed genes identified in the mutant strain xyr1, suggesting that indirect regulation plays a key role in signaling pathways. Taken together, the data provided here provides important information regarding signaling mechanisms mediated by XYR1 in the regulation of cellulases promoters. In Chapter II, the transcriptome of the parental strain (QM9414) was analyzed in three carbon sources, cellulose, sophorose and glucose. By applying a stringent cut-off threshold, 2,060 genes were identified as differentially expressed in at least one of the carbon sources analyzed. Hierarchical clustering of differentially expressed genes identified three possible regulons, representing 123 genes controlled by cellulose, 154 genes controlled by sophorose and 402 genes controlled by glucose. The analysis of the regulatory network demonstrated the interrelation between the conditions, allowing the identification of 75 genes specifically expressed in soforose and 107 in cellulose. These results revealed new players involved in cellulose degradation, such as accessory proteins, transporters, transcription factors and CAZymes, that specifically respond to the presence of either cellulose or sophorose. In Chapter III, a genome wide comparative transcriptional analysis were performed between the mutant xyr1 strain and the parental strain (QM9414) using the three carbon sources. Gene expression analysis revealed 2,185 genes differentially expressed in cellulose, 2124 genes in sophorose and 46 genes in glucose. These differentially expressed genes were used to analyze the relationship between the conditions, revealing a greater number of exclusive genes in theinducing conditions (cellulose and sophorose). The hierarchical clustering analysis revealed 6 possible regulons, being three composed by up-regulated genes and 3 regulons composed by down-regulated genes. In the absence of the regulator XYR1, the expression of CAZy genes, transcription factors among other genes were affected in a carbon-dependent manner. These analyses showed that the transcription factor XYR1 has an essential role in induction of enzymes of biotechnological interest and participates in other biochemical/molecular processes. Taken together these results provide important information about the molecular events, involved in gene expression regulation during T. reesei adaptation to different environments such as: carbon sources and/or nutritional needs, thus contributing to a better understanding of this filamentous fungus regarding the the production of enzymes and the development of mutants for industrial applications.
|
124 |
Transcriptoma comparativo e redes de co-expressão gênica associados a características de carcaça de bovinos Nelore / Comparative transcriptome and gene co-expression networks associated with carcass traits of Nellore cattleVignato, Bárbara Silva 31 March 2017 (has links)
O objetivo deste trabalho foi estudar o transcriptoma do músculo Longissimus dorsi (LD) de bovinos da raça Nelore associado as características de área de olho de lombo (AOL) e espessura de gordura subcutânea (EGS), a fim de encontrar genes diferencialmente expressos (GDE), conjuntos de genes co-expressos, vias metabólicas e processos biológicos que regulam essas características. Foram utilizados dados de 385 bovinos Nelore castrados para obtenção das medidas fenotípicas de AOL e EGS, mensuradas entre a 12ª e 13ª costelas do músculo LD. Estes animais foram separados em dois grupos extremos, alto e baixo, contendo seis animais cada, baseados nos valores genômicos estimados (GEBV), para AOL e para EGS. Estes conjuntos de 12 animais foram submetidos à análise de expressão diferencial afim de encontrar GDE entre os grupos. Em seguida, a análise de enriquecimento funcional a partir da lista de GDE foi executada por meio do DAVID (Database for Annotation, Visualization and Integrated Discovery) e da combinação do BiNGO (Biological Networks Gene Ontology) e REVIGO (Reduce + Visualise Gene Ontology). Para AOL, foram identificados 101 GDE entre os grupos de alto e baixo GEBV. Desses, 72 genes apresentaram-se down-regulated e 29 up-regulated no grupo baixo. Para EGS, foram encontrados 18 GDE, dos quais treze apresentaram-se up-regulated e cinco down-regulated no grupo baixo. Dentre as vias metabólicas e processos biológicos encontrados para essas características, destacam-se a via de sinalização MAPK (bta04010) e a via da endocitose (bta04144) - AOL - e, os processos de biossíntese de andrógenos (GO:0006702) e via de sinalização canônica Wnt (GO:0060070) - EGS. Para encontrar conjuntos de genes co-expressos associados aos tratamentos (AOL e EGS), foi utilizado o pacote WGCNA (Weighted Correlation Network Analysis) do R, com dados de contagens de transcritos de 43 animais. Foram identificados 37 módulos, dentre eles, os módulos Azul, Verde-escuro e Salmon apresentaram correlação significativa de 0,3 com a EGS (P<0,10). Os genes destes módulos foram selecionados para análise de enriquecimento funcional quando seus valores de filiação ao módulo foram superiores a 0,7. O módulo azul apresentou o maior número de genes co-expressos, com 953 genes submetidos à análise de enriquecimento funcional. Foram encontradas seis vias metabólicas e 101 termos do Gene Ontology para este módulo, conforme análise do DAVID, além de 108 processos biológicos identificados pelo BiNGO/REVIGO. Os resultados do presente estudo enfatizam a complexidade da regulação gênica do músculo LD de bovinos Nelore associado às características de AOL e EGS. Estes resultados nos auxiliam a compreender melhor os diversos processos moleculares envolvidos na deposição muscular e de gordura de cobertura, características de carcaça economicamente importantes para a produção da carne bovina. / The aim of this work was to study the Longissimus dorsi (LD) muscle transcriptome of Nellore cattle associated with ribeye area (REA) and backfat thickness (BFT) to find differentially expressed genes (DEG), coexpressed gene modules, metabolic pathways, and biological processes that regulate these traits. Data from 385 Nellore steers were used to obtain the phenotypic measures of REA and BFT, measured between the 12th and 13th ribs of the LD muscle. These animals were divided into two extreme groups, high and low, with six animals each, based on the estimated genomic breeding values (GEBV) for REA and for BFT. These sets of 12 animals were submitted to differentially expressed gene analysis to find DEG between the groups. Then, the functional enrichment analysis from the list of DEG was performed by DAVID (Database for Annotation, Visualization and Integrated Discovery) and the combination of BiNGO (Biological Networks Gene Ontology) and REVIGO (Reduce + Visualize Gene Ontology). For REA, 101 DEG were identified between the high and low GEBV groups. Of those, 72 genes were down-regulated and 29 up-regulated in the low group. For BFT, 18 DEG were found, of which thirteen were up-regulated and five were down-regulated in the low group. Among the metabolic pathways and biological processes found for these traits, the MAPK signaling pathway (bta04010) and the endocytosis pathway (bta04144) - for REA -, the androgen biosynthetic processes (GO: 0006702) and the canonical Wnt signaling pathway (GO: 0060070) - for EGS - can be highlighted. To find coexpressed gene modules associated with the traits (REA and BFT), we used the WGCNA (Weighted Correlation Network Analysis) package from R, with data from transcript counts of 43 animals. A total of 37 modules were founded. Among them, the Blue, Dark Green and Salmon modules had a significant correlation of 0.3 with BFT (P<0.10). The genes of these modules were selected for functional enrichment analysis when their module membership values were higher than 0.7. The blue module had the highest number of co-expressed genes, with 953 genes submitted to functional enrichment analysis. Six metabolic pathways and 101 Gene Oontology terms were founded for this module by DAVID analysis, in addition, 108 biological processes were identified by BiNGO/REVIGO. The results of the present study emphasize the complexity of gene regulation in the LD muscle of Nellore cattle associated with REA and BFT. These results can help us to better understand the different molecular processes involved in muscle and fat deposition, which are economically important carcass traits for beef production.
|
125 |
RNAs não-codificantes associados a IS200/605: identificação e caracterização funcional na archaea Halobacterium salinarum NRC-1 / Non-coding RNAs associated with IS200/605: Identification and functional characterizal in the archaea Halobacterium salinarum NRC-1Gomes Filho, José Vicente 13 June 2017 (has links)
Os elementos genéticos móveis (mobile genetic elements MGEs), são elementos extremamente importantes para plasticidade e evolução dos genomas. Uma das classes mais importantes de MGEs são as sequências de inserção (insertion sequences - IS). Estes elementos são encontrados em bactérias e archaea e apresentam grande diversidade de famílias e mecanismos de movimentação. Uma família interessante de IS é IS200/605, esta família encontra-se distribuída em bactérias, archaea e vírus e utiliza substratos de DNA de fita simples para seu processo de transposição. Neste trabalho, através da análise de dados públicos de transcritoma identificamos RNAs sobrepostos ao 3\' de genes tnpB de IS200/605 em archaea e bactérias, estes transcritos foram chamados de sense overlapping transcripts (sotRNAs). As extremidades 5\' e 3\' dos sotRNAs foram mapeadas através de dados de RNA-seq de pequenos RNAs (sRNA-seq) e validadas através da técnica de C-RACE. Análises de sequência e estrutura secundária demonstraram que estes RNAs apresentam um motivo conservado chamado de RE-like. Utilizando a sequência consenso deste motivo pudemos identificar RNAs intergênicos derivados de IS200/605 em H. salinarum NRC-1. Para caracterização funcional, construímos linhagens superexpressando os RNAs VNG_sot0042 e VNG_R0052, ambos contendo o motivo RE-like. Curvas de crescimento, utilizando as linhagens construídas demonstraram que a superexpressão destes RNAs aumenta o crescimento de H. salinarum demonstrando sua funcionalidade. Devido a presença do motivo RE-like, extremidades 5\' e 3\' determinadas e fenótipo visualizado em curva de crescimento padrão, o sotRNA VNG_sot0042 foi estudado mais a fundo. Realizamos experimentos de RNA-seq para avaliar o impacto desta superexpressão no transcritoma de H. salinarum NRC-1, assim como experimentos de SILAC para identificação de proteínas parceiras em larga escala. Nestes ensaios identificamos proteínas e genes associados ao processo de adesão, geração de células persistentes e resistência a metais pesados. Ensaios de adesão e sobrevivência a metais pesados demonstraram que a linhagem de superexpressão apresenta maior capacidade de aderir a vidro e maior sobrevivência em diversas condições de estresse. Deste modo, podemos sugerir que ncRNAs derivados de IS200/605 são importantes moléculas regulatórias em H. salinarum NRC-1 e nos ajudam a compreender a manutenção de IS200/605 e seus derivados nos genomas de procariotos. / Mobile genetic elements (MGEs) are extremely important for plasticity and evolution of genomes. Their impacts are diverse and could be related to antibiotic resistence or symbiosis. One of the most important class of MGEs are insertion sequences (ISs). These elements are found widespread throughout bacteria and archaea, presenting a great diversity of families. An interesting family is the IS200/605, this family is found widespread in bacteria, archaea and viruses and is divided in three subgroups according to it\'s genetic composition: IS200 with tnpA gene alone, IS605 with tnpA and tnpB and IS1341 with tnpB only. Another interesting aspect is the utilization of single-stranded DNA as a substrate during the transposition process. In this work, through the analysis of public available transcriptomic data we identified transcripts that overlaps the 3\' end of tnpB in IS200/605 in both bacteria and archaea. These transcripts were named sense overlapping transcripts (sotRNAs). Sequence and secondary structure analysis showed a conserved motif present in sotRNAs, the RE-like motif. Using the consensus sequence of this motif we identified novel intergenic ncRNAs containing this motif that are derived from IS200/605. For functional characterization we overexpressed a sotRNA (VNG_sot0042) and a intergenic (VNG_R0052), both containing the RE-like motif. Standard growth curves demonstrated that the overexpression of these ncRNAs improve H. salinarum growth showing that this RNA is functional. To further evaluate the impact of the overexpressions we prepared RNA-seq libraries of the strain overexpressing VNG_sot0042 and in parallel performed SILAC experiments to identify potential protein-RNA interaction partners. Differentially regulated genes and interacting proteins associated with adhesion and persistent cells generation were found. Adhesion and survival assays showed that the lineage overexpressing VNG_sot0042 has a better capability to adhere in glass surfaces and survive more in diverse stressful conditions.
|
126 |
Etude de l'impact des facteurs eRF3 et Upf1 dans la traduction des ARN messagers porteurs d'uORF / Involvement of translation termination factor eRF3 and nonsense-mediated mRNA decay factor Upf1 in the translational control of uORFs carrying mRNAsAliouat, Affaf 12 July 2017 (has links)
La traduction est considérée comme une étape clé de l'expression des gènes permettant à la cellule de s'adapter aux variations de son environnement en réponse aux signaux internes ou externes. Des études bioinformatiques ont montrés que la moitié des ARN messagers chez l'homme portent, en amont de leur phase codante, des éléments régulateurs appelés uORF. Le laboratoire a montré qu'un défaut de terminaison de la traduction par déplétion du facteur de terminaison eRF3 modifie l'expression de gènes dont l'ARNm contient des uORF comme le gène ATF4. Cette modification se fait soit par un mécanisme de réinitiation après traduction de l'uORF soit par une augmentation de la stabilité de l'ARNm résultant d'un défaut de sa dégradation par la voie du "Nonsense-mediated mRNA Decay" (NMD). A travers leur association dans le même complexe et leur implication dans la terminaison de la traduction et la NMD, eRF3 et Upf1 contribuent à la régulation fine de l'expression des gènes. Cependant, on ne sait pas dans quelle mesure ces deux facteurs affectent la traduction et la stabilité des ARNm. Nous avons évalué la traduction par ribosome profiling et le taux de transcrits par RNA-seq dans les cellules humaines déplétées en eRF3 ou en Upf1. Ces analyses nous ont permis de dresser une carte des uORF traduites dans le transcriptome des cellules humaines HCT116. Nous avons également observé que peu de gènes cibles sont communs entre la déplétion en eRF3 ou en Upf1. Nos résultats appuient fortement l'hypothèse qu'il y a au moins deux classes de transcrits portant des uORF, l'une dont la régulation implique la terminaison de la traduction et l'autre dont la régulation implique la NMD. / Regulation of gene expression at the translational level is increasingly being recognized as a key mechanism by which cells can rapidly change their gene expression pattern in response to internal or external stimuli. Bioinformatic studies revealed that half of human transcripts present at least one expression regulatory element uORF in the 5’ leader sequence preceding the main ORF. We have previously shown that translation termination disruption caused by eRF3a depletion induces upregulation of the transcriptional activator ATF4 and its targeted genes partly by a translational control at uORFs, and partly in relation to a defect in Nonsense-mediated mRNA Decay activation, increasing ATF4 mRNA stability. Through their physical association and their involvement in translation termination and NMD, eRF3 and Upf1 are regulating the protein and mRNA levels of a significant number of genes and thus contribute to the fine-tuning of their expression. It is not known yet, in what extent both of these factors affect translational control and what is the subset of genes that are regulated by these factors. In this study, we evaluated translation by ribosome profiling and mRNA level by RNA-seq in human cells subjected to either eRF3a or Upf1 depletion. These analyses allowed us to draw a transcriptome-wide map of uORFs and obtained a list of functional uORFs in our reference HCT116 transcriptome. We also observe that only a small fraction of these are common targets for both eRF3a and Upf1. Our results provide strong support for the notion that different classes of transcripts bearing uORFs are regulated either by translational processes involving translation termination or by NMD.
|
127 |
Integrative analysis of microRNAs and mRNAs involved in regulation of intramuscular fat deposition in Nelore cattle / Análise de integração de dados de microRNAs e mRNAs envolvidos na regulação da deposição de gordura intramuscular em bovinos NeloreGabriella Borba de Oliveira 16 February 2017 (has links)
The amount of intramuscular fat can influence the sensory characteristics and nutritional value of beef, thus the selection of animals with adequate fat content for consumer becomes important. Intramuscular fat is a complex trait that is difficult to measure and there is growing knowledge about the genes and pathways that control the biological processes involved in fat deposition in muscle. MicroRNAs (miRNAs) are well conserved class of non-coding small RNAs that modulate gene expression of a range of functions in animal development and physiology. This study aimed to identify differentially expressed (DE) miRNAs, regulatory candidate genes and co-expression networks using mRNAs and miRNAs expression data from the Longissimus dorsi muscle of 30 Nelore steers with extreme genomic estimated breeding values (GEBV) for intramuscular fat (IMF) content. The differential expression analysis between the miRNA data from animals with extreme GEBV values for IMF identified six DE miRNAs. Functional annotation of target genes for these microRNAs indicates that PPARs signaling pathway is involved with IMF deposition. Regulatory candidate genes such as SDHAF4, FBXO17, ALDOA and PKM were identified by partial correlation with information theory (PCIT), phenotypic impact factor (PIF) and regulatory impact factor (RIF) approaches from integrated miRNAs-mRNAs expression data. Two DE miRNAs, bta-miR-143 and bta-miR-146b, upregulated in Low IMF group, were also correlated with regulatory candidate genes, which were functionally enriched for GO terms for fatty acids oxidation. Co-expression networks identified several modules related to immune system, protein metabolism, energy metabolism and glucose catabolism by weighted correlation network analysis (WGCNA), which showed possible interaction and regulation between mRNAs and miRNAs. This study contributes to our understanding of regulatory mechanisms of gene signaling networks involved in fat deposition process. Glucose metabolism and inflammation process were the main pathways found in integrative mRNAs-miRNAs analysis and showed to influence intramuscular fat content in beef cattle. / A quantidade de gordura intramuscular pode influenciar as características sensoriais e o valor nutricional da carne bovina, assim, a seleção de animais com conteúdo de gordura adequado para o consumidor torna-se importante. A gordura intramuscular é uma característica complexa, de difícil medição e há um conhecimento crescente sobre os genes e vias que controlam os processos biológicos envolvidos na deposição de gordura no músculo. MicroRNAs (miRNAs) são uma classe bem conservados de pequenos RNAs não-codificantes, que modulam a expressão gênica de uma gama de funções no desenvolvimento e fisiologia animal. Este estudo objetivou identificar miRNAs diferencialmente expressos (DE), genes reguladores candidatos e redes de co-expressão usando dados de expressão de mRNAs e miRNAs do músculo Longissimus dorsi de 30 novilhos Nelore com valores genéticos genômicos estimados (GEBV) extremos para conteúdo de gordura intramuscular (IMF). A análise de expressão diferencial entre os dados de miRNA de animais com valores extremos de GEBV para o IMF identificou seis miRNAs DE. A anotação funcional de genes alvos destes microRNAs indica que a via de sinalização de PPAR está envolvida com a deposição de IMF. Os genes reguladores candidatos, tais como SDHAF4, FBXO17, ALDOA e PKM foram identificados pelas abordagens de correlação parcial com teoria da informação (PCIT), fator de impacto fenotípico (PIF) e fator de impacto regulatório (RIF) a partir de dados integrados de expressão de mRNAs-miRNAs. Dois miRNAs, bta-miR-143 e bta-miR-146b, com alta expressão no grupo de baixo conteúdo de IMF, também foram correlacionados com genes reguladores candidatos, os quais foram funcionalmente enriquecidos para termos GO relacionados a oxidação de ácidos graxos. As redes de co-expressão identificaram vários módulos relacionados ao sistema imunológico, ao metabolismo das proteínas, ao metabolismo energético e ao catabolismo da glicose através da análise ponderada da rede de correlação (WGCNA), que mostrou possível interação e regulação entre mRNAs e miRNAs. Este estudo contribui com a compreensão dos possíveis mecanismos reguladores das redes de sinalização genética envolvidas no processo de deposição de gordura. O metabolismo da glicose e o processo de inflamação foram as principais vias encontrados na análise integrada de mRNA-miRNA e mostraram estar associadas ao conteúdo de gordura intramuscular em bovinos de corte.
|
128 |
Análise do transcriptoma foliar de Eucalyptus grandis em resposta às fertilizações potássica ou sódica sob condição hídrica normal ou de restrição / Leaf transcriptome analysis of Eucalyptus grandis in response to potassium or sodium fertilizations under normal or constraint water conditionSilva, Hana Karina Pereira da 13 November 2015 (has links)
No Brasil, o eucalipto é uma das principais fontes de matéria-prima para a produção de celulose e papel. A crescente demanda por sua madeira tem levado à expansão dos plantios florestais para regiões com déficit hídrico e baixa fertilidade do solo, resultando no interesse pela obtenção de plantas tolerantes à condições ambientais estressantes. Nas plantas, o déficit hídrico acarreta diversas respostas fisiológicas, bioquímicas e moleculares. Estudos fisiológicos observaram que plantas com um adequado suprimento de potássio (K+) são mais tolerantes à seca. Contudo, na nutrição de algumas plantas, o sódio (Na+) pode substituir parcialmente o K+. Como muitas áreas agricultáveis do mundo são deficientes em potássio, essa pode ser uma solução mais econômica para a fertilização dos plantios florestais. Assim, é de sumo interesse compreender à nível molecular os mecanismos de interação entre esses minerais com a água e suas consequências para o metabolismo da planta, visando a sustentabilidade dos plantios florestais e o desenvolvimento de programas de melhoramento genético florestal. Neste contexto, o presente trabalho objetivou realizar o estudo do transcriptoma foliar de Eucalyptus grandis visando identificar e categorizar funcionalmente transcritos diferencialmente expressos para os quais o efeito de interação entre os fatores fertilização e água foi significativo, considerando três regimes de fertilização (controle (C) ou fertilização com potássio (+K) ou sódio (+Na)) associados a dois regimes hídricos (sem exclusão da precipitação interna (+H2O) ou 37% de exclusão da precipitação interna (-H2O)). Transcritos relacionados às funções osmótica, fotossíntese e metabolismo do carbono foram selecionados para estudos mais detalhados. Para a análise do transcriptoma foi utilizada a técnica de RNA-Seq através da plataforma Illumina e diversos programas de bioinformática como o Bowtie 2, TopHat, pacote DEseq2 (programa R) para as análises estatísticas e Blast2GO para anotação e a categorização funcional. Seis comparações estatísticas foram realizadas: (I) +K+H2O vs C+H2O, (II) +Na+H2O vs C+H2O, (III) +K+H2O vs +Na+H2O, (IV) +K-H2O vs C-H2O, (V) +Na-H2O vs C-H2O e (VI) +K-H2O vs +Na-H2O. Nas comparações entre os tratamentos +H2O, transcritos relacionados ao metabolismo energético e ao processo biológico \"Crescimento\" foram mais abundantes em árvores fertilizadas com potássio e sódio. Nas comparações entre os tratamentos -H2O, transcritos que podem estar relacionados ao ajuste osmótico e transcritos associados ao processo biológico \"Resposta ao estresse\" foram mais abundantes em árvores fertilizadas com potássio. Ainda, foram associados ao tratamento +K-H2O transcritos que podem afetar a biossíntese da parede celular. Em ambos os regimes hídricos, transcritos associados ao fechamento estomático foram menos abundantes nas árvores fertilizadas com potássio. Verificou-se também que vias bioquímicas relacionadas ao metabolismo de açúcares e do carbono foram impactadas. Tais dados observados abrem novos caminhos para pesquisas futuras relacionadas à substituição parcial do potássio pelo sódio na fertilização de plantas, à melhor compreensão molecular do controle estomático e do metabolismo energético e à formação da parede celular influenciados por diferentes condições ambientais visando o melhoramento de tal espécie florestal. / In Brazil, eucalypts is one of the main sources of raw material to produce pulp and paper. The increasing demand for this wood has induced the expansion of forest plantations to lands presenting water deficit and low fertility soils, becoming interesting the obtainment of tolerant plants to stressful environmental conditions. In plants, water deficit causes several physiological, biochemical and molecular responses. Some physiological studies showed that plants with an adequate potassium (K+) supply are more drought tolerant. Nevertheless, for the nutrition of some plants, sodium (Na+) can partially replace the K+. As many agricultural fields in the world are potassium deficient, this can be a cheaper solution for forest plantations fertilization. Understanding at the molecular level the mechanisms of interaction between these minerals and water as well as its consequences for the plant metabolism is very important for the sustainability of forest plantations and the development of forest breeding programs. Thus, the present work aimed the study of Eucalyptus grandis leaf transcriptome to identify and functionally categorize differentially expressed transcripts for which the interaction effect between fertilization and water was significant, given three fertilization regimes (control (C), potassium fertilization (+K) or sodium fertilization (+Na)) associated to two water regimes (regime without throughfall exclusion (+H2O) or regime with 37% of throughfall exclusion (-H2O)). Transcripts related to osmotic functions, photosynthesis and carbon metabolism were selected for more detailed studies. RNA-seq via Illumina platform and many bioinformatic softwares, like Bowtie 2, TopHat, DEseq2 package for R (for statistical analyzes) and Blast2GO tool (for annotation and functional categorization) were used in the transcriptome analysis. Six statistical comparisons were performed: (I) +K+H2O vs C+H2O, (II) +Na+H2O vs C+H2O, (III) +K+H2O vs +Na+H2O, (IV) +K-H2O vs C-H2O, (V) +Na-H2O vs C-H2O and (VI) +KH2O vs +Na-H2O. In the comparisons between +H2O treatments, transcripts related to energetic metabolism and \"Growth\" biological process were more abundant in potassium or sodium fertilized trees. In the comparisons between -H2O treatments, transcripts possibly associated to osmotic adjustment and transcripts related to \"Response to stress\" biological process were more abundant in potassium-fertilized trees. Besides, transcripts that could affect cell wall biosynthesis were associated to +K-H2O treatment. In both water regimes, transcripts associated to stomatal closure were less abundant in potassium-fertilized trees. In addition, biochemical pathways related to carbohydrates and carbon metabolism were impacted. These data provide new perspectives for future researches related to partial replacement of potassium by sodium in plant fertilization, to a better molecular understanding of stomatal control and energetic metabolism and to the cell wall synthesis under different environmental conditions, aiming the breeding of this forest specie.
|
129 |
Comparative genetic and metabolic characterization between two table grape varieties with contrasted color berry skin : red Globe and Chimenti Globe / Analyse génétique et métabolique comparée de deux variétés de raisins de table présentant des pigmentations contrastées au niveau des pellicules des baies : red Globe et Chimenti GlobeSantibanez, Claudia 18 December 2017 (has links)
Le développement de la baie de raisin est un processus dynamique présentant une courbe de croissance sigmoïde avec deux phases de croissance séparée par une phase de latence. Il se caractérise par une biosynthèse coordonnée de métabolites primaires et secondaires. À la fin de la phase de latence, un phénomène appelé véraison se produit, au cours duquel le fruit commence à prendre de la couleur et le processus de maturation est initié. Les anthocyanes sont responsables de la coloration des baies et la régulation de leur biosynthèse été largement étudiée. Cependant, peu d'études ont porté sur la caractérisation métabolique et génétique de variétés de baies de couleurs fortement contrastées, dans un même fond génétique. En combinant la technologie RNAseq et des analyses métabolomiques, nous avons effectué une caractérisation comparée de deux variétés de raisin de table : Chimenti Globe (CG, rose pâle) et Red Globe (RG, rouge foncé). L'originalité de ce modèle est que CG a été généré à partir d'un événement de mutation spontanée de RG, dans un vignoble de production, permettant ainsi l’étude de la régulation de la biosynthèse des anthocyanes dans un même fond génétique. L'analyse du contenu métabolique des baies a démontré l'importance des stades de développement, de la véraison à la maturation, dans les deux variétés de raisin. En particulier, des différences marquées dans les concentrations de certains métabolites de la voie des phénylpropanoïdes (shikimate, UDP-glucose, phénylalanine) et du tréhalose-6-phosphate ont été mises en évidence en post-véraison. De plus, les différences entre les variétés étaient dues à des changements dans les métabolites liés à la biosynthèse du saccharose et de l'anthocyanine. Les baies de CG ne contenaient que des anthocyanines dihydroxylées (péonidine et cyanidine), et aucune quantité détectable d’anthocyanes trihydroxylées (malvidine, delphinidine et pétunidine), qui sont abondamment présentes dans les pellicules des baies de RG. Ceci explique le phénotype de couleur rose pâle des baies de CG. Une analyse transcriptomique globale par RNAseq montre que 109 gènes sont exprimés de façon différentielle chez CG, en comparaison avec RG, y compris de nombreux gènes liés au métabolisme des flavonoïdes. Notamment, 11 gènes codant pour des 3'5'-hydroxylases flavonoïde, une enzyme-clé pour la biosynthèse des anthocyanes trihydroxylées, sont réprimés dans CG. A partir de cette analyse, un gène candidat pour la régulation de la voie de biosynthèse des anthocyanes a été sélectionné : le gène Cytb5, qui code pour un cytochrome b5, non caractérisé à ce jour chez la Vigne. La surexpression de Cytb5 par transgénèse dans des vignes hybrides V. berlandieri x V. rupestris cv. 110R suggère fortement un rôle clé pour ce gène dans la régulation de la biosynthèse des anthocyanes chez la vigne : les embryons obtenus présentaient une forte coloration rouge, indiquant la présence d’anthocyanes en quantités importantes dans les tissus végétatifs. De plus les embryons transgéniques ont un développement accéléré par rapport aux embryons sauvages. Ces travaux ont permis de mieux comprendre la régulation de l’accumulation des anthocyanes responsables de la coloration des baies de raisin, et plus largement, la régulation du métabolisme des flavonoïdes. / El desarrollo de la uva es un proceso dinámico caracterizado por una curva de crecimiento doble sigmoidea, separada por una fase lag, en donde ocurre una biosíntesis coordinada de metabolitos primarios y secundarios. Al final de la fase lag, ocurre un fenómeno llamado pinta correspondiente al comienzo de la coloración de la baya e iniciándose también el proceso de maduración. Las antocianinas son las responsables de la coloración de la piel de las bayas y su regulación ha sido ampliamente estudiada. Sin embargo, pocos estudios se han enfocado en la caracterización genética y metabólica, utilizando variedades contrastantes de color de piel. Utilizando análisis metabólico y la tecnología de RNA-seq, se realizó una nueva caracterización comparativa de dos uvas de mesa, Chimenti Globe (CG) y Red Globe (RG), que poseen un color de piel de la baya contrastante: CG tiene un color rojizo claro y RG posee un color morado. La originalidad de este modelo es que CG fue generada en un evento espontáneo de campo desde una rama de una planta RG. Por lo tanto, el background genético responsable del cambio de color es el mismo. El análisis del contenido metabólico de las pieles de las bayas reveló la importancia de las etapas de desarrollo, pinta y maduración, en ambas variedades en estudio. En particular, la diferencia en la concentración de metabolitos de la ruta fenilpropanoide, tales como shikimato y fenilalanina y otras moléculas como UDP-glucosa y trehalosa-6-fosfato, entre otros. Asimismo, las diferencias entre las variedades estuvieron dadas por cambios relacionados con la biosíntesis de sacarosa y antocianinas. CG solo contenía antocianinas dihidroxiladas, cianidina y peonidina, y no las del tipo trihidroxiladas, malvidina, delfinidina y petunidina, lo cual fue consistente con el fenotipo del color de piel observado. A partir del análisis transcriptómico, generamos un heatmap con 109 genes expresado diferencialmente en CG en comparación con RG, siendo muchos de estos asociados a la ruta biosíntesis de flavonoides. Además, observamos que 11 copias del gen flavonoide 3'5'-hidroxilasa, que codifica una enzima clave para la biosíntesis de antocianinas trihidroxiladas, no estaban inducidas en CG. A partir de este análisis, se seleccionó un gen candidato para contribuir en el estudio de la ruta de biosíntesis de antocianinas: citocromo b5 (Cytb5) que codifica una proteína clave donadora de electrones no caracterizada en vides. La sobreexpresión de Cytb5 en embriones V. berlandieri x V. rupestris cv. 110R sugirió fuertemente la participación en la ruta, ya que los embriones transgénicos exhibieron un color rojizo e incluso, un desarrollo acelerado en comparación con el control. Con estos resultados, hemos sido capaces de proporcionar información sobre la regulación de las antocianinas en vides responsables de la coloración de la piel de las bayas, abriendo nuevos terrenos en la búsqueda de reguladores moleculares de la vía flavonoide.
|
130 |
Etude de l'impact de la dérégulation transcriptionnelle liée à des transcrits chimères initiés à partir d'éléments répétés de type LINE-1 dans la tumorigenèse gliale / Impact of transcriptional deregulation linked to the production of chimeric transcripts intiated from LINE-1 repeat elements in gliomasPinson, Marie-Elisa 06 December 2017 (has links)
Les éléments LINE-1 (L1) sont une classe abondante de rétrotransposons représentant 17% du génome humain. La région 5’UTR des sous-familles les plus récentes (L1PA1 à 6) contient un promoteur bidirectionnel contenant non seulement un promoteur sens interne mais aussi un promoteur antisens, nommé ASP. Dans les cellules normales, l’un des mécanismes impliqués dans la régulation du promoteur de L1 est la méthylation ADN. Dans les tumeurs, une hypométhylation globale affectant notamment les L1 est observée. Il a été mis en évidence que cette hypométhylation pouvait induire la transcription, à partir de l’ASP, de transcrits chimères ou LCT (L1 Chimeric Transcript). Ces LCT sont composés en 5’ de la séquence L1 et se poursuivent dans la région génomique adjacente. Afin d’étudier l’impact pangénomique de cette dérégulation et son implication dans les processus tumoraux, un outil bio-informatique dédié, nommé CLIFinder, a été développé pour identifier dans des données de RNA-seq paired-end orientés des LCT putatifs. Les RNA-seq de 13 gliomes, qui sont les cancers du cerveau les plus fréquents chez l’adulte, et de 3 tissus cérébraux contrôles ont été étudiés. CLIFinder identifie 2675 chimères dans les gliomes dont 84% impliquent des L1 récents (PA1 à 7) pleine taille supposés posséder un ASP fonctionnel et 50% sont détectées spécifiquement dans les échantillons tumoraux. 78 chimères correspondent à des LCT déjà décrits dans la littérature. De même, l’étude de RNA-seq d’autres types tumoraux (lignée MCF7 et métastases ovariennes) par CLIFinder identifie des chimères en commun suggérant une récurrence de certaines d’entre elles. L’étude d’un groupe de chimères par marche en 5’ par RT-PCR valide que 89% (56/63) des chimères impliquant des L1 récents (L1PA1 à PA7) sont initiées dans la région de l’ASP et correspondent à des LCT alors que toutes les chimères testées impliquant des L1PA8 sont initiées en amont de cette région. Des études de RT-qPCR sur une cohorte plus large de 51 gliomes montrent que les 56 LCT testés, incluant des LCT spécifiques de tumeurs, sont exprimés non seulement dans les tumeurs mais aussi dans les contrôles. Par contre, 70% des LCT spécifiques de tumeurs, montrent alors une surexpression tumorale significative. Ces résultats suggèrent donc une transcription basale provenant de l’ASP dans les tissus normaux et que la dérégulation transcriptionnelle liées aux LCT dans les gliomes passe par une surexpression. Par ailleurs, afin de déterminer le ou les mécanismes sous-jacents impliqués dans l’augmentation de l’activité transcriptionnelle de l’ASP, deux hypothèses ont été testées. La première implique l’hypométhylation du promoteur de L1. Toutefois mes résultats tendent à réfuter cette hypothèse puisqu’aucune diminution de la méthylation ADN n’est retrouvée au niveau de la région promotrice des L1 impliqués dans la transcription de LCT surexprimés. Par contre, les gènes associés à des LCT dont l’expression est dérégulée en contexte tumoral présentent une dérégulation dans le même sens que celle du LCT. De plus, les variations d’expression de gènes corrèlent systématiquement avec celle des LCT correspondants. Ceci suggère qu’une augmentation d’activité transcriptionnelle aux loci des LCT serait responsable de la surexpression de ceux-ci. Enfin 2 LCT candidats surexprimés et ayant un potentiel de biomarqueur prédictif de la survie des patients, pourraient jouer un rôle fonctionnel dans l’initiation, la progression et/ou l’agressivité tumorale. En conclusion, mes travaux ont validé que CLIFinder se positionne comme un outil pertinent permettant d’identifier, de façon pangénomique, les LCT exprimés dans différents types tumoraux à partir de données de RNA-seq paired-end orientées. L’observation d’une récurrence ainsi que d’une surexpression tumorale de certains LCT suggère qu’ils pourraient jouer un rôle fonctionnel dans les processus de tumorigenèse. / LINE-1 (L1) is the most abundant class of retrotransposons which represents 17% of the human genome. The 5’ region of the youngest L1 sub-families (L1PA1 to 6) contains a bidirectional promoter consisting, in addition to the internal sense promoter, of an antisense promoter, called ASP. In normal cells, the main defense mechanism, developed to counteract the deleterious effect of L1 activity, consists in L1 promoter DNA methylation. A hallmark of cancer genomes consists in a global DNA hypomethylation which affects especially L1 promoters. In tumors, evidences suggest that this hypomethylation could result in transcription from ASP of aberrant L1-Chimeric Transcripts (LCTs) composed of L1 5’end and its adjacent sequence. To investigate the pangenomic extent of this transcriptional deregulation and its impact in tumoral processes, a dedicated bioinformatic tool, CLIFinder, was designed to select putative LCTs among RNA-seq oriented paired-end reads. RNA-seq analyses of 13 gliomas, which are the most common brain cancer in adults, and 3 control brains were performed.CLIFinder identifies 2675 chimeras in gliomas, among which 84% involves recent L1 (PA1 to 7) full size, supposed to possess a functional ASP, and 50% are detected specifically in tumors samples. 78 chimeras correspond to LCT already described in literature. In addition, study of additional RNA-seq data from other tumor types (MCF7 and ovarian metastasis) by CLIFinder identifies common chimeras suggesting that some of them can be recurrent. The analysis of a group of chimeras by 5’ walk RT-PCR validate that 89% (56/63) of chimeras implying recent L1 (L1PA1 to 7) are initiated at the ASP region and therefore correspond to LCT; whereas all tested chimeras implying an L1PA8 element are transcribed from an upstream region. RT-qPCR studies on a larger cohort of 51 gliomas show that all 56 tested LCT, even identified by CLIFinder as “tumor specific”, are not only expressed in tumors but also in controls. Nevertheless, 70% of the “tumor specific” LCTs are significantly overexpressed in tumors. My results suggest that, even L1 5’ UTR methylation, some ASP are active in normal tissues and lead to a basal LCT expression in normal tissues. Moreover, a transcriptional deregulation linked to LCTs in tumors exists and implies a LCTs’ overexpression.In order to determine the underlying mechanisms involved in the increase of transcriptional activity of ASP, two hypothesis were tested. The first one implies L1 promoter hypomethylation. My results tend to refute this hypothesis because no decrease of the DNA methylation is found at the promoter region of L1 linked to overexpressed LCTs. On the other hand, the genes associated to LCT presenting an expression deregulation in tumors demonstrate a deregulation in the same way. Moreover, gene expression variations correlates systematically with the one corresponding LCTs. This suggests that an increase of transcriptional activity at the LCTs loci would be responsible of their overexpression. Finally, 2 candidate LCT overexpressed and presenting as potential predictive biomarkers for patient’s survival, could play a functional role in initiation, progression and/or the tumoral aggressiveness.In conclusion, my work has validated CLIFinder as a useful tool to identify, at pangenomic level, LCTs expressed in different tumor types from paired-end stranded RNA-seq data. The observation of the recurrence and tumoral overexpression for some LCTs suggests that they may play a functional role in tumoral processes.
|
Page generated in 0.0401 seconds