• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 192
  • 9
  • 6
  • 6
  • 2
  • 1
  • Tagged with
  • 217
  • 71
  • 50
  • 49
  • 44
  • 26
  • 26
  • 23
  • 22
  • 20
  • 20
  • 20
  • 18
  • 17
  • 16
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
161

Um algoritmo para a construção de vetores de sufixo generalizados em memória externa / External memory generalized suffix array construction algorithm

Louza, Felipe Alves da 17 December 2013 (has links)
O vetor de sufixo é uma estrutura de dados importante utilizada em muitos problemas que envolvem cadeias de caracteres. Na literatura, muitos trabalhos têm sido propostos para a construção de vetores de sufixo em memória externa. Entretanto, esses trabalhos não enfocam conjuntos de cadeias, ou seja, não consideram vetores de sufixo generalizados. Essa limitação motiva esta dissertação, a qual avança no estado da arte apresentando o algoritmo eGSA, o primeiro algoritmo proposto para a construção de vetores de sufixo generalizados aumentado com o vetor de prefixo comum mais longo (LCP) e com a transformada de Burrows-Wheeler (BWT) em memória externa. A dissertação foi desenvolvida dentro do contexto de bioinformática, já que avanços tecnológicos recentes têm aumentado o volume de dados biológicos disponíveis, os quais são armazenados como cadeias de caracteres. O algoritmo eGSA foi validado por meio de testes de desempenho com dados reais envolvendo sequências grandes, como DNA, e sequências pequenas, como proteínas. Com relação aos testes comparativos com conjuntos de grandes cadeias de DNA, o algoritmo proposto foi comparado com o algoritmo correlato mais eficiente na literatura de construção de vetores de sufixo, o qual foi adaptado para construção de vetores generalizados. O algoritmo eGSA obteve um tempo médio de 3,2 a 8,3 vezes menor do que o algoritmo correlato e consumiu 50% menos de memória. Para conjuntos de cadeias pequenas de proteínas, foram realizados testes de desempenho apenas com o eGSA, já que no melhor do nosso conhecimento, não existem trabalhos correlatos que possam ser adaptados. Comparado com o tempo médio para conjuntos de cadeias grandes, o eGSA obteve tempos competitivos para conjuntos de cadeias pequenas. Portanto, os resultados dos testes demonstraram que o algoritmo proposto pode ser aplicado eficientemente para indexar tanto conjuntos de cadeias grandes quanto conjuntos de cadeias pequenas / The suffix array is an important data structure used in several string processing problems. In the literature, several approaches have been proposed to deal with external memory suffix array construction. However, these approaches are not specifically aimed to index sets of strings, that is, they do not consider generalized suffix arrays. This limitation motivates this masters thesis, which presents eGSA, the first external memory algorithm developed to construct generalized suffix arrays enhanced with the longest common prefix array (LCP) and the Burrows-Wheeler transform (BWT). We especially focus on the context of bioinformatics, as recent technological advances have increased the volume of biological data available, which are stored as strings. The eGSA algorithm was validated through performance tests with real data from DNA and proteins sequences. Regarding performance tests with large strings of DNA, we compared our algorithm with the most efficient and related suffix array construction algorithm in the literature, which was adapted to construct generalized arrays. The results demonstrated that our algorithm reduced the time spent by a factor of 3.2 to 8.3 and consumed 50% less memory. For sets of small strings of proteins, tests were performed only with the eGSA, since to the best of our knowledge, there is no related work that can be adapted. Compared to the average time spent to index sets of large strings, the eGSA obtained competitive times to index sets of small strings. Therefore, the performance tests demonstrated that the proposed algorithm can be applied efficiently to index both sets of large strings and sets of small strings
162

Caracterização de transposases da família  SChaT em cana-de-açúcar: estudo molecular e funcional. / Characterization of SChAT family transposases in sugarcane: molecular and functional studies.

Cruz, Edgar Andrés Ochoa 19 June 2012 (has links)
Os elementos de transposição (TEs) se movimentam de um locus para outro no genoma afetando a estrutura e evolução destes. A superfamília de transposases hAT é definida pelos elementos que compartilham os domínios de dimerização e ligação ao DNA com os transposons previamente descritos: hobo, Activator e Tam3. Análises prévias encontraram algumas evidencias da presença genômica e ativação transcricional de TEs relacionados à superfamília hAT em cana-de-açúcar (denominados de família SChAT) e pelo menos três linhagens evolutivas foram postuladas. O objetivo deste trabalho é caracterizar versões genômicas das linhagens de transposons (191 e 257) e linhagem possivelmente domesticada (074). Pretende-se estudar as relações evolutivas, distribuição em gramíneas, identificar os padrões de expressão e propriedades funcionais. Regiões de sintenia foram estabelecidas para estes BACs em Arabidopsis thaliana, Brachypodium distachyon, Sorghum bicolor, Oryza sativa e Zea mays. Elementos relacionados com as três linhagens foram procurados nestes genomas. / Transposable elements (TEs) are able to move from one locus to another within a genome. TE mobilization affects genome structure and evolution. The hAT transposase superfamily is defined as elements that share the dimerization and DNA ligation domains with the previously described hobo, Activator and Tam3 transposon elements. Previous analyses found some genomic and transcriptional evidences of TEs related to hAT superfamily in sugarcane (named SChAT family) and at least three evolutionary lineages were proposed. The aim of this work is to characterize full-length genomic versions of the transposons lineages (191 and 257) and from the domesticated lineage (074). It is proposed to study the evolutionary relationship, distribution along grasses genomes, identify expression patterns and functional capacities of the SChAT elements. Syntenic regions for the BACs containing elements from the three lineages were mapped in Arabidopsis thaliana, Brachypodium distachyon, Sorghum bicolor, Oryza sativa and Zea mays. Related elements were search on the same genomes.
163

Caracterización y variabilidad genética del virus de amarillamiento de la papa y virus T de la papa mediante secuenciación del ARN de interferencia

Silvestre Casas, Rocio del Carmen January 2017 (has links)
Publicación a texto completo no autorizada por el autor / Estudia la organización genómica y la variabilidad genética del virus del amarillamiento de la papa y del virus T de la papa mediante secuenciación del ARN de interferencia. Para ello, se utilizaron accesiones de papa y yacón de la colección del banco de germoplasma del Centro Internacional de la Papa (CIP). El virus del amarillamiento de la papa (PYV) presentó del 86 % al 95 % de identidad de secuencia de aminoácidos y nucleótidos con ilarvirus de Fragaria chiloensis latent virus (FCILV), respectivamente. Los análisis filogenéticos de dominios conservados de los aislamientos de PYV procedentes de Perú y Ecuador, el aislado de Smallanthus sonchifolius “yacón” y el FCILV indicaron que pertenecen al género Ilarvirus, familia Bromoviridae. Sin embargo, las diferencias en las secuencias y el rango de hospederos sugieren que los aislados pueden separarse en subgrupos o cepas. El virus T de la papa (PVT) ha sido reportado en Perú y Bolivia, también infecta ulluco, oca y mashua pero aún no se han determinado los síntomas. Los análisis filogenéticos de cepas de Perú, Chile y Bolivia respaldan la relación del PVT con la familia Betaflexiviridae pero difieren en el género. Presenta el primer reporte de la secuencia completa del genoma de PYV, a la vez brinda información molecular y filogenética para determinar el género de PVT. / Tesis
164

Primeiro mapa genômico comparativo entre o cromossomo 16 do búfalo de rio (BBU16) e o cromossomo 15 bovino (BTA15)

Fornitano, Larissa Cristina [UNESP] 06 February 2009 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:04Z (GMT). No. of bitstreams: 0 Previous issue date: 2009-02-06Bitstream added on 2014-06-13T20:33:41Z : No. of bitstreams: 1 fornitano_lc_me_sjrp.pdf: 1355762 bytes, checksum: 8d684160e1b0f3eb1f0e1d5b46e64744 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Nsf - Nacional Science Foundation / No presente trabalho, apresentamos o primeiro mapa RH do cromossomo 16 bubalino (BBU16), construído com a utilização do painel celular BBURH5000. Seqüências de primers para PCR de 30 genes derivados do cromossomo 15 bovino (BTA15) foram testados com DNA de búfalo para a construção do mapa RH BBU16. Dos marcadores testados, 11 geraram produtos de PCR específicos com o DNA de búfalo, mostrando-se adequados para o mapeamento utilizando o painel BBURH5000. A partir de análises estatísticas, 9 genes foram incluídos no primeiro mapa RH do cromossomo BBU16 contendo apenas um grupo de ligação. As freqüências de retenção (FR) dos marcadores variaram entre 16,6% (SDHD) e 32,2% (PORIMIN). Comparando-se o mapa RH obtido com a sequência do BTA15, pode-se verificar que não houve discrepâncias quanto a ordem dos 9 genes em ambas espécies, evidenciando a conservação da ordem linear desses marcadores nas mesmas / This paper describes a radiation hybrid (RH) map of river buffalo (Bubalus bubalis) chromosome 16, generated from a previously described river buffalo whole genome RH panel (BBURH5000). PCR Primer sequences were selected for 30 cattle derived genes mapped on bovine chromosome 15. From the total number of selected markers, 11 generated specific PCR products with buffalo DNA and were suitable for mapping using the BBURH5000 panel. The statistical analysis included 9 genes on the BBU16 RH map, which were distributed in one linkage group. Retention frequencies (RF) ranged from 16,6% for SDHD and 32,2 % for PORIMIN. The marker order on the linkage group is entirely consistent with the current BTA15 sequence assembly (Btau_4.0), indicating a conservation in the order of the genes on both species
165

Mapeamento genômico rh do braço curto do cromossomo 4 do búfalo de rio

Pelai, Vanderlei Antonio [UNESP] 28 February 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:05Z (GMT). No. of bitstreams: 0 Previous issue date: 2008-02-28Bitstream added on 2014-06-13T18:29:24Z : No. of bitstreams: 1 pelai_va_me_sjrp.pdf: 1678959 bytes, checksum: 207276333fc39f233dabe43abc0a259f (MD5) / Nsf - Nacional Science Foundation / Secretaria de Educação / O búfalo de rio (Bubalus bubalis) é uma espécie de interesse econômico pertencente à família Bovidae, utilizado para a produção de carne e leite, além de força de trabalho no campo. Recentemente, a construção de um painel de linhagens celulares contendo fragmentos do genoma do búfalo de rio, incorporado ao genoma de hamster (BBURH5000), está permitindo o mapeamento de todos os cromossomos bubalinos, representando a única ferramenta genômica desta categoria para o estudo da espécie. A utilização deste painel de células associado a análises estatísticas está gerando mapas genômicos de alta resolução contendo diferentes tipos de marcadores moleculares. O presente trabalho teve por objetivo utilizar este painel de células para a construção de um mapa genômico preliminar do braço curto do cromossomo 4 bubalino. Para tal, foram testados com o DNA bubalino, seqüências de oligonucleotídeos para PCR de 39 marcadores moleculares previamente mapeados no cromossomo 28 bovino, o qual foi descrito na literatura como o homólogo ao braço curto do cromossomo 4 de búfalo. Do total de marcadores testados, 14 (8 genes e 6 microssatélites) geraram produtos de PCR adequados ao mapeamento utilizando o painel BBURH5000. A freqüência de retenção de cada marcador no painel variou de 34,4%, para os marcadores, ANXA8, PPYR1 e ZNF33A a 43,3% para o marcador BMC6020. Utilizando os 14 marcadores, acrescidos de outros 10 marcadores (1 EST, 5 STS e 4 microssatélites) genotipados por pesquisadores da Texas A&M University, um mapa genômico RH preliminar foi construído para o braço curto do cromossomo 4 bubalino. A comparação desse mapa com mapas do cromossomo 28 bovino (BTA28) evidenciou extensa conservação na ordem dos marcadores no mapa obtido. / The river buffalo (Bubalus bubalis), a member of the Bovidae family, is an economically important livestock specie useful to produce milk, meat, as well as source of labor. Recently, a whole-genome 5000-rad radiation hybrid panel was constructed for the river buffalo genome (BBURH5000 panel), which has been used to generated RH maps of several chromosomes from the specie. The goal of this study was to construct a preliminary RH map of the river buffalo chromosome 4 (BBU4p), using the BBURH5000 panel. Previous studies identified bovine chromosome 28 (BTA28) as homologous to BBU4p. Cattle derived PCR primers from 39 markers previously mapped in cattle, were tested with buffalo DNA. A total of 14 (8 genes and 6 microsatellites) of the 39 markers amplified PCR products suitable for the RH mapping. Retention frequencies of individual markers ranged from 34.4% for ANXA8, PPYR1 and ZNF33A to 43.3% for BMC6020. The preliminary RH map for BBU4p was constructed with a total of 24 markers, 14 from this study combined with 10 markers (1 EST, 5 STS and 4 microsatellites) genotyped by researchers at Texas A&M University. Comparisons of the BBU4p RH map with BTA28 revealed extensive conservation in the order of the mapped markers. Keywords: Bubalus bubalis; genome; river buffalo; RH mapping
166

Predição computacional de promotores em Xanthomonas axonopodis pv. citri

Tezza, Renata Izabel Dozzi [UNESP] 01 August 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:09Z (GMT). No. of bitstreams: 0 Previous issue date: 2008-08-01Bitstream added on 2014-06-13T18:54:08Z : No. of bitstreams: 1 tezza_rid_me_jabo.pdf: 2155126 bytes, checksum: 33a07381689b0811f980f19b4c0fc487 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Com o seqüenciamento completo do genoma do fitopatógeno Xanthomonas axonopodis pv. citri (Xac), em 2002, inúmeras possibilidades de estudo foram viabilizadas, dando margem à busca de novas formas de controle do cancro cítrico, baseadas em alvos moleculares. Estudos dessa natureza têm mostrado a existência de genes que somente são expressos quando a bactéria está se desenvolvendo in planta. Sabe-se que essa regulação é dependente da região promotora e sua identificação pode possibilitar avanços significativos na busca do controle dessa doença. Apesar do crescente avanço das técnicas experimentais in vitro em biologia molecular, identificar um número significante de promotores ainda é uma tarefa difícil e dispendiosa. Os métodos computacionais existentes enfrentam a falta de um número adequado de promotores conhecidos para identificar padrões conservados entre as espécies. Logo, um método para predizê-Ios em qualquer organismo procariótico ainda é um desafio. O Modelo Oculto de Markov é um modelo estatístico aplicável a muitas tarefas em biologia molecular. Entre elas, predição e mapeamento de seqüências promotoras no genoma de um procarioto. Neste trabalho, estudou-se o mapeamento in silico de promotores gênicos de todo o genoma da Xac e em 68% dos genes a localização de um promotor foi indicada. A análise comparativa com dados experimentais de proteômica mostrou que 72% das proteínas expressas identificaram-se com elementos desta lista de promotores, o que corresponde a 27% do total de genes do genoma. À partir destes dados foi possível levantar um rol de informações sobre estes candidatos a promotores incitando a novos estudos moleculares. / With the complete genome sequencing of the phytopathogen Xanthomonas axonopodis pv. Citri (Xac), in 2002, several study possibilities were made practical and then creating the search of new citrus canker control ways, based in molecular aims. This kind of studies has shown the genes existences that are only expressed when the bacteria are developing itself in plant. It has been known that this regulation is promoter region dependent and its identification can allow significant advances in the search of this disease control. Although increasing advance of in vitro experimental techniques in molecular biology, identifying a meaningful number of promoters is still a hard and expensive task. The existents computer science methods face the need of a proper number of known promoters to identify conserved patterns among the species. Therefore, a method to predict them in any prokaryote organism is still a challenge. The Hidden Markov Model (HMM) is a statistic model applicable in many tasks in molecular biology. Among them, prediction and mapping of the promoters sequences in prokaryotic genome. In this work, which has studied the genic promoters in silico mapping of the whole Xac genome, in 68% of the genes the promoter localization was indicated. The proteomic experimental data comparative analysis showed that 72% of the expressed proteins identified with elements from the promoters list, which corresponds 27% of the genome genes total. According to these data it was possible to generate an information roll about these promoters candidates inciting new molecular studies.
167

Caracterização biológica e molecular de recombinantes naturais de HIV-1. / Biological and molecular characterization of HIV-1 natural recombinants.

Fernando Lucas de Melo 09 May 2011 (has links)
A recombinação durante a transcrição reversa é um fator importante no aumento da diversidade genética e adaptação do HIV-1, permitindo que mutações vantajosas presentes em diferentes linhagens sejam combinadas em um mesmo genoma. No Brasil, vários recombinantes foram descritos e seis formas recombinantes circulantes (CRFs) já foram identificados, demonstrando a relevância destes recombinantes na epidemia brasileira. Portanto, um dos objetivos desta tese foi analisar os dados gerados pela Rede de Diversidade Genética Viral (VGDN) (sequências parciais de gag, pol e env), a fim de identificar recombinantes inter-subtipos de HIV-1 e avaliar a frequência e distribuição geográfica destes vírus. Utilizando diferentes técnicas foram identificados 152/1083 pacientes portadores de recombinantes BF. A frequência destes recombinantes foi maior em cidades como São Vicente (30%) e Sorocaba (22,6%), sendo que os recombinantes circulantes em São Vicente foram geralmente relacionados às CRF28 e CRF29, enquanto que os vírus presentes na região de Sorocaba comumente apresentam um envelope subtipo F1, independente do subtipo nos demais genes. Além disso, o gene da integrase de 159 pacientes foi amplificado e sequenciado. A análise deste gene revelou mais 10 pacientes infectados com recombinantes BF e nenhuma mutação de resistência primária aos inibidores da integrase foi encontrada. O segundo objetivo foi isolar e caracterizar recombinantes BF in vitro. O isolamento viral foi realizado por co-cultivo e ao final foram obtidos 10 isolados primários. O sequenciamento do genoma quase completo desses dez isolados primários revelou que três isolados primários pertencem ao grupo da CRF28_BF, três ao grupo da CRF29_BF e quatro foram classificados como formas recombinantes únicas (URFs). Ainda, o uso de correceptores desses isolados foi avaliado in vitro em ensaios com as células GHOST(3), e revelou três duplo-trópicos (X4/R5) vírus, quatro CXCR4 (X4) e três isolados utilizaram apenas CCR5 (R5). Em suma, uma alta frequência de URFs foi encontrada em algumas cidades do Estado de São Paulo, e também foi desenvolvido e caracterizado um painel de isolados primários representando as CRF28_BF, CRF29_BF e algumas URFs. / Recombination during reverse transcription is an important factor promoting HIV-1 diversity and adaptive change, allowing advantageous mutations arising on different genomes to undergo linkage in the same progeny recombinant genome more frequently than what would be expected under random mutation alone. In Brazil, several recombinant viruses were reported, and six circulating recombinant forms (CRFs) have already been identified. Therefore, the first objective of this Thesis was to analyze the data generated by the Viral Genetic Diversity Network (VGDN) (gag, pol and env partial sequences), in order to identify HIV-1 intersubtype recombinants and evaluate the frequency and geographical distribution of these viruses. Using different techniques we identified 152/1083 patients harboring BF recombinants. The frequency of these recombinants was higher in cities like São Vicente (30%) and Sorocaba (22.6 %). The recombinant viruses circulating in São Vicente were generally related to CRF28 and CRF29, while those viruses circulating in Sorocaba commonly presented an envelope region of subtype F1, irrespective the subtype composition on the remaining genes. Additionally, the integrase gene of HIV-1 from 159 patients was further amplified and sequenced. The analysis of this viral gene revealed ten more patients infected with BF recombinants and no primary mutations related to integrase inhibitor resistance were found. The second objective was to isolate and characterize BF recombinants in vitro, which resulted in ten primary HIV-1 isolates. The near full-length genomes of these ten primary isolates revealed that three were related to CRF28_BF, three to CRF29_BF and four were unique recombinant forms (URFs), according to their breakpoints profile determined with the jpHMM program. Additionally, the coreceptor usage of these isolate was investigated in vitro using GHOST assays, which revealed three dual-tropic (X4/R5) viruses, four CXCR4 (X4) viruses and three CCR5 (R5) viruses. In sum, we report a high frequency of URFs in some cities of São Paulo State, and also developed a well-characterized panel of viruses representing CRF28_BF, CRF29_BF and URFs.
168

Rearranjos cromoss?micos, evolu??o gen?mica e diversifica??o cariot?pica em tetradontiformes

Bezerra, Juliana Galv?o 03 March 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-02-22T19:07:45Z No. of bitstreams: 1 JulianaGalvaoBezerra_DISSERT.pdf: 1935169 bytes, checksum: ce2361b269051f4b199f9f2d9f4568f5 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-03-06T23:22:30Z (GMT) No. of bitstreams: 1 JulianaGalvaoBezerra_DISSERT.pdf: 1935169 bytes, checksum: ce2361b269051f4b199f9f2d9f4568f5 (MD5) / Made available in DSpace on 2017-03-06T23:22:30Z (GMT). No. of bitstreams: 1 JulianaGalvaoBezerra_DISSERT.pdf: 1935169 bytes, checksum: ce2361b269051f4b199f9f2d9f4568f5 (MD5) Previous issue date: 2016-03-03 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / A ordem Tetraodontiformes se destaca por exibir caracter?sticas morfol?gicas e gen?ticas bastante singulares, representando um dos principais ramos derivados da diversifica??o dos tele?steos. Alguns dos seus grupos constituem os vertebrados com os genomas mais compactos, qualificando-os como modelo de estudo da evolu??o do genoma. Esta caracter?stica gen?mica parece ser o resultado de perdas evolutivas de DNA. Com vistas a realizar compara??es citogen?micas entre esp?cies de alguns grupos de Tetraodontiformes foram realizadas an?lises citogen?ticas nas esp?cies Cantherhines pullus e Monacanthus chinensis (Monacanthidae), Sphoeroides testudineus (Tetraodontidae) e Melichthys N?ger (Balistidae). As an?lises foram ralizadas utilizando as metodologias cl?ssicas (colora??o pelo Giemsa, bandamento C, Ag-RONs), colora??o com fluorocromos base-espec?ficos e mapeamento cromoss?mico atrav?s da hibrida??o in situ fluorescente (FISH) de sequ?ncias ribossomais 18S e 5S e telom?ricas. As esp?cies C. pullus e M. niger revelaram cari?tipos compostos de 40 cromossomos, todos acroc?ntricos. Ambas possuem apenas um par de RONs e heterocromatinas, em maior parte, pericentrom?ricas, contudo, o mapeamento de sequ?ncias telom?ricas em C. pullus mostrou marca??es telom?ricas intersticiais, resultado da din?mica de rearranjos cromoss?micos que ocorre no grupo. Compara??es citogen?ticas entre as esp?cies S. testudineus (2n=46; NF=74) e M. chinensis (2n=34; NF=34) revelaram cari?tipos d?spares em rela??o ao n?mero diploide e de bra?os cromoss?micos, bem como quanto ao diminuto tamanho dos cromossomos de S. testudineus, em rela??o ao grandes cromossomos acroc?ntricos presentes em M. chinensis. A marcante diverg?ncia no tamanho dos cromossomos, estrutura cariot?pica e distribui??o de heterocromatina evidencia a elevada din?mica cromoss?mica e as m?ltiplas tend?ncias carioevolutivas presentes em Tetraodontiformes. Em vista do interesse sobre a evolu??o gen?mica na ordem, novas contribui??es ao conhecimento dos seus genomas e cari?tipos s?o fornecidos e discutidos sob perspectivas citogen?micas e evolutivas.
169

Identificação e análise de expressão de RNAs intrônicos não codificadores humanos / Identification and expression analysis of human intronic noncoding RNAs

Helder Takashi Imoto Nakaya 09 March 2007 (has links)
Neste trabalho, nós mostramos estudos em larga-escala de RNAs não codificadores antisenso que são transcritos em regiões intrônicas de genes humanos. Alguns destes transcritos intrônicos possuem níveis de expressão correlacionados ao grau de diferenciação tumoral de câncer de próstata, apontando para uma relevância biológica destas mensagens em doenças complexas como o câncer. Nós também avaliamos a existência de um mecanismo comum de regulação de transcrição, compartilhado por mRNAs codificadores de proteína e RNAs intrônicos, através de análises de perfis de expressão de uma linhagem tumoral de próstata estimulada por andrógeno. A análise de ESTs e mRNAs depositados em bancos públicos de seqüências revelou mais de 55 mil RNAs Totalmente Intrônicos Não-codificadores (TIN), transcritos dos íntrons de 74% de todos os genes RefSeq únicos. Guiados por esta informação, nós desenhamos uma plataforma de oligonucleotídeos contendo sondas senso e antisenso para cada um de 7.520 transcritos TIN selecionados aleatoriamente, além de sondas para os genes codificadores de proteína correspondentes. Nós identificamos assinaturas intrônicas e exônicas de expressão tecido-específicas em fígado, próstata e rim. Os RNAs TIN antisenso mais altamente expressos eram transcritos de íntrons de genes codificadores de proteína enriquecidos na categoria ?Regulação da transcrição?. A inibição da RNA Polimerase II resultou num aumento de expressão de uma fração dos RNAs intrônicos em células em cultura, sugerindo que outras RNA Polimerases possam estar envolvidas em sua biossíntese. Um subconjunto das assinaturas intrônicas e exônicas localizadas nos mesmos loci genômicos possuíram padrões de expressão correlacionados, sugerindo que RNAs intrônicos regulem a abundância ou o padrão de uso de éxons de mensagens codificadoras de proteína. Nós identificamos diversos padrões de expressão de RNAs intrônicos, indicando que eles possam ter papéis regulatórios. Esta estratégia orientada pelo gene, que combina um microarray intrônico/exônico deve permitir análises comparativas futuras de transcrição intrônica sob várias condições fisiológicas e patológicas, avançando assim em nosso conhecimento sobre as funções biológicas destes RNAs não codificadores. / In this work, we show large-scale studies of antisense noncoding RNAs transcribed from intronic regions of human genes. The correlation of expression levels of some intronic transcripts to the degree of tumor differentiation in prostate cancer points to the biological relevance of these messages in complex diseases such as cancer. We also evaluated the existence of a common mechanism of regulation of transcription shared by protein-coding mRNAs and intronic RNAs by measuring the effect of androgen on the transcriptional profile of a prostate cancer cell line. Survey of mRNA and EST public databases revealed more than 55,000 Totally Intronic Noncoding (TIN) RNAs transcribed from the introns of 74% of all unique RefSeq genes. Guided by this information, we designed an oligoarray platform containing sense and antisense probes for each of 7,520 randomly-selected TIN transcripts plus probes for the corresponding protein-coding genes. We identified exonic and intronic tissue-specific expression signatures for human liver, prostate and kidney. The most highly expressed antisense TIN RNAs were transcribed from introns of proteincoding genes enriched in the \"Regulation of transcription\" class. RNA Polymerase II inhibition resulted in increased expression of a fraction of the intronic RNAs in cell cultures, suggesting that other RNA polymerases may be involved in their biosynthesis. A subset of intronic and protein-coding signatures transcribed from the same genomic loci has correlated expression patterns, suggesting that intronic RNAs regulate the abundance or the pattern of exon usage in protein-coding messages. We have identified diverse intronic RNA expression patterns, indicating that they may have regulatory roles. This gene-oriented approach, using a combined intronic/exonic microarray should permit further comparative analysis of intronic transcription under various physiological and pathological conditions, thus advancing current knowledge about the biological functions of these noncoding RNAs.
170

Um algoritmo para a construção de vetores de sufixo generalizados em memória externa / External memory generalized suffix array construction algorithm

Felipe Alves da Louza 17 December 2013 (has links)
O vetor de sufixo é uma estrutura de dados importante utilizada em muitos problemas que envolvem cadeias de caracteres. Na literatura, muitos trabalhos têm sido propostos para a construção de vetores de sufixo em memória externa. Entretanto, esses trabalhos não enfocam conjuntos de cadeias, ou seja, não consideram vetores de sufixo generalizados. Essa limitação motiva esta dissertação, a qual avança no estado da arte apresentando o algoritmo eGSA, o primeiro algoritmo proposto para a construção de vetores de sufixo generalizados aumentado com o vetor de prefixo comum mais longo (LCP) e com a transformada de Burrows-Wheeler (BWT) em memória externa. A dissertação foi desenvolvida dentro do contexto de bioinformática, já que avanços tecnológicos recentes têm aumentado o volume de dados biológicos disponíveis, os quais são armazenados como cadeias de caracteres. O algoritmo eGSA foi validado por meio de testes de desempenho com dados reais envolvendo sequências grandes, como DNA, e sequências pequenas, como proteínas. Com relação aos testes comparativos com conjuntos de grandes cadeias de DNA, o algoritmo proposto foi comparado com o algoritmo correlato mais eficiente na literatura de construção de vetores de sufixo, o qual foi adaptado para construção de vetores generalizados. O algoritmo eGSA obteve um tempo médio de 3,2 a 8,3 vezes menor do que o algoritmo correlato e consumiu 50% menos de memória. Para conjuntos de cadeias pequenas de proteínas, foram realizados testes de desempenho apenas com o eGSA, já que no melhor do nosso conhecimento, não existem trabalhos correlatos que possam ser adaptados. Comparado com o tempo médio para conjuntos de cadeias grandes, o eGSA obteve tempos competitivos para conjuntos de cadeias pequenas. Portanto, os resultados dos testes demonstraram que o algoritmo proposto pode ser aplicado eficientemente para indexar tanto conjuntos de cadeias grandes quanto conjuntos de cadeias pequenas / The suffix array is an important data structure used in several string processing problems. In the literature, several approaches have been proposed to deal with external memory suffix array construction. However, these approaches are not specifically aimed to index sets of strings, that is, they do not consider generalized suffix arrays. This limitation motivates this masters thesis, which presents eGSA, the first external memory algorithm developed to construct generalized suffix arrays enhanced with the longest common prefix array (LCP) and the Burrows-Wheeler transform (BWT). We especially focus on the context of bioinformatics, as recent technological advances have increased the volume of biological data available, which are stored as strings. The eGSA algorithm was validated through performance tests with real data from DNA and proteins sequences. Regarding performance tests with large strings of DNA, we compared our algorithm with the most efficient and related suffix array construction algorithm in the literature, which was adapted to construct generalized arrays. The results demonstrated that our algorithm reduced the time spent by a factor of 3.2 to 8.3 and consumed 50% less memory. For sets of small strings of proteins, tests were performed only with the eGSA, since to the best of our knowledge, there is no related work that can be adapted. Compared to the average time spent to index sets of large strings, the eGSA obtained competitive times to index sets of small strings. Therefore, the performance tests demonstrated that the proposed algorithm can be applied efficiently to index both sets of large strings and sets of small strings

Page generated in 0.0491 seconds