Return to search

Metodologias de bioinformatica para detecção e estudo de sequencias repetitivas em loci genicos de transcritos quimericos / Bioinformatics methodologies for detection and study of repetitive sequences in gene loci of chimeric transcripts

Orientador: Michel Eduardo Beleza Yamagishi / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Biologia / Made available in DSpace on 2018-08-15T17:21:19Z (GMT). No. of bitstreams: 1
Herai_RobertoHirochi_D.pdf: 3625854 bytes, checksum: 3f19d10a9b0bb7f77091197cd302f66e (MD5)
Previous issue date: 2010 / Resumo: A grande quantidade de dados biológicos gerados recentemente permitiu verificar que os genomas são repletos de seqüências repetitivas (SR), como microsatélites e elementos genéticos móveis, altamente improváveis de ocorrer estatisticamente se os genomas fossem gerados a partir de uma distribuição aleatória de nucleotídeos. Tal comprovação motivou a classificação de tais seqüências e também a construção de diversas ferramentas de bioinformática, além de mecanismos de armazenamento baseados em sistemas de gerenciamento de bancos de dados (SGBD) para permitir localizá-las e armazená-las para posterior estudo. Entretanto, foi com a comprovação biológica da importância das SR, como no mecanismo de interferência por RNAi (SR reversa complementar), que as SR despertaram maior interesse por parte da comunidade científica. Atualmente, já há fortes evidências que associam as SR com fenômenos biológicos bastante interessantes, como o processamento de RNA por cis-splicing e a formação de transcritos quiméricos, freqüentes em organismos inferiores e muito raro em organismos superiores. Tais tipos de transcritos podem ser gerados a partir de trans-splicing ou, como conjecturamos nesse trabalho, pela transposição de elementos genéticos móveis (como por exemplo transposons ou retrotransposons). Em virtude disso, este projeto propõe a construção de metodologias de Bioinformática, disponibilizadas na WEB, para detectar transcritos quiméricos em genomas de organismos, tanto em versões draft ou em alta qualidade, e também estudar as SR que ocorrem no locus gênico dos transcritos envolvidos na formação de uma seqüência quimérica. As ferramentas propostas permitiram identificar, a partir de bibliotecas de transcritos de full-length cDNA, tanto de humanos quanto de bovinos, novos transcritos quiméricos provenientes de células de tecidos normais, e que não seguem splice-sites canônicos na região de fusão dos transcritos envolvidos. Além disso, as seqüências encontradas apresentam uma elevada taxa de concentração de pares de SR do tipo reverso complementar no locus gênico dos dois transcritos que formam a seqüência quimérica. As ferramentas propostas podem ser utilizadas para outros organismos e direcionar trabalhos experimentais para tentar comprovar em bancada novos transcritos quiméricos, tanto em organismos inferiores quanto em superiores / Abstract: The recent availability of a huge amount of biological data allowed to know about the high concentration of repetitive sequences (SR) like microsatellites and genetic mobile elements in different genomes. Repetitive sequences are improbable to occur statistically if genome data were generated by a random distribution of nucleotides. Such observation motivated the classification of repetitive sequences, and the construction of several bioinformatics tools. Furthermore, several mechanisms to store repetitive sequences, which are based on data base management systems (DBMS) were proposed and created. They can be used to search for specific sequences to make a posteriori study. However, it was with the biological confirmation of the importance of repetitive sequences, like by the RNA interference (reverse complement, or inverted repeat) mechanism, that the scientific community gained more interest by such sequences. Actually, there is strong evidence that associates the repetitive sequences with some interesting biological phenomena, like in RNA processing by cis-splicing, and in chimeric transcript formation mechanism. This last one is very frequently in inferior organism, but rare in superior organisms. Such types of transcripts can be generated by trans-splicing, or like conjectured in this work, by the retrotransposition of mobile genetic elements (like transposons or retrotransposons). In this way, this work proposed the construction of several Bioinformatics methodologies, available in the WEB, to detect new evidences of chimeric transcripts in genomes of different organisms, both in draft genome and in high quality genome assemblage. We also studied repetitive sequences in gene loci of the involved transcripts in a chimeric sequence formation. The proposed tools allowed us to identify, using a full-length cDNA databank, new chimeric transcript candidates in human and in bovine genome. They are from cells of normal tissues, and do not follow canonical splice-sites in the fusion region of the involved transcripts. Moreover, it was possible to show that the detected sequences have high concentration pairs of reverse complement type of repetitive sequences in gene loci of the two involved transcripts, which originated a new chimeric transcript candidate. The created bioinformatics tools can be used in other organisms in addition to the one used in this work, leading to the proposition of new experimental work to try to prove in vivo new chimeric transcripts, both in superior organism and in inferior organism / Doutorado / Bioinformatica / Doutor em Genetica e Biologia Molecular

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/317152
Date15 August 2018
CreatorsHerai, Roberto Hirochi
ContributorsUNIVERSIDADE ESTADUAL DE CAMPINAS, Yamagishi, Michel Eduardo Beleza, Yunes, Jose Andre, Oliveira, Guilherme Correa de, Pereira, Gonçalo Amarante Guimarães, Higa, Roberto Hiroshi
Publisher[s.n.], Universidade Estadual de Campinas. Instituto de Biologia, Programa de Pós-Graduação em Genética e Biologia Molecular
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageUnknown
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Format178 p. : il., application/pdf
Sourcereponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds