• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 8
  • 1
  • Tagged with
  • 9
  • 9
  • 6
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Estrutura genomica de tres megabases de DNA genomico (shotugun) de Eucalyptus : conteudo nucleotidico, sequencias repetitivas e genes

Lourenço, Rodrigo Tristan 16 February 2004 (has links)
Orientadores: Gonçalo Amarante Guimarães Pereira, Dario Grattapaglia / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia / Made available in DSpace on 2018-08-03T22:25:24Z (GMT). No. of bitstreams: 1 Lourenco_RodrigoTristan_M.pdf: 1426914 bytes, checksum: a25b14ff0d793c6c37d821a81cdb379c (MD5) Previous issue date: 2004 / Resumo: Com o intuito de obter uma visão da estrutura e composição do genoma de Eucalyptus, sequenciou-se aleatoriamente cerca de 10.000 fragmentos de DNA genômico de Eucalyptus grandis obtidos por meio de seqüenciamento por fragmentação randômica de DNA (shotgun) de uma biblioteca genômica, totalizando mais de 3,0 Mb válidos (phred >=20), isto é, cerca de 0,5% do genoma (640 Mpb). Depois de selecionadas quanto ao tamanho e qualidade, estas seqüências foram analisadas em termos do seu conteúdo nucleotídico, presença de regiões repetitivas e número de genes. Para análise do conteúdo de bases guanidílicas e citidílicas (GC) e do conteúdo de seqüências repetitivas utilizou-se o programa RepeatMasker, o qual indicou que as 10 mil seqüências continham, em média, 40,15% de GC. Aproximadamente 1,4% das bases pertenciam a seqüências transponíveis, distribuídas em 310 elementos repetitivos interespersados, dentre os quais 299 eram retroelementos, principalmente LTRs (¿Long Terminal Repeats¿) e apenas 11 eram transposons. Também foram identificados 986 microssatélites e 1.636 seqüências de baixa complexidade. No total, cerca de 5,8% do genoma de Eucalyptus é composto por seqüências repetitivas. Para a identificação de genes putativos presentes, utilizou-se uma estratégia alternativa baseada na comparação deste banco genômico com bancos de ESTs (¿Expressed Sequence Tags¿) de Eucalyptus utilizando o programa GenESTate, nomeando os genes identificados de acordo com o resultado do ¿BLAST¿ (¿Basic Local Alignment Search Tool¿) encontrado para as ESTs. Também comparou-se todas as seqüências genômicas com o banco de dados não-redundante de proteínas do NCBI (¿National Center for Biotechnology Information¿) com o intuito de identificar outros genes. Aproximadamente 44 seqüências similares a ESTs foram identificadas, contabilizando 2% do total de pares de bases analisado. É importante ressaltar a identificação de íntrons e éxons, além de regiões promotoras, a partir desta comparação, visto que estas estruturas não podem ser identificadas em ESTs. Cerca de 166 genes foram identificados a partir da comparação de todas as seqüências com o banco de dados de proteínas do NCBI por meio do protocolo ¿blastx-nr¿. Também foram identificados genes putativos para 16 tRNAs utilizando o programa tRNAscan-SE. Este banco de dados genômicos poderá ser utilizado no âmbito do Projeto Genolytpus para guiar o processo de ancoragem do mapa genético com o mapa físico, no desenvolvimento de novos marcadores do tipo microssatélites e na identificação de regiões promotoras / Abstract: In this work we intended to obtain an overview of the structure and composition of the Eucalyptus genome by sample sequencing 10.000 genomic DNA fragments obtained from a shotgun genomic library from E. grandis, that represents 3,0 Mbp of the E. grandis genome. The reads were filtered by their quality and length (phred value >=20; length >=150) and analyzed for their nucleotide content, repetitive patterns, repetitive elements and gene content. The program RepeatMasker was used to analyze the %GC content and repetitive patterns and elements. The results indicate that on average the Eucalyptus genome is composed of 40.15% of GC. From the total of the bases sequenced approximately 1.4% were located in transposons, distributed in 310 interespersed repetitive genetic elements, among which 299 classified as retroelements, mainly LTRs. We also identified 986 microsatellites and 1636 low complexity sequences. 5.8% of the sequenced bases were located on repetitive sequences. We used an alternative approach to identify putative genes by comparing the genomic sequences with a Eucalyptus ESTs database using the GenESTate software. We attributed putative functions using a pipeline were the éxons of each gene were put togheter and compared with protein domains data banks. This procedure avoids the misleading results obtained when comparing DNA sequences with sequences deposited in GenBank. The sequences were clustered using the CAP3 software, resulting in 766 agrupamentos contíguos and 5428 singletos, the former showing an average of 1200 bp. These 766 agrupamentos contíguos were compared with more than 5,000 E. grandis ESTs from mature leaf tissue and 6,000 E. urophylla ESTs from xylem. From the 766 agrupamentos contíguos we found 44 that showed high similarity to some ESTs. The coding portion of the sequences accounted for around 2% of the total sequences. It is important to highlight that by this approach it was possible to identify íntrons and éxons, beside core promoter regions, which can¿t be identified in the ESTs. Other 166 possible genes were identified among the genomic sequences by using blastx-nr in NCBI. We also identified putative genes responsible for 16 tRNAs using the tRNAscan-SE software. These sequences are being used in the Genolyptus Project for the development of novel randomly distributed microsatellites markers, for the identification of promoter regions and will be used to assist in the development of overgo-probes to be applied in the anchoring of the genetic map to the physical ma / Mestrado / Genetica de Microorganismos / Mestre em Genética e Biologia Molecular
2

Subtipagem do virus da imunodeficiencia humana tipo I (HIV-1) em crianças infectadas via perinatal

Molina, Rosana Mara 24 February 2005 (has links)
Orientador: Sandra Cecilia Botelho Costa / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Ciencias Medicas / Made available in DSpace on 2018-08-05T06:07:32Z (GMT). No. of bitstreams: 1 Molina_RosanaMara_D.pdf: 6324359 bytes, checksum: e228946d61b59894926210942eabbc1c (MD5) Previous issue date: 2005 / Resumo: A infecção pelo HIV-1 em mulheres, tem aumentado nesses últimos anos, neste caso, torna-se importante o diagnóstico precoce do HIV-1 nas crianças nascidas de mães contaminadas. Para detectar o HIV-1 nessa população pediátrica, a ¿Nested-PCR¿ está sendo amplamente utilizada. O genoma do HIV-1 é variável e atualmente, há vários métodos para se detectar essas variações, sendo que o sequenciamento direto de fragmentos genéticos do HIV-1 é considerado padrão ouro para determinação dos subtipos do HIV-1. No presente trabalho foi incluído 58 amostras de crianças HIV-1 positivas (via perinatal), sendo que em 20 o diagnóstico foi obtido pela ¿Nested-PCR¿ para diagnóstico do HIV-1 (primers JA4 ¿ JA7, JA9 ¿ JA12, JÁ13 ¿ JA16 e JA17 ¿ JA20, com produto de 131, 341, 172 2 129 pb respectivamente, referentes aos genes gag, env ¿ 2 regiões e pol) antes da realização da genotipagem viral; as demais amostras (38) já eram crianças previamente diagnosticadas. As 58 amostras foram submetidas a ¿Nested-PCR¿ de região do gen env para posterior sequenciamento viral, com a utilização dos primers EN 70 - EN 85 e EN 80 - EN 95, com produto de amplificação de 682 pb. Posteriormente foi realizada a purificação do produto da PCR e o sequenciamento direto em seqüenciador automático MegaBace 1000R. Das 58 amostras analisadas, foi possível um sequenciamento e conseqüente subtipagem viral em 56. Dessas, 47 (83,93 %) foram portadoras do subtipo B e 9 (16,07 %) do subtipo F (F1) do HIV-1. Os resultados obtidos confirmam a predominância do subtipo B, seguido pelo F no Brasil / Abstract: The HIV-1 infection in women has been increased these recent years, this way the early diagnosis of HIV-1 infected children born to contaminated mothers becomes very important. The ¿Nested-PCR¿ has been widely utilized in order to detect the HIV-1 in this pediatric population. The HIV-1 genome is variable, and nowadays, there are several methods to detect these variations and furthermore the direct sequencing of the HIV-1 genetic fragments is considered gold pattern for the determination of the HIV-1 subtypes. In the present study 58 samples from positive HIV-1 children (perinatal via) were included, seeing that the diagnosis in 20 of them was obtained by the ¿Nested-PCR¿ to the HIV-1 diagnosis (primers JA4 ¿ JA7, JA9 ¿ JA12, JÁ13 ¿ JA16 and JA17 ¿ JA20, with product of 131, 341, 172 2 129 pb respectively relating to genes gag, env ¿ 2 regions e pol) before the performance of the viral genotyping; the rest of the samples (38) were children previously diagnosed. The 58 samples were submitted to the ¿Nested-PCR¿ of the region of the env gen to posterior viral sequencing with the utilization of the primers EN 70 - EN 85 and EN 80 - EN 95, with the amplification product of 682 bp. Afterwards the purification of the PCR was carried out and the direct sequencing in a MegaBace 1000R automatic sequencer. From the 58 samples analyzed it was possible a sequencing and posterior viral subtyping in 56. From those ones, 47 (83,92 %) were HIV-1 subtype B infected and 9 (16,07 %) subtype F infected (F1). The results obtained assure the predominance of subtype B, followed by subtype F in Brazil / Doutorado / Ciencias Basicas / Doutor em Clínica Médica
3

Um algoritmo quase-linear para arvores PQR e um esquema para clustering de sequencias expressas de cana-de-açucar

Telles, Guilherme Pimentel, 1972- 12 December 2002 (has links)
Orientador : João Meidanis / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-03T14:23:48Z (GMT). No. of bitstreams: 1 Telles_GuilhermePimentel_D.pdf: 2708887 bytes, checksum: b728e7b5eaa59e830b3ce288b3c90dd6 (MD5) Previous issue date: 2003 / Resumo: Nesta tese apresentamos um algoritmo quase-linear para construir árvores PQR e o esquema para clustering de seqüências expressas que foi usado no projeto SUCEST (Sugarcane EST project).Uma árvore PQR é uma estrutura de dados capaz de resolver o problema dos uns consecutivos e outros problemas, como mapeamento físico de DNA, reconhecimento de grafos intervalo, otimização de circuitos lógicos e recuperação de dados. As árvores PQR são uma generalização das árvores PQ de Booth e Lueker e estão fundamentadas em propriedades algébricas sólidas. O algoritmo que apresentamos nesta tese se baseia nessas propriedades e é formado por um conjunto pequeno de padrões que modificam a árvore. Nosso algoritmo é mais eficiente que o algoritmo quadrático proposto originalmente por Meidanis e Munuera ao definir as árvores PQR e, embora não seja linear como o algoritmo para construir árvores PQ, acreditamos que ele contribui em direção a uma solução definitiva para o problema dos uns consecutivos. Clustering é o problema de categorização de um conjunto de objetos quando nem o número nem a composição das categorias é conhecido antecipadamente. Seqüências expressas ou ESTs (expressed sequence tags) são amostras de genes ativos extraídas das células de um organismo. Em um projeto genoma EST são obtidas milhares dessas seqüências que serão usadas como fonte para investigações por cientistas interessados nos processos celulares do organismo. O clustering de seqüências expressas é necessário para avaliar e reduzir a redundância do conjunto de ESTs. Nesta tese apresentamos o esquema de clustering usado no projeto da cana-de-açúcar, que produziu aproximadamente 300.000 ESTs. O esquema que apresentamos substituiu um esquema pré-existente e se caracteriza por uma limpeza prévia intensiva dos ESTs e pelo uso de um montador de genomas para agrupá-los. Acreditamos que este esquema possa ser utilizado em outros projetos do gênero / Abstract: In this thesis we introduce an almost-linear algorithm for building PQR trees and the method for expressed sequence tags clustering used in the SUCEST project (Sugarcane EST Project). A PQR tree is a structure that can be used to solve many problems, as the consecutive ones problem, DNA physical mapping, interval graphs recognition and data retrieval. PQR trees are a generalization of Booth and Lueker's PQ trees, and are founded on solid algebraic properties. The algorithm we present in this work is based on such properties and is composed by a small set of well-organized patterns. Our algorithm is more efficient than the quadratic one proposed by Meidanis and Munuera, who defined the PQR trees, and, although not linear as the algorithm for PQ trees construction, we believe that it contributes for a definite solution for the consecutive ones problem. Clustering is the problem of categorizing a set of objects when neither the number of categories nor the composition of the categories is known. Expressed sequence tags (ESTs) are samples from active genes extracted from cells of an organism. In an EST project, thousands of ESTs are produced and used as a source for research. Clustering ESTs is necessary to reduce the redundancy in the set of sequences. In this thesis we introduce the method used in the Sugarcane EST Project, that produced almost 300,000 sequences. The method we introduce in this work replaced another one that had problems. Our scheme include an intensive trimming of the ESTs and the use of a genome assembler for the whole set of sequences. We believe that our scheme may be used in other EST projects / Doutorado / Doutor em Ciência da Computação
4

Análise do complexo gênico FANCD2/FANCI em mulheres brasileiras com câncer de mama herediitário / Analysis of the gene complex FANCD2/FANCI in Brazilian womem with hereditary breast cancer

Amstalden, Lucila Gobby 17 August 2018 (has links)
Orientador: Carmen Silvia Bertuzzo / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Ciências Médicas / Made available in DSpace on 2018-08-17T14:33:51Z (GMT). No. of bitstreams: 1 Amstalden_LucilaGobby_D.pdf: 2331693 bytes, checksum: b9984b5e8cbc2821d446ee5281ae4200 (MD5) Previous issue date: 2011 / Resumo: O câncer de mama (CM) é o tipo de câncer que mais comumente ocorre entre mulheres, com a estimativa de 49.240 novos casos diagnosticados em 2010 no Brasil. O CM apresenta fatores de risco conhecidos como idade, fatores sócio-econômicos, etnia, exposição excessiva a hormônios, radiação, dieta, exercícios físicos, história ginecológica e história familiar. Além dos fatores de risco, o CM apresenta fatores de prognóstico mensurados no momento do diagnóstico e que servem como preditor da sobrevida do paciente. Existem pelo menos 20 subtipos de CM distintos morfologicamente. O complexo formado pelos genes FANCD2 e FANCI tem a função chave de co-localizar o sítio nuclear de reparo para proteínas que diretamente estão relacionadas à recombinação homóloga como BRCA1, juntamente com FANCJ, RAD51, BRCA2/FANCD1 com FANCN. A descoberta de que o gene BRCA2 é, na verdade, FANCD1 atraiu pesquisadores para um novo alvo na corrida para a compreensão da história natural da doença, informação esta que permitirá avaliar a hipótese dos genes de reparo de DNA na susceptibilidade ou refratariedade para carcinogênese. O objetivo do atual estudo foi analisar as principais alterações nos genes FANCD2 e FANCI utilizando PCR e digestão enzimática e, paralelamente, rastreamento dos éxons dos genes por meio do sequenciamento automático. A casuística foi formada por 137 mulheres com CM hereditário. Foram encontradas oito alterações em 33 indivíduos e cinco variantes exônicas não relatadas, novas. Por meio de análise estatística, houve a correlação entre indivíduos mutados e dados clínicos. Esse estudo foi de grande valia para a detecção de alterações que podem funcionar como estopim para o desenvolvimento do câncer em indivíduos com CM com histórico familiar sem mutações em genes de alta suscetibilidade, como também servir para caracterizar um tipo histológico distinto auxiliando na terapêutica futura / Abstract: Breast Cancer (BC) is the cancer type more commonly occurs among women with estimative of 49.240 new cases in 2010. The BC presents risk factors as: age, social-economic factors, ethnicity, hormone exposure, radiation, diet, physical exercises and familiar history. Besides the risk factors BC has prognosis factors measured in diagnostic. There's, at least, 20 subtypes of BC morphologically different. Corcerning molecular epidemiology, the BC is associated to many genes and in mutations in various genes as BRCA1 e 2, p53, PTEN. The FANCD2/FANCI complex have a key function of co-localize motif of DNA repair to proteins that directly act on homologue recombination as BRCA1 with FANCJ, RAD51, BRCA2/FANCD1 with FANCN. The discovery the BRCA2 is, actually, FANCD1 gene has leaded researchers to the new target in knowledge of natural history of disease.The aim of this study was to analyse alterations in FANCD2 and FANCI genes through PCR followed enzimatic restriction. At same time, was performed the screening of the genes exons. The casuistic was constituted from 137 women with hereditary breast cancer. We encountered eight alterations in 25 individuals and 5 exonic variants not reported. This study was very important with the purpose to detect alterations can be responsible by the cancer evolution in BC patients without mutations in high susceptibility genes and to server to characterize a distinct histological types to future therapeutic / Doutorado / Ciencias Biomedicas / Doutor em Ciências Médicas
5

Aplicações de modelos logisticos regressivos em biologia molecular / Logistic regression models with applications in molecular biology

Grandin, Lori Cristina 03 October 2006 (has links)
Orientador: Hildete Prisco Pinheiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-06T00:58:27Z (GMT). No. of bitstreams: 1 Grandin_LoriCristina_M.pdf: 676646 bytes, checksum: 180775a0f53ffb688d7c1603339ff1b8 (MD5) Previous issue date: 2006 / Resumo: O avanço do sequenciamento dos genes tem incentivado o desenvolvimento de novas técnicas estatísticas para analisar dados genéticos. Nesse trabalho, os modelos logísticos regressivos, introduzidos por Bonney (1986), são apresentados primeiramente no contexto de análise de dados de família e posteriormente esses modelos são utilizados para analisar freqüências de códons em seqüências de DNA mitocondrial. Considerar independência entre os nucleotídeos no códon pode ser uma suposição muito forte, ou seja, biologicamente irreal. Por isso, várias estruturas de dependência são apresentadas para analisar as freqüências dos códons. Por exemplo, uma estrutura markoviana de primeira ordem pode ser adequada para explicar a dependência das bases no códon. A função de log-verossimilhança é avaliada e várias comparações são feitas para analisar qual o modelo mais parcimonioso. Aplicações desses modelos são feitas utilizando-se dados reais de seqüências do gene NADH4 do genoma mitocondrial humano / Abstract: The advance of gene sequencing has stimulated the development of new statistical techniques to analyze genetic data. In this work the logistic regressive models, introduced by Bonney (1986), are presented first in the context of analysis of familial data and then they are used to analyze codon frequencies in mitochondrial DNA sequences. The assumption of independence among nucleotide frequencies in a codon can be a very strong one, or biologically unreal. In view of this, several structures of dependence are presented to analyze the codon frequencies. For example, a first order Markovian structure can be appropriate to explain the dependence of the base frequencies in the codon. The log-likelihood function is evaluated and several comparisons are made to analyze which is the most parcimonious model. Applications of these models are made using real data of NADH4 gene sequences of the human mitochondrial genome / Mestrado / Bioestatistica / Mestre em Estatística
6

Diagnostico e variaveis associadas a ocorrencia de candidemia em pacientes internados no Hospital de Clinicas da UNICAMP / Diagnosis and variables associated with the development of candidemia in hight risk patients hospitalized of the University Hospital UNICAMP

Oliveira, Maria Sileuda Moreira de 15 September 2005 (has links)
Orientador: Maria Luiza Moretti / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Biologia / Made available in DSpace on 2018-08-05T08:46:02Z (GMT). No. of bitstreams: 1 Oliveira_MariaSileudaMoreirade_D.pdf: 898114 bytes, checksum: f78729283b9082f15ea5bb30829a113b (MD5) Previous issue date: 2005 / Resumo: O diagnóstico da candidemia é importante para a imediata iniciação da terapia antifúngica. Duzentos e vinte e cinco pacientes com pelo menos 15 dias de internação em unidades de alto risco do Hospital de Clínicas da UNICAMP foram acompanhados prospectivamente durante o período de novembro de 2000 a dezembro de 2002. Hemoculturas positivas para Candida foram consideradas como padrão ouro no diagnóstico da candidemia. Foi realizado o teste da Reação de Polimerização em Cadeia ¿ PCR, utilizando-se o sangue total dos pacientes e os resultados obtidos com o teste de PCR foram comparados com os resultados do teste de hemocultura, realizada rotineiramente na detecção da candidemia através do sistema automatizado BactAlert®. O DNA foi extraído e amplificado com o uso do par de iniciadores ITS4 e ITS5 e os produtos de PCR foram seqüenciados para a identificação das espécies de Candida. As variáveis associadas com o desenvolvimento da candidemia diagnosticada por hemocultura também foram avaliadas nos pacientes. A taxa de mortalidade geral do estudo foi de 26,2% e a mortalidade entre os pacientes com candidemia e sem candidemia foi de 41,9% e 22,5% respectivamente (p=0,009). A sensibilidade e a especificidade do teste de PCR foi de 72,1% e 91,2% respectivamente. Os valores preditivos positivos e negativos foram de 65,9% e 93,2% respectivamente. A regressão logística da análise multivariada mostrou que o uso de nutrição parenteral (p<0,0001), sonda vesical de demora (p=0,0177), quimioterapia (p=0,0246) e corticóides (p=0,0283) foram as variá veis significativas associadas com o desenvolvimento da candidemia. A técnica de PCR seguida do sequenciamento do DNA foi uma ferramenta útil no diagnóstico da candidemia / Abstract: The diagnosis of candidemia is important for prompt initiation of antifungal therapy. Two hundred and twenty-five patients with high risk for candidemia who had blood cultures drawn and were hospitalized more than 15 days were prospectively followed-up in a two-year period. Whole-blood cultures by automated BactAlert® system and PCR were used to detect candidemia in all patients hospitalized for more than 15 days in high-risk areas. DNA was extracted and amplified using ITS5 and ITS4 base pair primers and the PCR products were sequenced for identification of Candida spp. Positive blood culture for Candida was considered the gold standard for candidemia diagnosis. Variables associated with the development of candidemia diagnosed by positive blood culture were also evaluated in the patients. The overall mortality of the patients was 26.1% and the mortality rate in candidemic and non-candidemic patients was 41.9% and 22.5%, respectively (p=0.009). PCR sensitivity and specificity were 72.1% and 91.2%, respectively. Positive and negative predictive values were 65.9% and 93.2%, respectively. The logistic regression of the multivariate analysis showed that parenteral nutrition (p<.0001); urinary underlying catheter (p=0.0177), chemotherapy (p=0.0246) and steroids (p=0.0283) were significant variables associated with the development of candidemia. The PCR technique followed by DNA sequencing was a helpful tool, in candidemia diagnosis / Doutorado / Microbiologia / Doutor em Genetica e Biologia Molecular
7

Uma abordagem para detecção e remoção de artefatos em sequencias ESTs / An approach to detect and remove artifacts in EST sequences

Baudet, Christian 12 January 2006 (has links)
Orientador: Zanoni Dias / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-08T07:27:54Z (GMT). No. of bitstreams: 1 Baudet_Christian_M.pdf: 13612079 bytes, checksum: 648d18039dc13dcd5a2f422cc7863666 (MD5) Previous issue date: 2006 / Resumo: O sequenciamento de ESTs (Expressed Sequence Tag) [2] e uma tecnica que trabalha com bibliotecas de cDNAs tendo como objetivo a obtençao de uma boa aproximaçao para o ?ndice genico, que e a listagem de genes existentes no genoma do organismo estudado. Antes da serem analisadas, as sequencias obtidas do sequenciamento dos ESTs devem ser processadas para eliminaçao de artefatos. Artefatos sao trechos que nao pertencem ao organismo ou que possuem baixa qualidade ou baixa complexidade. Trechos de vetores, adaptadores e caudas poli-A podem ser citados como exemplos de artefatos. A eliminaçao dos artefatos deve ser feita para que a an'alise das sequencias produzidas no projeto nao seja prejudicada por estes ?ru?dos?. Por exemplo, artefatos presentes em sequencias freq¨uentemente produzem erros em processos de clusterizaçao, pois eles podem determinar se sequencias serao unidas em um mesmo cluster ou separadas em clusters diferentes. Observando a importancia da realizaçao de um bom processo de limpeza das sequencias, o trabalho desenvolvido nesta dissertaçao teve como principal objetivo a obtençao de um conjunto eficiente de procedimentos de detecçao e remoçao de artefatos. Este conjunto foi produzido a partir de uma nova estrategia de deteçao de artefatos. Normalmente, cada projeto de seq¨uenciamento possui seu proprio conjunto de procedimentos dividido em varias etapas. Estas etapas sao, em geral, ligadas entre si e o resultado de uma pode influenciar o resultado de outra. A nossa estrategia visa a realizaçao destas etapas de forma totalmente independente. Alem da avaliaçao desta nova estrategia, o trabalho tambem realizou um estudo mais detalhado sobre dois tipos de artefatos: baixa qualidade e derrapagem. Para cada um deles, algoritmos foram propostos e validados atraves de testes com conjuntos de seq¨u?encias produzidas em projetos reais de sequenciamento. O conjunto final de procedimentos, baseado nos estudos desenvolvidos durante a escrita deste texto, foi testado com as sequencias do projeto SUCEST [100, 103, 113] e mostrou bons resultados. O clustering produzido com as sequencias processadas por nossos metodos apresentou melhores consistencia interna e externa e menores taxas de redundancia quando comparado ao clustering original do projeto / Abstract: Expressed Sequence Tag (EST) Sequencing [2] is one technique that works with cDNA libraries. It aims to achieve a good approximation for the gene index of an organism. Before analyzing the sequences obtained by sequencing ESTs, they must be processed for artifact removal. An artifact is a sequence that does not belong to the studied organism or that has low quality or low complexity. As example of artifacts, we have adapters, poly- A tails, vectors, etc. Artifacts removal must be performed because their presence can produce ?noises? in the sequencing project data analysis. For example, artifact can join two sequences in a same cluster inappropriately or separate them in two different clusters when they should be put together. Motivated by the sequence cleaning process importance, our main objective in this work was to develop an efficient set of procedures to detect and to remove sequence artifacts. Usually, each EST sequencing project has its own procedure set divided in many steps. These steps are, in general, linked and the result of one given step might influence the result of the next one. Our strategy was to perform each step independently assuring that any execution order of those steps would lead to the same result. Additionally to the new strategy evaluation, this work also studied detailedly two type of artifacts: low quality and slippage. For each one, algorithms were proposed and validated through tests with sequences of real sequencing projects. The final set of procedure, developed in this work, was evaluated using the sequences of the SUCEST project [100, 103, 113] and produced good results. The resulting clustering from our method has better external and internal consistency and lower redundacy rate than those produced by the SUCEST project clustering / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
8

Estratégia para investigação molecular de epilepsia com identificação de genes relacionados a formas de polimicrogiria = Strategy of molecular investigation on epilepsy with the identification of genes related to poymicrogyrias / Strategy of molecular investigation on epilepsy with the identification of genes related to poymicrogyrias

Tsuneda, Simone Sayuri, 1974- 21 August 2018 (has links)
Orientador: Iscia Teresinha Lopes Cendes, Fábio Rossi Torres / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Ciências Médicas / Made available in DSpace on 2018-08-21T06:16:28Z (GMT). No. of bitstreams: 1 Tsuneda_SimoneSayuri_D.pdf: 5548129 bytes, checksum: b0213ba3907f298ca16dddb2df837b62 (MD5) Previous issue date: 2012 / Resumo: A polimicrogiria (PMG) é uma malformação do córtex cerebral causada por falhas no seu desenvolvimento, caracterizando-se por um número excessivo de pequenos giros e laminação anormal, dando à superfície cortical uma aparência irregular e grosseira. A gravidade de suas manifestações clínicas se relaciona diretamente com a extensão da malformação e das regiões cerebrais afetadas, sendo que a presença de lesões bilaterais ou unilaterais extensas indica um pior prognóstico. Uma das síndromes de polimicrogiria mais frequentes e, consequentemente, mais bem descritas clinicamente, é a polimicrogiria perisylviana bilateral (PPB). Essa forma de polimicrogiria atinge a região que tange a fenda Sylviana, podendo apresentar-se tanto unilateralmente quanto em ambos os hemisférios. O padrão de herança da PPB foi descrito inicialmente como ligada ao cromossomo X por Borgatti et al. em 1999. Já em 2000, Guerreiro et al. confirmaram o padrão de herança consistente com herança ligada ao cromossomo X, mas ainda nenhum gene havia sido identificado como responsável pelo distúrbio. Nosso grupo recentemente mapeou uma nova região candidata para a PPB em Xq27.1-q27.3, e esta tese se propôs a avaliar essa região através da técnica de sequenciamento em larga escala aliada à tecnologia de captura para o cromossomo X. Os resultados apontaram como potenciais patogênicos os genes MAGEC1, UBE2NL, além da região do gene SPANXC, todos localizados na região candidata, mas uma avaliação mais detalhada levantou a hipótese de uma relação complexa entre as alterações encontradas no gene MAGEC1 e o quadro clínico dos pacientes. Além da análise da região Xq27.1-q27.3, considerando o grande número de genes de microtúbulo que tem sido relacionado a malformações do córtex cerebral, esse trabalho também avaliou pacientes esporádicos e famílias com histórico de PPB realizando triagem de mutações nas regiões codificantes dos genes AFF2, SLITRK2 e SLITRK4, localizados na região candidata, nos genes de microtúbulo TUBA1A, TUBB2B e TUBA8, além dos genes SRPX2 e WDR62, presentes em trabalhos na literatura de malformações corticais. A triagem foi realizada utilizando as técnicas de DHPLC e de sequenciamento utilizando a técnica de Sanger por eletroforese capilar. Foi encontrada uma alteração potencialmente patogênica no gene AFF2. As alterações identificadas neste estudo que resultam em troca de aminoácidos foram avaliadas utilizando as ferramentas in silico MutPred, SNPs&GO, Polyphen 2, Panther e SIFT, de forma a fornecer mais informações a respeito de seu potencial patogênico. Além disso, as variantes inéditas identificadas nesse trabalho foram estudadas em uma amostra de indivíduos normais (grupo controle). Com esses dados foi possível sugerir que algumas dessas variantes encontradas possuem potencial patogênico que deve ser futuramente investigado através de estudos funcionais / Abstract: Polimicrogyria (PMG) is a cortical malformation caused by failures during the brain cortex development process and is characterized by an excessive number of small gyri, resulting in an irregular cortical surface. The severity of its clinical manifestations is directly related to the extension of the tissue abnormalities. Bilateral Perisylvian Polimicrogyria (BPP) is the most comum and, consequently, a very well described syndrome that affects the cortex surrounding the Sylvian fissures in both hemispheres. The genetic pattern for BPP was initially described by Borgatti et al. as an X-linked pattern, confirmed by Guerreiro et al. in 2000, but with no specific gene identified. We have recently described a candidate site for BPP at the Xq27.1-27.3 region and, in this project, we proposed to evaluate this site through next generation sequencing technology combined with capture technology. Our results suggest that MAGEC1 and UBE2NL genes, or the SPANXC gene area might be related to the pathogeny in this case, however a further analysis brought up the hypothesis of a complex relation between the MAGEC1 mutations and the clinical manifestations in each different patient. Considering recurrent description of relations between microtubule genes and cortex malformations, we also performed the evaluation of exon regions of eight selected genes from sporadic patients and BPP families through DHPLC and sequencing. The analysis focused on AFF2, SLITRK2 and SLITRK4 genes, located at the identified site, microtubule genes TUBA1A, TUBB2B and TUBA8, and SRPX2 and WDR62 genes, also related to cortical malformations. As a result from this screening, we identified a potentially pathogenic mutation in gene AFF2. All non-synonymous SNPs were evaluated using the in silico tools MutPred, SNPs&GO, Polyphen 2, Panther and SIFT, providing further insights for their analysis. A control group of individuals was analyzed for the presence of the non-described SNPs. These data suggest a pathogenic potential for these genetic alterations that must be investigated through function studies / Doutorado / Fisiopatologia Médica / Doutora em Ciências
9

Modelo de sistema de comunicações digital para o mecanismo de importação de proteinas mitocondriais atraves de codigos corretores de erros / Digital communication system model for mitochondrial protein import by use of error-correcting codes

Rocha, Andrea Santos Leite da 15 August 2018 (has links)
Orientadores: Reginaldo Palazzo Junior, Marcio de Castro Silva Filho / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-15T16:43:49Z (GMT). No. of bitstreams: 1 Rocha_AndreaSantosLeiteda_D.pdf: 5117477 bytes, checksum: e8f0c742c67382cad01387d3e62f6705 (MD5) Previous issue date: 2010 / Resumo: Um dos desafios em biologia matemática e mostrar a existência de qualquer forma de códigos corretores de erros na estrutura do DNA. Usando os conceitos da teoria de comunicação, propomos um modelo para o sistema de codificacao e decodificaçao do mecanismo de importaçao de proteínas mitocondriais similar a um sistema de comunicacoes digital. Este modelo consiste de um mapeador responsável por transformar os nucleotídeos (A, C, G, T) no alfabeto (0,1, 2, 3) usado pelo codigo sobre a estrutura de anel; um codificador (cádigo BCH); e um modulador (codigo genetico, tRNA e rRNA). O processo de decodificaçao baseia-se em uma analogia entre o processo de decodificacão do algoritmo Berlekamp-Massey para aneis e o complexo TOM (complexo ancorado na membrana externa da mitocondria responsavel por auxiliar na importacçãao das proteínas precursoras). Neste processo temos um demodulador (proteínas Tom 70 e Tom20), um decodificador (o complexo GIP - poro geral de inserção) e o receptor (subcompartimento mitocondrial). Neste trabalho mostramos que as sequencias de DNA (sequencias de direcionamento) são identificadas como palavras-codigo de um código G-linear sobre a extensão de um anel de Galois. Além disso, essas sequências de DNA e suas fitas complementares estão relacionadas matematicamente através dos polinómios primitivos e seus polinómios recíprocos, respectivamente. Um estudo filogenético sugere que a proteína malato desidrogenase da Arabidopsis thaliana encontrada no banco de dados NCBI e uma sequência derivada da proteína malato desidrogenase reproduzida pelo cídigo corretor de erros. Este modelo também reproduz com notível precisão os parâmetros cinéticos baseados em substituicões de aminoíacidos em oligopeptídeos sintéticos. Apresentamos, pela primeira vez, a existência de códigos corretores de erros associados com as sequências de DNA, os quais sugerem fortemente a existência de códigos concatenados no genoma. Os resultados apresentados neste trabalho contribuem para o desenvolvimento de um procedimento sistemático que podera ser empregado em analises de mutacães/polimorfismos com aplicações na engenharia geníetica. / Abstract: One of the puzzling problems in mathematical biology is to show the existence of any form of error-correcting code in the DNA structure. Using information theory considerations we propose a model for the biological coding system similar to that of a digital communication system. This model consists of a mapper (transformations from the set of nucleotides either to the set (0, 1, 2, 3) ring; an encoder (BCH code); and a modulator (genetic code, tRNA and rRNA). The decoding process is based on the Modified Berlekamp-Massey algothm in an analogy with the TOM complex (translocase of the mitochondrial outer membrane). In this process we have a demodulator (Tom 70 and Tom 20 proteins), a decoder (GIP complex) and the receiver (mitochondrion). In this work we show that DNA sequences (targeting sequences) are identified as codewords of a G-linear code over Galois ring extensions. In addition, these DNA sequences and their complementary strands are mathematically related to the primitive polynomials and their reciprocal polynomials, respectively. A phylogenetic study suggest that the MDH protein, Arabidopsis thaliana, found in the NCBI databank is a derived sequence of the MDH protein reproduced by the error correcting code. This model also reproduces with remarkable accuracy kinetic parameters based on amino acid substitutions on synthetic oligopeptides. We show, for the first time, the existence of error-correcting codes associated with DNA sequences, which strongly infer on the existence of nested codes within the genome. The results presented in this work contribute to the development of a systematic procedure which may be employed in the mutations/polymorphisms analysis with applications in genetic engineering. / Doutorado / Telecomunicações e Telemática / Doutor em Engenharia Elétrica

Page generated in 0.0778 seconds