1 |
Identificação de regiões codificantes de proteína através da transformada modificada de Morlet / Identification of Protein Coding Regions through the Modified Morlet TransformChalco, Jesus Pascual Mena 19 October 2005 (has links)
Um tópico importante na análise de seqüências biológicas é a busca de genes, ou seja, a identificação de regiões codificantes de proteínas. Esta identificação permite a posterior procura de significado, descrição ou categorização biológica do organismo analisado. Atualmente, vários métodos combinam reconhecimento de padrões com conhecimento coletado de conjuntos de treinamento ou de comparações com banco de dados genômicos. Entretanto, a acurácia desses métodos está ainda longe do satisfatório. Novos métodos de processamento de seqüências de DNA e de identificação de genes podem ser criados através da busca por conteúdo (search-by-content). O padrão periódico de DNA em regiões codificantes de proteína, denominada periodicidade de três bases, vem sendo considerado uma propriedade dessas regiões. As técnicas de processamento digital de sinais fornecem uma base robusta para a identificação de regiões com periodicidade de três bases. Nesta dissertação, são apresentados um \\pipeline, os conceitos básicos da identificação genômica, e métodos de processamento digital de sinais utilizados para a identificação de regiões codificantes de proteínas. Introduzimos um novo método para a identificação dessas regiões, baseado na transformada proposta, denominada Transformada Modificada de Morlet. Apresentamos vários resultados experimentais obtidos a partir de seqüências de DNA sintéticas e reais. As principais contribuições do trabalho consistem no desenvolvimento de um pipeline para projetos genoma e na criação de um método de identificação de regiões codificantes onde a periodicidade de três bases seja latente. O método apresenta desempenho superior e vantagens importantes em comparação ao método tradicional baseado na transformada de Fourier de tempo reduzido. / An important topic in biological sequences analysis is gene finding, i.e. the identification of protein coding regions. This identification allows the posterior research for meaning, description or biological categorization of the analyzed organism. Currently, several methods combine pattern recognition with knowledge collected from training datasets or from comparison with genomic databases. Nonetheless, the accuracy of these methods is still far from satisfactory. New methods of DNA sequences processing and genes identification can be created through search-by-content such sequences. The periodic pattern of DNA in protein coding regions, called three-base periodicity, has been considered proper of coding regions. Digital signal processing techniques supply a strong basis for regions identification with three-base periodicity. In this work, we present a bioinformatics pipeline, basic concepts of the genomic identification and digital signal processing methods used for protein coding regions identification. We introduce a new method for identification of these regions, based on a newly proposed transform, called Modified Morlet Transform. We present some obtained experimental results from synthetic and real DNA sequences. The main contributions consist of the bioinformatics pipeline development for genoma projects and the creation of a method for protein coding regions identification where the three-base periodicity is latent. The method presents superior performance and important advantages in comparison to traditional method based on the short time Fourier transform.
|
2 |
Identificação de regiões codificantes de proteína através da transformada modificada de Morlet / Identification of Protein Coding Regions through the Modified Morlet TransformJesus Pascual Mena Chalco 19 October 2005 (has links)
Um tópico importante na análise de seqüências biológicas é a busca de genes, ou seja, a identificação de regiões codificantes de proteínas. Esta identificação permite a posterior procura de significado, descrição ou categorização biológica do organismo analisado. Atualmente, vários métodos combinam reconhecimento de padrões com conhecimento coletado de conjuntos de treinamento ou de comparações com banco de dados genômicos. Entretanto, a acurácia desses métodos está ainda longe do satisfatório. Novos métodos de processamento de seqüências de DNA e de identificação de genes podem ser criados através da busca por conteúdo (search-by-content). O padrão periódico de DNA em regiões codificantes de proteína, denominada periodicidade de três bases, vem sendo considerado uma propriedade dessas regiões. As técnicas de processamento digital de sinais fornecem uma base robusta para a identificação de regiões com periodicidade de três bases. Nesta dissertação, são apresentados um \\pipeline, os conceitos básicos da identificação genômica, e métodos de processamento digital de sinais utilizados para a identificação de regiões codificantes de proteínas. Introduzimos um novo método para a identificação dessas regiões, baseado na transformada proposta, denominada Transformada Modificada de Morlet. Apresentamos vários resultados experimentais obtidos a partir de seqüências de DNA sintéticas e reais. As principais contribuições do trabalho consistem no desenvolvimento de um pipeline para projetos genoma e na criação de um método de identificação de regiões codificantes onde a periodicidade de três bases seja latente. O método apresenta desempenho superior e vantagens importantes em comparação ao método tradicional baseado na transformada de Fourier de tempo reduzido. / An important topic in biological sequences analysis is gene finding, i.e. the identification of protein coding regions. This identification allows the posterior research for meaning, description or biological categorization of the analyzed organism. Currently, several methods combine pattern recognition with knowledge collected from training datasets or from comparison with genomic databases. Nonetheless, the accuracy of these methods is still far from satisfactory. New methods of DNA sequences processing and genes identification can be created through search-by-content such sequences. The periodic pattern of DNA in protein coding regions, called three-base periodicity, has been considered proper of coding regions. Digital signal processing techniques supply a strong basis for regions identification with three-base periodicity. In this work, we present a bioinformatics pipeline, basic concepts of the genomic identification and digital signal processing methods used for protein coding regions identification. We introduce a new method for identification of these regions, based on a newly proposed transform, called Modified Morlet Transform. We present some obtained experimental results from synthetic and real DNA sequences. The main contributions consist of the bioinformatics pipeline development for genoma projects and the creation of a method for protein coding regions identification where the three-base periodicity is latent. The method presents superior performance and important advantages in comparison to traditional method based on the short time Fourier transform.
|
3 |
Identificação e análise estrutural e funcional de genes candidatos do cromossomo 4 de ratos SHR que possam influenciar a hipertensão essencial / Identification and structural and functional analysis of candidate genes on chromosome 4 in SHR that may influence essential hypertensionTeixeira, Samantha Kuwada 10 December 2013 (has links)
O emprego de \"Total Genome Scan\" em modelos genéticos de doenças complexas tem sido fundamental para seleção de regiões cromossômicas envolvidas com traços complexos. Em nosso laboratório, identificamos cinco regiões cromossômicas associadas ao traço quantitativo pressão arterial (BP-QTL) que explicam 43% da variação da pressão arterial numa progênie obtida a partir de animais espontaneamente hipertensos (SHR) e \"Brown Norway\" (BN). Os BP-QTLs foram, então, validados por desenvolvimento de linhagens congênicas, incluindo uma para o cromossomo 4 (SHR.BN4) cuja substituição das sequências SHR pelo do animal BN levou a redução da pressão arterial sistólica basal (~14 mm Hg). O objetivo deste trabalho foi identificar as variantes genéticas candidatas neste intervalo cromossômico com base em diferenças no padrão de expressão gênica e na presença de alterações genéticas não sinônimas \"missense\" ou em regiões regulatórias conservadas que possam estar envolvidas na gênese da hipertensão. Identificamos 533 genes com expressão renal, dentre os 682 do intervalo, sendo que 28 apresentaram padrão de expressão diferente entre amostras de animais adultos (congênico vs. SHR) e seis apresentaram alterações não sinônimas \"missense\". É importante salientar que dos genes diferentemente expressos, encontramos alterações estruturais em regiões conservadas com potencial de participar na regulação em 11. Em conjunto, utilizamos uma plataforma integrada para selecionar 34 genes candidatos no cromossomo 4, dos quais 17 genes serão priorizados, para ser investigados quanto sua contribuição na hipertensão arterial do SHR e na hipertensão primária humana / Total genome scan in genetic models of complex diseases have been instrumental to select candidate genes underlying complex traits. We previously mapped 5 blood pressure related quantitative trait loci (BP-QTLs) that explain about 43% of the BP variance in a progeny derived from Spontaneous Hypertensive Rat (SHR) and Brown Norway (BN) rats. The BP-QTLs were then validated by derivation of congenic strains, including one for chromosome 4 (SHR.BN4) in which a segment from BN replaced the SHR sequences reducing basal systolic BP (~14 mm Hg). The aim of this project is to identify the candidate genetic variants within the chromosome interval based on differences in renal gene expression patterns and structural changes in both non-synonymous missense or within adjacent regulatory sequences that may contribute to hypertension. We identified 533 genes with renal expression, out of 682 in the interval, in which 28 presented differences in expression pattern in adult samples (congenic vs. SHR) and six presented non-synonymous missense alterations. In addition, 11 out of 28 differentially expressed genes showed structural alterations in adjacent conserved regions that potentially contribute to gene regulation. Taken together, using the proposed combination of strategies, we selected 34 hypertensive candidate genes in chromosome 4, in which 17 will be prioritized, to be further explored to assess their contribution to hypertension in the SHR and to essential hypertension in humans
|
4 |
Identificação e análise estrutural e funcional de genes candidatos do cromossomo 4 de ratos SHR que possam influenciar a hipertensão essencial / Identification and structural and functional analysis of candidate genes on chromosome 4 in SHR that may influence essential hypertensionSamantha Kuwada Teixeira 10 December 2013 (has links)
O emprego de \"Total Genome Scan\" em modelos genéticos de doenças complexas tem sido fundamental para seleção de regiões cromossômicas envolvidas com traços complexos. Em nosso laboratório, identificamos cinco regiões cromossômicas associadas ao traço quantitativo pressão arterial (BP-QTL) que explicam 43% da variação da pressão arterial numa progênie obtida a partir de animais espontaneamente hipertensos (SHR) e \"Brown Norway\" (BN). Os BP-QTLs foram, então, validados por desenvolvimento de linhagens congênicas, incluindo uma para o cromossomo 4 (SHR.BN4) cuja substituição das sequências SHR pelo do animal BN levou a redução da pressão arterial sistólica basal (~14 mm Hg). O objetivo deste trabalho foi identificar as variantes genéticas candidatas neste intervalo cromossômico com base em diferenças no padrão de expressão gênica e na presença de alterações genéticas não sinônimas \"missense\" ou em regiões regulatórias conservadas que possam estar envolvidas na gênese da hipertensão. Identificamos 533 genes com expressão renal, dentre os 682 do intervalo, sendo que 28 apresentaram padrão de expressão diferente entre amostras de animais adultos (congênico vs. SHR) e seis apresentaram alterações não sinônimas \"missense\". É importante salientar que dos genes diferentemente expressos, encontramos alterações estruturais em regiões conservadas com potencial de participar na regulação em 11. Em conjunto, utilizamos uma plataforma integrada para selecionar 34 genes candidatos no cromossomo 4, dos quais 17 genes serão priorizados, para ser investigados quanto sua contribuição na hipertensão arterial do SHR e na hipertensão primária humana / Total genome scan in genetic models of complex diseases have been instrumental to select candidate genes underlying complex traits. We previously mapped 5 blood pressure related quantitative trait loci (BP-QTLs) that explain about 43% of the BP variance in a progeny derived from Spontaneous Hypertensive Rat (SHR) and Brown Norway (BN) rats. The BP-QTLs were then validated by derivation of congenic strains, including one for chromosome 4 (SHR.BN4) in which a segment from BN replaced the SHR sequences reducing basal systolic BP (~14 mm Hg). The aim of this project is to identify the candidate genetic variants within the chromosome interval based on differences in renal gene expression patterns and structural changes in both non-synonymous missense or within adjacent regulatory sequences that may contribute to hypertension. We identified 533 genes with renal expression, out of 682 in the interval, in which 28 presented differences in expression pattern in adult samples (congenic vs. SHR) and six presented non-synonymous missense alterations. In addition, 11 out of 28 differentially expressed genes showed structural alterations in adjacent conserved regions that potentially contribute to gene regulation. Taken together, using the proposed combination of strategies, we selected 34 hypertensive candidate genes in chromosome 4, in which 17 will be prioritized, to be further explored to assess their contribution to hypertension in the SHR and to essential hypertension in humans
|
Page generated in 0.1428 seconds