• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 53
  • 4
  • Tagged with
  • 57
  • 23
  • 15
  • 11
  • 9
  • 9
  • 8
  • 8
  • 8
  • 7
  • 7
  • 7
  • 7
  • 7
  • 6
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Uma metodologia para determinação do organismo de origem de sequencias de DNA com aplicação em projetos EST

Piazza, João Paulo 07 May 2004 (has links)
Orientador: João Carlos Setubal / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-31T09:21:06Z (GMT). No. of bitstreams: 1 Piazza_JoaoPaulo_M.pdf: 1307969 bytes, checksum: 885944b1beb24b7a3979738e217bfb50 (MD5) Previous issue date: 2004 / Resumo: Este trabalho apresenta uma nova metodologia para a determinação computacional do organismo de origem de seqüência de DNA, implementada na forma de um programa chamado QUEST. O QUEST é baseado em dois princípios: a extração de informações intrínsecas a cada seqüência, chamadas de características, e a extração de diferentes tipos de características e sua combinação para se chegar a melhores resultados. São utilizados 7 diferentes programas como extratores de características, alguns desenvolvidos por terceiros (Glimmer e ESTScan) e outros desenvolvidos pelo autor. As características foram combinadas utilizando vários classificadores diferentes, variando desde uma soma simples até os baseados em vetores de suporte. O QUEST requer seqüências para treinamento. Em comparação com as abordagens baseadas em similaridade, as vantagens principais da QUEST estão no fornecimento de previsões para as taxas de erro e na capacidade de lidar com seqüências sem similaridades significativas em bancos de seqüência. O QUEST foi aplicado ao problema de determinar automaticamente contaminantes em projetos EST. São apresentados resultados de experimentos simulados e de um projeto EST real (o projeto EST de Schistosoma mansoni). Nos experimentos simulados foram atingidas taxas de falsos positivos mais falsos negativos de aproximadamente 10%. No projeto de S.mansoni o QUEST sugere que a contaminação em seqüências supostamente legítimas poderia ser de pelo menos 6%. No teste com S.mansoni, o QUEST foi 10 vezes mais rápido que o tempo necessário para executar o BLASTX em todas as seqüências testadas. O QUEST tem outras aplicações, incluindo a determinação do organismo de origem na nova abordagem genômica chamada de genômica ambiental (também chamada de metagenômica). / Abstract: This work presents a new methodology for computational ascertainment of organismal origin of DNA sequences, which we call QUEST. QUEST is based on two principles: that of extracting intrinsic information from each sequence, which are called features, and of extracting deferent kinds of features and combining them to achieve a better result. We use as feature extractors 7 deferent programs, some third-party (Glimmer and ESTScan) and others developed by the author. We combine features using many diferent standard classifers, ranging from simple sum to support vector machines. QUEST requires training sequences. In comparison to similarity-based approaches, QUEST has the main advantages of providing predicted error rates and of being able to deal with sequences without a significant match in sequence databases. We applied QUEST to the problem of automatically determining contaminants in EST projects. We present results from a simulated experiment and from a real EST project (the Schistosoma mansoni EST project). In the simulated experiment we achieved rates of false positives plus false negatives of around 10%. In the S.mansoni project QUEST suggests that contamination in supposedly bona _de sequences may be of at least 6%. In the S.mansoni test, QUEST was 10 times faster than the time it took to run BLASTX on all tested sequences. QUEST has a number of other applications, including the determination of organismal origin in the new approach to genomics called environmental genomics (also called metagenomics) / Mestrado / Mestre em Ciência da Computação
12

A formação Serra geral (cretáceo, bacia do Paraná) - como análogo para os reservatórios ígneo-básicos da margem continental brasileira

Reis, Gleice dos Santos January 2013 (has links)
As rochas magmáticas vêm ganhando destaque na geologia do petróleo, isto por que um crescente número de descobertas mundiais de hidrocarbonetos tem sido observados onde estas rochas se constituem em reservatórios de hidrocarbonetos, tendo em vista as perspectivas de terem atuado como efetivos selantes e, em conseqüência, possibilitando a acumulação de hidrocarbonetos gerados nos sedimentos subjacentes. Normalmente, as rochas ígneo-básicas constituem um reservatório em que predomina um intenso sistema de fraturas interligadas, abrindo espaços vazios (porosidade) o que permite também boa permeabilidade ao reservatório. Secundariamente, outras fontes de porosidade podem ser identificadas, como as vesiculares e a porosidade da matriz alterada. Um dos maiores problemas para o conhecimento e explotação dos reservatórios em rochas ígneo básicas é a ausência de modelos. Assim, há necessidade de entendimento das rochas vulcânicas sob o ponto de vista de reservatório e o desenvolvimento de modelos que permitam uma melhor explotação destas reservas. Neste sentido, a Formação Serra Geral (Cretáceo, com aproximadamente 133 Ma) aflorante na Bacia do Paraná, torna-se um excelente análogo para os reservatórios sob ponto de vista tectono-estratigráfico, pois é contemporânea a este vulcanismo Neocomiano das bacias marginais brasileiras e suas feições texturais e estruturais estão expostas em excelentes afloramentos o que não ocorre com o magmatismo das bacias marginais. Com isto, as microestruturas como poros (vesículas), fraturas e descontinuidades, típicas de eventos vulcânicos, consideradas como responsáveis pela permo-porosidade deste tipo de rocha podem ser analisadas em detalhe. As rochas vulcânicas da Bacia do Paraná estão expostas tanto verticalmente quanto lateralmente em áreas de extensão considerável e, por isto, apresentam potencial para uma amostragem seqüencial objetivando diversos tipos de estudos e análises (química, microscopia ótica, difração de raios X, microscopia eletrônica de varredura, entre outras). / Magmatic rocks are having evidence in petroleum geology because a growing number of hydrocarbon discoveries in which these rocks constitute reservoirs are being recognized. Magmatic rocks in hydrocarbon producing basins can be effective seals or give thermal increase to the oil generation. Nowadays, emphasis is given to the magmatic rocks as non conventional reservoirs. Typically basic igneous-rocks form fractured reservoirs dominated by interconneted fractures (fracture porosity). Secondarily, other sources of porosity can be identified, such as vesicular and microporosity. A major problem for knowledge and exploitation of these reservoirs is the lack of models. For that reason, there is a necessity of understanding volcanic rocks from the point of view of the reservoir and the development of models that will allow a better exploitation of these reserves. In this sense, the Serra Geral Formation (Cretaceous, around 133 Ma) which crops out in the Paraná Basin, becomes an excellent analogous for igneous reservoirs. Serra Geral Formation is a contemporary volcanism to the Neocomian igneous reservoirs, economic basement of the brazilian marginal basins. Their structural, stratigraphy and textural features are exposed in excellent outcrops which doesn’t occur with the magmatism of marginal basins. With this, the microstructures such as pores vesicles, fractures and discontinuities, typical of volcanic events, considered responsible for the permo-porosity system of this rock type can be analyzed in detail. Volcanics rocks of the Paraná Basin are exposed both vertically and laterally in areas of considerable extent and, therefore, have potential for a sequential sampling aiming various types of studies and analyzes (chemical, optical microscopy, X-ray diffraction, electron microscopy scanning, among others).
13

A formação Serra geral (cretáceo, bacia do Paraná) - como análogo para os reservatórios ígneo-básicos da margem continental brasileira

Reis, Gleice dos Santos January 2013 (has links)
As rochas magmáticas vêm ganhando destaque na geologia do petróleo, isto por que um crescente número de descobertas mundiais de hidrocarbonetos tem sido observados onde estas rochas se constituem em reservatórios de hidrocarbonetos, tendo em vista as perspectivas de terem atuado como efetivos selantes e, em conseqüência, possibilitando a acumulação de hidrocarbonetos gerados nos sedimentos subjacentes. Normalmente, as rochas ígneo-básicas constituem um reservatório em que predomina um intenso sistema de fraturas interligadas, abrindo espaços vazios (porosidade) o que permite também boa permeabilidade ao reservatório. Secundariamente, outras fontes de porosidade podem ser identificadas, como as vesiculares e a porosidade da matriz alterada. Um dos maiores problemas para o conhecimento e explotação dos reservatórios em rochas ígneo básicas é a ausência de modelos. Assim, há necessidade de entendimento das rochas vulcânicas sob o ponto de vista de reservatório e o desenvolvimento de modelos que permitam uma melhor explotação destas reservas. Neste sentido, a Formação Serra Geral (Cretáceo, com aproximadamente 133 Ma) aflorante na Bacia do Paraná, torna-se um excelente análogo para os reservatórios sob ponto de vista tectono-estratigráfico, pois é contemporânea a este vulcanismo Neocomiano das bacias marginais brasileiras e suas feições texturais e estruturais estão expostas em excelentes afloramentos o que não ocorre com o magmatismo das bacias marginais. Com isto, as microestruturas como poros (vesículas), fraturas e descontinuidades, típicas de eventos vulcânicos, consideradas como responsáveis pela permo-porosidade deste tipo de rocha podem ser analisadas em detalhe. As rochas vulcânicas da Bacia do Paraná estão expostas tanto verticalmente quanto lateralmente em áreas de extensão considerável e, por isto, apresentam potencial para uma amostragem seqüencial objetivando diversos tipos de estudos e análises (química, microscopia ótica, difração de raios X, microscopia eletrônica de varredura, entre outras). / Magmatic rocks are having evidence in petroleum geology because a growing number of hydrocarbon discoveries in which these rocks constitute reservoirs are being recognized. Magmatic rocks in hydrocarbon producing basins can be effective seals or give thermal increase to the oil generation. Nowadays, emphasis is given to the magmatic rocks as non conventional reservoirs. Typically basic igneous-rocks form fractured reservoirs dominated by interconneted fractures (fracture porosity). Secondarily, other sources of porosity can be identified, such as vesicular and microporosity. A major problem for knowledge and exploitation of these reservoirs is the lack of models. For that reason, there is a necessity of understanding volcanic rocks from the point of view of the reservoir and the development of models that will allow a better exploitation of these reserves. In this sense, the Serra Geral Formation (Cretaceous, around 133 Ma) which crops out in the Paraná Basin, becomes an excellent analogous for igneous reservoirs. Serra Geral Formation is a contemporary volcanism to the Neocomian igneous reservoirs, economic basement of the brazilian marginal basins. Their structural, stratigraphy and textural features are exposed in excellent outcrops which doesn’t occur with the magmatism of marginal basins. With this, the microstructures such as pores vesicles, fractures and discontinuities, typical of volcanic events, considered responsible for the permo-porosity system of this rock type can be analyzed in detail. Volcanics rocks of the Paraná Basin are exposed both vertically and laterally in areas of considerable extent and, therefore, have potential for a sequential sampling aiming various types of studies and analyzes (chemical, optical microscopy, X-ray diffraction, electron microscopy scanning, among others).
14

Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets

Linhares, Raquel Romes January 2011 (has links)
O método da análise de flutuações destendenciadas (Detrended Fluctuation Analysis - DFA), proposto por Peng et al. (1994), é um exemplo de metodologia recente, sendo utilizada em um crescente número de aplicações, para identificar longa dependência em séries temporais. Como não existe uma regra específica para a escolha dos números de regressores no método de DFA, apresentamos aqui uma escolha ótima assintótica. Para um ruído Gaussiano fracionário, provamos que o estimador bHDFA tem distribuição Gaussiana exata e assintótica. O parâmetro mais importante para ser estimado em dados com caudas pesadas é a sua taxa de decaimento α que determina a probabilidade de ocorrência dos valores extremos da distribuição subjacente. Propomos, neste trabalho, um novo estimador para o parâmetro α, baseado na função característica empírica e no procedimento de encolhimento de wavelets. Estamos interessados em analisar a longa dependência em sequência de DNA utilizando a metodologia de mudança de regimes, proposta por Liu (2000). Nesta metodologia, se a duração dos regimes de uma série temporal tem uma distribuição de caudas pesadas com parâmetro α ∈ (1, 2), então a série temporal apresenta a característica de longa dependência. Além disso, aplicando-se qualquer transformação linear que preserva a propriedade de variância finita na série temporal, igualmente preservará a propriedade de longa dependência. Por fim, estudamos as distribuições de distâncias das regiões codantes e não codantes em sequências de DNA. Concluímos que todas as técnicas apresentadas neste trabalho, para analisar longa dependência em série temporais, envolvendo conceitos de análise de flutuações destendenciadas, distribuições com caudas pesadas e encolhimento de wavelets, mostram a existência de longa dependência em todas sequências de DNA aqui estudadas. / The method of detrended fluctuation analysis (DFA), proposed by Peng et al. (1994), is useful in revealing the extent of long-range dependence in time series. Since there is not a specific rule for the choice of the numbers of regressors in DFA method, we present here an asymptotic optimal choice. For a fractional Gaussian noise, we prove the exact and the asymptotic Gaussian distributions for the bHDFA estimator. The most important parameter to estimate in a heavy-tailed data is the tail rate of decay α which determines the probability of occurrence of extreme values of the underlying distribution. Here we propose a novel estimator for α based on the empirical characteristic function and on the principal of wavelet shrinkage. Here we are interested in analyzing the long-range dependence in several DNA sequences, under the heavy-tail regime switching mechanism, proposed by Liu (2000). In this mechanism, if the duration of the regimes of a given time series has a heavy tail distribution with index parameter α ∈ (1, 2), then there is long-range dependence in this time series, and any functional transformation of the original time series preserving the property of finite variance, also preserves the property of long-range dependence. We also study the length distribution of coding and noncoding regions in DNA sequences. We conclude that all techniques presented in this paper to analyze longrange dependence in time series, involving concepts of detrended fluctuation analysis, heavy tail distributions and wavelet shrinkage, show the existence of long-range dependence in all DNA sequences studied here.
15

Método de Wang-Landau para sequenciamento de aminoácidos em estrutura nativa de proteínas em modelos de rede

Cagnin, Renato Luciano [UNESP] 15 April 2010 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:25:31Z (GMT). No. of bitstreams: 0 Previous issue date: 2010-04-15Bitstream added on 2014-06-13T19:53:21Z : No. of bitstreams: 1 cagnin_rl_me_rcla.pdf: 1628326 bytes, checksum: 51888e5b621ee00120b483fec4fea17a (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Neste trabalho de dissertação, apresentamos uma técnica de se construir sistematicamente sequências de aminoácidos que, ao serem dispostas ao longo de uma cadeia previamente conhecida, resultam em cadeias que se comportam como proteínas. Cada cadeia de aminoácidos, a uma dada temperatura, deve assumir uma forma funcional denominada estrutura nativa, não degenerada, na qual sua energia é a de menor valor possível. A técnica está baseada em um método Monte Carlo, introduzido por Wang e Landau, para se estudar transição de fases em sistemas magnéticos e que neste trabalho foi adaptada e aplicada para se desenhar proteínas. Para se verificar a eficiência do método, foi adotado o modelo de rede para proteínas, onde as cadeias são compostas por 27 monômeros interagindo através do potencial de Miyazawa-Jernigan e 20 tipos de aminoácidos. Um elevado número de sequências foram sintetizadas e todas foram sistematicamente testadas para verificar se cumpriam os requisitos de proteína. Com os resultados obtidos pôde-se verificar o sucesso da implementação da técnica. Trata-se então de uma ferramenta muito interessante e eficiente para o estudo do problema do enovelamento de proteínas / In this dissertation, we present a technique to search and order sequences of amino acids placed along a known chain to build one that behaves as a protein. At a given temperature, each designed sequence should fold to a special nondegenerated conformation known as native state. The energy of the sequence in this state is the lowest one. The technique is based on a Monte Carlo method, introduced by Wang and Landau, to study phase transition of magnetic systems and in this work was adapted and applied to protein design. We adopted the lattice model protein composed of 27 monomers interacting through the Miyazawa-Jernigan potencial and with 20 types of different amino acids. Many sequences were synthesized and all of them were systematically verified if they fulfilled the protein requirements and to check the efficiency of this method. The obtained results showed the success of the implemantation of this technique. Therefore, it is one more very interesting tool to efficiently study the protein folding problem
16

Método de Wang-Landau para sequenciamento de aminoácidos em estrutura nativa de proteínas em modelos de rede /

Cagnin, Renato Luciano. January 2010 (has links)
Orientador: Makoto Yoshida / Banca: Valter Luiz Líbero / Banca: Edson Denis Leonel / Resumo: Neste trabalho de dissertação, apresentamos uma técnica de se construir sistematicamente sequências de aminoácidos que, ao serem dispostas ao longo de uma cadeia previamente conhecida, resultam em cadeias que se comportam como proteínas. Cada cadeia de aminoácidos, a uma dada temperatura, deve assumir uma forma funcional denominada estrutura nativa, não degenerada, na qual sua energia é a de menor valor possível. A técnica está baseada em um método Monte Carlo, introduzido por Wang e Landau, para se estudar transição de fases em sistemas magnéticos e que neste trabalho foi adaptada e aplicada para se desenhar proteínas. Para se verificar a eficiência do método, foi adotado o modelo de rede para proteínas, onde as cadeias são compostas por 27 monômeros interagindo através do potencial de Miyazawa-Jernigan e 20 tipos de aminoácidos. Um elevado número de sequências foram sintetizadas e todas foram sistematicamente testadas para verificar se cumpriam os requisitos de proteína. Com os resultados obtidos pôde-se verificar o sucesso da implementação da técnica. Trata-se então de uma ferramenta muito interessante e eficiente para o estudo do problema do enovelamento de proteínas / Abstract: In this dissertation, we present a technique to search and order sequences of amino acids placed along a known chain to build one that behaves as a protein. At a given temperature, each designed sequence should fold to a special nondegenerated conformation known as native state. The energy of the sequence in this state is the lowest one. The technique is based on a Monte Carlo method, introduced by Wang and Landau, to study phase transition of magnetic systems and in this work was adapted and applied to protein design. We adopted the lattice model protein composed of 27 monomers interacting through the Miyazawa-Jernigan potencial and with 20 types of different amino acids. Many sequences were synthesized and all of them were systematically verified if they fulfilled the protein requirements and to check the efficiency of this method. The obtained results showed the success of the implemantation of this technique. Therefore, it is one more very interesting tool to efficiently study the protein folding problem / Mestre
17

A formação Serra geral (cretáceo, bacia do Paraná) - como análogo para os reservatórios ígneo-básicos da margem continental brasileira

Reis, Gleice dos Santos January 2013 (has links)
As rochas magmáticas vêm ganhando destaque na geologia do petróleo, isto por que um crescente número de descobertas mundiais de hidrocarbonetos tem sido observados onde estas rochas se constituem em reservatórios de hidrocarbonetos, tendo em vista as perspectivas de terem atuado como efetivos selantes e, em conseqüência, possibilitando a acumulação de hidrocarbonetos gerados nos sedimentos subjacentes. Normalmente, as rochas ígneo-básicas constituem um reservatório em que predomina um intenso sistema de fraturas interligadas, abrindo espaços vazios (porosidade) o que permite também boa permeabilidade ao reservatório. Secundariamente, outras fontes de porosidade podem ser identificadas, como as vesiculares e a porosidade da matriz alterada. Um dos maiores problemas para o conhecimento e explotação dos reservatórios em rochas ígneo básicas é a ausência de modelos. Assim, há necessidade de entendimento das rochas vulcânicas sob o ponto de vista de reservatório e o desenvolvimento de modelos que permitam uma melhor explotação destas reservas. Neste sentido, a Formação Serra Geral (Cretáceo, com aproximadamente 133 Ma) aflorante na Bacia do Paraná, torna-se um excelente análogo para os reservatórios sob ponto de vista tectono-estratigráfico, pois é contemporânea a este vulcanismo Neocomiano das bacias marginais brasileiras e suas feições texturais e estruturais estão expostas em excelentes afloramentos o que não ocorre com o magmatismo das bacias marginais. Com isto, as microestruturas como poros (vesículas), fraturas e descontinuidades, típicas de eventos vulcânicos, consideradas como responsáveis pela permo-porosidade deste tipo de rocha podem ser analisadas em detalhe. As rochas vulcânicas da Bacia do Paraná estão expostas tanto verticalmente quanto lateralmente em áreas de extensão considerável e, por isto, apresentam potencial para uma amostragem seqüencial objetivando diversos tipos de estudos e análises (química, microscopia ótica, difração de raios X, microscopia eletrônica de varredura, entre outras). / Magmatic rocks are having evidence in petroleum geology because a growing number of hydrocarbon discoveries in which these rocks constitute reservoirs are being recognized. Magmatic rocks in hydrocarbon producing basins can be effective seals or give thermal increase to the oil generation. Nowadays, emphasis is given to the magmatic rocks as non conventional reservoirs. Typically basic igneous-rocks form fractured reservoirs dominated by interconneted fractures (fracture porosity). Secondarily, other sources of porosity can be identified, such as vesicular and microporosity. A major problem for knowledge and exploitation of these reservoirs is the lack of models. For that reason, there is a necessity of understanding volcanic rocks from the point of view of the reservoir and the development of models that will allow a better exploitation of these reserves. In this sense, the Serra Geral Formation (Cretaceous, around 133 Ma) which crops out in the Paraná Basin, becomes an excellent analogous for igneous reservoirs. Serra Geral Formation is a contemporary volcanism to the Neocomian igneous reservoirs, economic basement of the brazilian marginal basins. Their structural, stratigraphy and textural features are exposed in excellent outcrops which doesn’t occur with the magmatism of marginal basins. With this, the microstructures such as pores vesicles, fractures and discontinuities, typical of volcanic events, considered responsible for the permo-porosity system of this rock type can be analyzed in detail. Volcanics rocks of the Paraná Basin are exposed both vertically and laterally in areas of considerable extent and, therefore, have potential for a sequential sampling aiming various types of studies and analyzes (chemical, optical microscopy, X-ray diffraction, electron microscopy scanning, among others).
18

Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets

Linhares, Raquel Romes January 2011 (has links)
O método da análise de flutuações destendenciadas (Detrended Fluctuation Analysis - DFA), proposto por Peng et al. (1994), é um exemplo de metodologia recente, sendo utilizada em um crescente número de aplicações, para identificar longa dependência em séries temporais. Como não existe uma regra específica para a escolha dos números de regressores no método de DFA, apresentamos aqui uma escolha ótima assintótica. Para um ruído Gaussiano fracionário, provamos que o estimador bHDFA tem distribuição Gaussiana exata e assintótica. O parâmetro mais importante para ser estimado em dados com caudas pesadas é a sua taxa de decaimento α que determina a probabilidade de ocorrência dos valores extremos da distribuição subjacente. Propomos, neste trabalho, um novo estimador para o parâmetro α, baseado na função característica empírica e no procedimento de encolhimento de wavelets. Estamos interessados em analisar a longa dependência em sequência de DNA utilizando a metodologia de mudança de regimes, proposta por Liu (2000). Nesta metodologia, se a duração dos regimes de uma série temporal tem uma distribuição de caudas pesadas com parâmetro α ∈ (1, 2), então a série temporal apresenta a característica de longa dependência. Além disso, aplicando-se qualquer transformação linear que preserva a propriedade de variância finita na série temporal, igualmente preservará a propriedade de longa dependência. Por fim, estudamos as distribuições de distâncias das regiões codantes e não codantes em sequências de DNA. Concluímos que todas as técnicas apresentadas neste trabalho, para analisar longa dependência em série temporais, envolvendo conceitos de análise de flutuações destendenciadas, distribuições com caudas pesadas e encolhimento de wavelets, mostram a existência de longa dependência em todas sequências de DNA aqui estudadas. / The method of detrended fluctuation analysis (DFA), proposed by Peng et al. (1994), is useful in revealing the extent of long-range dependence in time series. Since there is not a specific rule for the choice of the numbers of regressors in DFA method, we present here an asymptotic optimal choice. For a fractional Gaussian noise, we prove the exact and the asymptotic Gaussian distributions for the bHDFA estimator. The most important parameter to estimate in a heavy-tailed data is the tail rate of decay α which determines the probability of occurrence of extreme values of the underlying distribution. Here we propose a novel estimator for α based on the empirical characteristic function and on the principal of wavelet shrinkage. Here we are interested in analyzing the long-range dependence in several DNA sequences, under the heavy-tail regime switching mechanism, proposed by Liu (2000). In this mechanism, if the duration of the regimes of a given time series has a heavy tail distribution with index parameter α ∈ (1, 2), then there is long-range dependence in this time series, and any functional transformation of the original time series preserving the property of finite variance, also preserves the property of long-range dependence. We also study the length distribution of coding and noncoding regions in DNA sequences. We conclude that all techniques presented in this paper to analyze longrange dependence in time series, involving concepts of detrended fluctuation analysis, heavy tail distributions and wavelet shrinkage, show the existence of long-range dependence in all DNA sequences studied here.
19

Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets

Linhares, Raquel Romes January 2011 (has links)
O método da análise de flutuações destendenciadas (Detrended Fluctuation Analysis - DFA), proposto por Peng et al. (1994), é um exemplo de metodologia recente, sendo utilizada em um crescente número de aplicações, para identificar longa dependência em séries temporais. Como não existe uma regra específica para a escolha dos números de regressores no método de DFA, apresentamos aqui uma escolha ótima assintótica. Para um ruído Gaussiano fracionário, provamos que o estimador bHDFA tem distribuição Gaussiana exata e assintótica. O parâmetro mais importante para ser estimado em dados com caudas pesadas é a sua taxa de decaimento α que determina a probabilidade de ocorrência dos valores extremos da distribuição subjacente. Propomos, neste trabalho, um novo estimador para o parâmetro α, baseado na função característica empírica e no procedimento de encolhimento de wavelets. Estamos interessados em analisar a longa dependência em sequência de DNA utilizando a metodologia de mudança de regimes, proposta por Liu (2000). Nesta metodologia, se a duração dos regimes de uma série temporal tem uma distribuição de caudas pesadas com parâmetro α ∈ (1, 2), então a série temporal apresenta a característica de longa dependência. Além disso, aplicando-se qualquer transformação linear que preserva a propriedade de variância finita na série temporal, igualmente preservará a propriedade de longa dependência. Por fim, estudamos as distribuições de distâncias das regiões codantes e não codantes em sequências de DNA. Concluímos que todas as técnicas apresentadas neste trabalho, para analisar longa dependência em série temporais, envolvendo conceitos de análise de flutuações destendenciadas, distribuições com caudas pesadas e encolhimento de wavelets, mostram a existência de longa dependência em todas sequências de DNA aqui estudadas. / The method of detrended fluctuation analysis (DFA), proposed by Peng et al. (1994), is useful in revealing the extent of long-range dependence in time series. Since there is not a specific rule for the choice of the numbers of regressors in DFA method, we present here an asymptotic optimal choice. For a fractional Gaussian noise, we prove the exact and the asymptotic Gaussian distributions for the bHDFA estimator. The most important parameter to estimate in a heavy-tailed data is the tail rate of decay α which determines the probability of occurrence of extreme values of the underlying distribution. Here we propose a novel estimator for α based on the empirical characteristic function and on the principal of wavelet shrinkage. Here we are interested in analyzing the long-range dependence in several DNA sequences, under the heavy-tail regime switching mechanism, proposed by Liu (2000). In this mechanism, if the duration of the regimes of a given time series has a heavy tail distribution with index parameter α ∈ (1, 2), then there is long-range dependence in this time series, and any functional transformation of the original time series preserving the property of finite variance, also preserves the property of long-range dependence. We also study the length distribution of coding and noncoding regions in DNA sequences. We conclude that all techniques presented in this paper to analyze longrange dependence in time series, involving concepts of detrended fluctuation analysis, heavy tail distributions and wavelet shrinkage, show the existence of long-range dependence in all DNA sequences studied here.
20

Purificação e sequencia parcial de aminoacidos da adesina 2134P isolada de Escherichia coli enterotoxigenica (ETEC)

Amorim, Claudio Roberto Nobrega 19 August 1996 (has links)
Orientador: Maria Sumiko Arita Matsuura / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Biologia / Made available in DSpace on 2018-07-21T13:08:08Z (GMT). No. of bitstreams: 1 Amorim_ClaudioRobertoNobrega_M.pdf: 3407710 bytes, checksum: 3bcfb4652357a5fa35b5a91e15d4f0d2 (MD5) Previous issue date: 1996 / Resumo: Colibacilose ocorre em leitões recém-nascidos e pós-desmame. A doença é caracterizada por diarréia aguda, desidratação progressiva e morte, o que leva a uma considerável perda econômica. Para a Escherichia coli causar doença, ela necessita de pelo menos dois fatores de virulência: a) produção de enterotoxinas e, b) produção de adesinas. A proposta deste estudo foi a detecção, isolamento, purificação e caracterização de uma nova adesina, conhecida como 2134P, em amostras de E. coli enterotoxigênica (ETEC) isoladas de leitões com diarréia no Brasil. Esta adesina foi detectada numa freqüência alta (30,0%) em amostras de ETEC, que não expressavam as adesinas K88, K99, 987P, F41 e F42. Isto sugere um papel importante da adesina 2134P na enteropatogenia da colibacilose suma. A adesina 2134P isolada foi purificada por cromatografia em Sepharose CL 4B e analisada por SDS-P AGE corado com Coomassie Blue, apresentando uma única banda de 17 KDa., reconhecida pelo antissoro 2134P por "Westem blot". A técnica de "gold immunolabeling" revelou que a adesina 2134P é uma estrutura do tipo fimbria localizada na superfície da bactéria. A seqüência dos quinze primeiros aminoácidos da porção N-terminal da adesina 2134P foi obtida, a qual apresentou uma homologia de 10 aminoácidos (66%) com a porção N-terminal da fimbria FI07 (FI8ab) / Abstract: Enterotoxigenic colibacillosis occurs in newbom piglets and weaned pigs. It is characterizated by acute diarrhea, progressive dehydratation and death in a few days which lead to considerable economic loss. Disease is caused by two mainly virulence factors of Escherichia cali: a) production of enterotoxins and, b) production of adhesins. The purpose of this study was the detection, isolation purification and characterization of a novel adhesin, referred as 2134P, in Escherichia calí enterotoxigenic (ETEC) strains isolated from piglets with diarrhea in Brazil. This adhesin was detected in a high frequency (30.0%) in these ETEC strains, which didn't present the adhesins K88, K99, 987P, F41 and F42. Its suggests the important role of adehsin 2134P in porcine enter pathogenesis. The adhesin 2134P was purified on Sepharose CL 4B column chromatography, and was analyzed by SDS-PAGE stained with Coomassie Blue, and presented only one band of approximately 17 KDa identified in Westem blot using specific anti-2134P serum. Gold immunolabeling technique revealed that adhesin 2134P is a fimbrial structure on bacterial surface. It was obtained the first fifteen amino acids sequencing-signal of the N-termini portion of the adhesin 2134P, with a homology of 10 amino acids (66%) with the FI07 (FI8ab) fimbriae / Mestrado / Bioquimica / Mestre em Ciências Biológicas

Page generated in 0.0715 seconds