Made available in DSpace on 2015-03-04T18:57:46Z (GMT). No. of bitstreams: 1
NickDisser.pdf: 4259889 bytes, checksum: ee955de15c6345917110d7b6dc4b9765 (MD5)
Previous issue date: 2011-12-01 / Single nucleotide polymorphism, SNP, are common and may be responsible for di_erent phenotypes. The attention around this type of polymorphism was intensi_ed when it was discovered, through the sequencing project of the human
genome, that they were responsible for most of the genetic variability (90%) of complete human genomes compared. Thus, presenting a frequency of occurrence of one SNP per 1.000-2.000bp intervals. Recently, several studies have focused on the detection of this type of polymorphism in bacterial genomes for use in bacterial strain typing and phylogeny reconstruction, for example. In this work we developed a methodology for detecting and _ltering SNPs for bacterial genomes in order to analyze the prevalence of this type of polymorphism. The methodology involves the use of sequence alignment algorithms and _lters developed in PERL programming language for the detection and filtering of SNPs in order to obtain a reliable final set. The occurrence of SNPs fits the concept of Poisson probability distribution because they are events that occur in an interval, in this case, coding sequences. Within this context, we also calculated the expected frequency of SNPs for each case using a Poisson probability distribution. SNPs that exceeded the expected frequency may be subject to diferent selective pressure. The methodology was tested and evaluated for genomes in five genera of the family Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella and Yersinia) and used in the case study of Klebsiella pneumoniae str. Kp13 genome, a bacteria causing nosocomial infection. The methodology has been able to detect and filter SNPs in diferent species of the family Enterobacteriaceae in accordance with data already published. For the four Klebsiella pneumoniae strains analyzed the occurrence of such polymorphism between the strains compared was observed. Thus, coding sequences with a number of SNPs higher than the expected frequency, obtained by the Poisson Probability Distribution, have been investigated to assess its possible association with the bacteria lifestyle. / Polimorfismos de Unico Nucleotídeo, SNP, são freqüentes e podem ser responsáveis por diferentes fenótipos. A atenção em torno deste tipo de polimorfismo se intensificou quando se descobriu, através do projeto de seqüenciamento do genoma humano, que eram responsáveis pela maior parte da variabilidade genética (90%) entre genomas humanos completos comparados. Com isso apresentando uma freqüência de ocorrência de 1 SNP em intervalos de 1.000-2.000pb. Recentemente vários estudos se concentraram na detecção desse tipo de polimorfismo em genomas bacterianos para uso em tipagem de estirpes e reconstrução de filogenia, por exemplo.
Neste trabalho foi desenvolvida uma metodologia de detecção e filtragem de SNPs para genomas bacterianos visando a análise da prevalência desse tipo de polimorfismo. A metodologia envolve o uso de algoritmos de alinhamento de seqüência e filtros desenvolvidos na linguagem de programação PERL para a detecção e filtragem de SNPs com a finalidade de se obter um conjunto final confiável.
A ocorrência de SNPs se encaixa no conceito de distribuição de probabilidade de Poisson por serem eventos que ocorrem em um intervalo, nesse caso, seqüência
codificantes. Dentro deste contexto, também foi calculada a freqüência esperada de SNPs para cada caso estudado usando uma distribuição de probabilidade de Poisson. Microrganismos que apresentem SNPs em uma freqüência acima da esperada podem estar sujeitos a pressões seletivas diferenciadas. A metodologia foi testada e avaliada para genomas em cinco gêneros da família Enterobacteriaceae (Enterobacter, Escherichia, Salmonella, Shigella e Yersinia) e utilizada no caso específico da bactéria Klebsiella pneumoniae str. Kp13, causadora de infecção nosocomial isolada no Brasil. A metodologia se provou capaz de detectar e filtrar SNPs em diferentes espécies da família Enterobacteriaceae em concordância com dados já publicados.
Para as 4 estirpes de Klebsiella pneumoniae foi observada a ocorrência desse tipo de polimorfismo entre as estirpes comparadas. Desta maneira, seqüências codificantes com um número de SNPs maior que a freqüência esperada, obtida com a Distribuição de Probabilidade de Poisson, foram investigadas para averiguação da sua possível associação com o estilo de vida bacteriano.
Identifer | oai:union.ndltd.org:IBICT/oai:tede-server.lncc.br:tede/153 |
Date | 01 December 2011 |
Creators | Lima, Nicholas Costa Barroso |
Contributors | Nicolás, Marisa Fabiana, Cantão, Mauricio Egidio, Porto, Fabio Andre Machado, Picão, Renata Cristina |
Publisher | Laboratório Nacional de Computação Científica, Programa de Pós-Graduação em Modelagem Computacional, LNCC, Br, Serviço de Análise e Apoio a Formação de Recursos Humanos |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações do LNCC, instname:Laboratório Nacional de Computação Científica, instacron:LNCC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0019 seconds