Return to search

Análise de similaridade entre sequências dos genes do HIV-1 e o Genoma Humano / Analysis of similarity between the sequences of genes of HIV-1 and Human Genome

Made available in DSpace on 2015-07-22T20:49:22Z (GMT). No. of bitstreams: 0
Previous issue date: 2010-03-31 / Os genes virais podem ter origens celulares ou não. Eles podem ter sido reunidos durante a evolução, sendo que cada um pode corresponder a uma origem distinta. A similaridade entre sequências genéticas sugerem homologia e, portanto, um parentesco evolutivo. O presente estudo tem como objetivo identificar regiões de similaridade, com suporte estatístico confiável, entre o genoma do HIV-1 e o genoma humano a partir da análise comparativa entre sequências de DNA, por meio do programa BLAST. Também é de nosso interesse desenvolver uma metodologia que permita comparar sequências genéticas de diversos organismos, de forma que a similaridade possa ser quantificada. Para realizar as comparações entre as sequências genéticas, é utilizada a ferramenta BLASTn (versão 2.2.20) e um banco de dados local composto pelos cromossomos humanos. Python (versão 5.1.30) é utilizada para o processamento das sequências, e a análise dos dados é feita utilizando a linguagem estruturada de consulta SQL (Structured Query Language). O genoma humano é comparado com: sequências dos genes do HIV-1, sequências de genes do vírus do mosaico do tabaco (controle negativo biológico), trechos de cromossomos da Macaca mulatta (controle positivo biológico) e sequências aleatórias (controle negativo não biológico). O presente estudo demonstra diferenças entre os genes do HIV-1 e a região LTR. Alguns genes demonstram maior similaridade com o genoma humano do que outros, de acordo com a análise da curva do fitting. Ao verificar a curva obtida a partir de E-values muito baixos, observa-se que todos os genes do HIV-1 apresentam curva não linear do tipo y = a0 . xa1, onde a0 e a1 são parâmetros obtidos a partir de ajuste numérico. O método é validado utilizando dados do genoma da Macaca mulatta, pelo qual é observada alta similaridade com o genoma humano. A partir desta validação é possível construir três diferentes grupos de genes do HIV-1 de acordo com o valor de a1, onde: os genes env, gag, nef, pol, rev, tat e vif apresentam valores de a1 idênticos, o gene vpr um valor mais baixo e o gene vpu um valor bem mais alto. / It is possible that viral genes have cellular origins. They may have been gathered during evolution, and each one may correspond to a distinct origin. The similarity between genetic sequences suggest homology and, therefore, an evolutive relationship. The present study aimed at identifying region with similarity, with significant statistic support, between the human and the HIV-1 genome through the comparative analysis between DNA sequences using the BLAST program. It is also our purpose to develop a methodology which allows the comparison between genetic sequences of diverse organisms, quantifying the similarity. Thus, to carry it through, we use the BLASTn software (2.2.20 version) and a local database of human chromosomes. Python (5.1.30 version) is used for sequence processing and the data analysis is made using the SQL (Structured Query Language). The human genome is compared to sequences from: HIV-1 genes, Tobbaco Mosaic Virus genes (negative non-biologic control), chromosomes motifs of Macaca mulatta (positive biologic control) and random sequences (negative non-biologic control). We find differences between all the HIV-1 genes and the LTR region. Some genes show more similarity with the human genome than others, according to the curve fitting analysis. When analyzing the curve obtained at very low E-values, it is observed that all HIV-1 genes are well represented by a non-linear curve fitting y = a0 . xa1 where a0 and a1 are parameters obtained numerically. As a result, the method is validated using the data from the genome of Macaca mulatta for which a high level of similarity with the human genome is observed. Based on this validation, it is possible to form three distinct groups of genes from HIV-1 according to the a1 value where: the env, gag, nef, pol, rev, tat and vif genes have identical a1 values; the vpr gene a very low a1 value; and the vpu a a1 higher value. / TEDE / BV UNIFESP: Teses e dissertações

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unifesp.br:11600/8922
Date31 March 2010
CreatorsGalinskas, Juliana [UNIFESP]
ContributorsUniversidade Federal de São Paulo (UNIFESP), Janini, Luiz Mário Ramos [UNIFESP]
PublisherUniversidade Federal de São Paulo (UNIFESP)
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format86 f.
Sourcereponame:Repositório Institucional da UNIFESP, instname:Universidade Federal de São Paulo, instacron:UNIFESP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds