Submitted by MARCIA ROVADOSCHI (marciar@unifra.br) on 2018-08-16T13:41:53Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_SylvioAndreGarciaVieira.pdf: 1371899 bytes, checksum: 6884c5455ed76729974e03777f962948 (MD5) / Made available in DSpace on 2018-08-16T13:41:53Z (GMT). No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_SylvioAndreGarciaVieira.pdf: 1371899 bytes, checksum: 6884c5455ed76729974e03777f962948 (MD5)
Previous issue date: 2011-03-30 / Data mining is the process of discovering patterns correlated with the various existing data in a database. GEO is a public biological database, maintained by NCBI, where they sought information relating to thirty-two patients of colorectal adenoma, with readings from the probes concerning the expression of genes, extracted RNA. The data deposited in biological banks alone do not produce useful information, and therefore, were selected respecting various factors such as the reliability of the information collected, the amount of information present in the greatest number of probes, and finally filtered by reading higher expression. After the databse and be treated with the selected genes was then applied to the R tool with the SVM in order to identify this small set of genes, the possibility of their association with the presence of adenoma of the colon of the intestine.
From the results obtained by classifying the data it was noticed that the characteristics of the genes are distinct and that the activity varies greatly from gene to gene. However, this occurs in a standardized manner, allowing the algorithm could identify these patterns and suggest their involvement in the adenoma. / A mineração de dados é o processo de descoberta de padrões correlacionados entre os diversos dados existentes em uma base. O GEO é uma base de dados biológicos público, mantido pelo NCBI, onde se buscou as informações referentes a trinta e dois pacientes de Adenoma de colo e intestino, com leituras de expressão de sondas referentes aos genes, extraídas do RNA. Os dados depositados em bancos biológicos, por si só, não produzem informação útil, e por isto, foram selecionados respeitando diversos fatores, como a confiabilidade da informação colhida, a quantidade de informações presentes no maior número de sondas, e finalmente filtrados pela leitura de maior expressão. Após a base de dados ser tratada e com os genes selecionados, foi então aplicada a ferramenta R com o classificador SVM com o objetivo de identificar, neste pequeno conjunto de genes, a possibilidade de associação deles com a presença do adenoma de colo de intestino.
A partir dos resultados obtidos através da classificação dos dados percebeu-se que as características dos genes são bem distintas e que a atividade varia bastante de gene para gene. Porém, isto ocorre de forma padronizada, o que permitiu que o algoritmo pudesse identificar estes padrões e sugerir sua participação no processo do adenoma.
Identifer | oai:union.ndltd.org:IBICT/oai:tede.universidadefranciscana.edu.br:UFN-BDTD/493 |
Date | 30 March 2011 |
Creators | Vieira, Sylvio André Garcia |
Contributors | Vizzotto, Juliana Kaizer, Alves, Marta Palma, Librelotto, Giovani Rubert |
Publisher | Centro Universitário Franciscano, Programa de Pós-Graduação em Nanociências, UNIFRA, Brasil, Biociências e Nanomateriais |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Repositório Institucional Universidade Franciscana, instname:Universidade Franciscana, instacron:UFN |
Rights | http://creativecommons.org/licenses/by-nc-nd/4.0/, info:eu-repo/semantics/openAccess |
Page generated in 0.0018 seconds