Return to search

APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA INVESTIGAÇÃO DA ATIVIDADE GÊNICA DO CÂNCER DE COLO DE INTESTINO

Made available in DSpace on 2018-06-27T18:56:04Z (GMT). No. of bitstreams: 3
Sylvio Andre Garcia Vieira.pdf: 1367551 bytes, checksum: ca3f0ae13708a71ab3e4688f6bed15d7 (MD5)
Sylvio Andre Garcia Vieira.pdf.txt: 115433 bytes, checksum: a82140f08dc158348e6d5247bd62e71b (MD5)
Sylvio Andre Garcia Vieira.pdf.jpg: 3561 bytes, checksum: dba9926977a76649dac476531896ca64 (MD5)
Previous issue date: 2011-03-30 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Data mining is the process of discovering patterns correlated with the various existing data in a database.GEO is a public biological database, maintained by NCBI, where they sought information relating to thirty-two patients of colorectal adenoma,with readings from the probes concerning the expression of genes,extracted RNA.The data deposited in biological banks alone do not produce useful information, and therefore, were selected respecting various factors such as the reliability of the information collected, the amount of information present in the greatest number of probes, and finally filtered by reading higher expression. After the database and be treated with the selected genes was then applied to the R tool with the SVM in order to identify this small set of genes, the possibility of their association with the presence of adenoma of the colon of the intestine.
From the results obtained by classifying the data it was noticed that the characteristics of the genes are distinct and that the activity varies greatly from gene to gene. However, this occurs in a standardized manner, allowing the algorithm could identify these patterns and suggest their involvement in the adenoma / A mineração de dados é o processo de descoberta de padrões correlacionados entre os diversos dados existentes em uma base. O GEO é uma base de dados biológicos público, mantido pelo NCBI, onde se buscou as informações referentes a trinta e dois pacientes de Adenoma de colo de intestino, com leituras da expressão de sondas referentes aos genes, extraídas do RNA. Os dados depositados em bancos biológicos, por si só, não produzem informação útil, e por isto, foram selecionados respeitando diversos fatores, como a confiabilidade da informação colhida, a quantidade de informações presentes no maior numero de sondas, e finalmente filtrados pela leitura de maior expressão. Após a base de dados ser tratada e com os genes selecionados, foi então aplicada a ferramenta R com o classificador SVM com o objetivo de identificar, neste pequeno conjunto de genes, a possibilidade de associação deles com a presença do adenoma de colo de intestino.
A partir dos resultados obtidos através da classificação dos dados percebeu-se que as características dos genes são bem distintas e que a atividade varia bastante de gene para gene. Porém, isto ocorre de forma padronizada, o que permitiu que o algoritmo pudesse identificar estes padrões e sugerir sua participação no processo do adenoma

Identiferoai:union.ndltd.org:IBICT/oai:tede.universidadefranciscana.edu.br:UFN-BDTD/293
Date30 March 2011
CreatorsVieira, Sylvio Andre Garcia
ContributorsVizzotto, Juliana Kaizer, Mombach, José Carlos Merino
PublisherUniversidade Franciscana, Mestrado Acadêmico em Nanociências, UFN, BR, Biociências e Nanomateriais
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Repositório Institucional Universidade Franciscana, instname:Universidade Franciscana, instacron:UFN
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0019 seconds