Made available in DSpace on 2015-04-14T14:49:41Z (GMT). No. of bitstreams: 1
436381.pdf: 5238803 bytes, checksum: ca22d61f2fb4075e277ed531aee231ce (MD5)
Previous issue date: 2012-01-17 / With the growth of biological experiments, solving and analyzing the massive amount of data
being generated has been one of the challenges in bioinformatics, where one important research
area is the rational drug design (RDD). The interaction between biological macromolecules called
receptors, and small molecules called ligands, is the fundamental principle of RDD. In in-silico
molecular docking experiments it is investigated the best bind and conformation of a ligand into a
receptor. A docking result can be discriminated by a continue value called Free Energy of Binding
(FEB). We are attempting on mining data from molecular docking results, aiming at selecting
promising receptor conformations to the next docking experiments. In this sense, we have developed
a comprehensive repository to store our molecular docking data. Having such repository, we were
able to apply preprocessing strategies on the stored data and submit them to different data mining
tasks. Among the techniques applied, the most promising results were obtained with regression
model trees. Although we have already addressed important issues and achieved significant results,
there are some properties in these experiments turning it difficult to properly select conformations.
Hence, a strategy was proposed considering the three-dimensional (3D) properties of the receptor
conformations, to predict FEB. This thesis presents the 3D-Tri, a novel algorithm able to handle
and treat spatial coordinates in a x,y,z format, and induce a tree that predicts FEB value by
representing such properties. The algorithm uses such coordinates to split a node in two parts,
where the edges evaluate whether the atom being tested by the node is part of a given interval
[(xi,xf );(yi,yf );(zi,zf )], where i indicates the initial position of the coordinate, and f its final
position. The induced model can help a domain specialist to select promising conformations, based
on the region of the atoms in the model, to perform new molecular docking experiments / Com o avan?o nos experimentos biol?gicos, a manipula??o e an?lise do grande volume de dadossendo gerados por esses experimentos t?m sido um dos desafios em bioinform?tica, onde umaimportante ?rea de pesquisa ? o desenho racional de f?rmacos (RDD - Rational Drug Desing). Aintera??o entre macromol?culas biol?gicas, chamadas de receptores, e pequenas mol?culas, chamadasligantes, ? o princ?pio fundamental do RDD. ? em experimentos in silico de docagem molecularque se investiga o melhor encaixe e conforma??o de um ligante em uma cavidade do receptor. Oresultado de um experimento de docagem pode ser avaliado a partir de um valor cont?nuo de energialivre de liga??o (FEB - Free Energy of Binding). Tem-se empregado esfor?os em minerar dados deresultados de docagem molecular, com o objetivo de selecionar conforma??es relevantes para reduziro tempo de futuros experimentos de docagem. Nesse sentido, foi desenvolvido um reposit?rio paraarmazenar todos os dados a respeito desses experimentos, em n?vel de detalhe. Com esse reposit?rio,os dados foram devidamente pr?-processados e submetidos a diferentes tarefas de minera??ode dados. Dentre as t?cnicas aplicadas, a que apresentou-se mais promissora para o tipo de dadossendo utilizado foi ?rvore de decis?o para regress?o. Apesar dos resultados alcan?ados por essesexperimentos serem promissores, existem algumas propriedades nos experimentos que dificultam aefetiva sele??o de conforma??es. Dessa forma, prop?e-se uma estrat?gia que considera as propriedadestridimensionais (3D) do receptor para predizer o valor de FEB. Assim, nesta Tese ? apresentadoo 3D-Tri, um algoritmo de indu??o de ?rvore de regress?o que considera essas propriedades 3D,onde essas propriedades s?o definidas como atributos no formato x,y,z. O algoritmo proposto fazuso dessas coordenadas para dividir um nodo em duas partes, onde o ?tomo sendo testado parao nodo ? avaliado em termos de sua posi??o em um bloco [(xi,xf );(yi,yf );(zi,zf )] que melhorrepresente sua posi??o no espa?o, onde i indica a posi??o inicial de uma coordenada, e f indicaa posi??o final. O modelo induzido pode ser ?til para um especialista de dom?nio para selecionarconforma??es promissoras do receptor, tendo como base as regi?es dos ?tomos que aparecem nomodelo e que indicam melhores valores de FEB
Identifer | oai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5156 |
Date | 17 January 2012 |
Creators | Winck, Ana Trindade |
Contributors | Ruiz, Duncan Dubugras Alcoba |
Publisher | Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS |
Rights | info:eu-repo/semantics/openAccess |
Relation | 1974996533081274470, 500, 600, 1946639708616176246 |
Page generated in 0.0024 seconds