Return to search

Estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos QSAR para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura / Study of physiochemical properties and criteria for obtaining and validation of QSAR models of similar semicarbazonas set with antichagasic activity, selected of literature

O desenvolvimento tecnológico observado nos últimos anos e o avanço na aquisição de dados para os sistemas tanto químicos como biológicos tem gerado um grande número de informações. Como consequência, nos últimos anos, procuram-se ferramentas, fundamentalmente matemáticas, que permitam decodificar este volume imenso de informações, em termos estruturais e biológicos. Embora diversos parâmetros estatísticos e métodos de seleção de modelos e de variáveis tenham sido descritos, mais recentemente, são encontradas propostas de novas ferramentas visando assegurar tanto a qualidade de predição do modelo como a elucidação de algum mecanismo a partir do modelo gerado. Com relação aos estudos de compostos antichagásicos, é grande o número de dados disponíveis, na literatura, nos diferentes aspectos pesquisados.A cruzipaína, também chamada de cruzaína, é a principal cisteína protease do Trypanosoma cruzi e sua inibição tem se mostrado capaz de inibir o desenvolvimento intracelular do protozoário. Neste trabalho foram selecionados da literatura original 90 compostos, incluindo-se 29 alfa-(N)-heterocíclica carboxaldeído tiossemicarbazonas substituídas, com atividade inibitória frente a ribonucleotídeo redutase (IRNR) (série I; compostos I.1. a I.29); 37 tiossemicarbazonas substituídas na cadeia lateral e no anel aromático (série II; compostos II.1 a II.37) e, 61 compostos estruturalmente diferentes (série III; compostos II.1 a III.61, sendo 45 tiossemicarbazonas das quais 37 da série II e, 16 derivados de isatinas). As séries II e III apresentam atividade inibitória frente à cruzaína, uma cisteína protease do T.cruzi. E a série I, embora, apresente atividade inibitória frente a ribonucleotídeo redutase (IRNR) de células H.Ep.-2, é, no entanto, estruturalmente similar às séries II e III. E, ainda mais, os modelos gerados nesta dissertação para a série I foram incluídos na tese de doutorado de H.Ishiki. Cada uma das séries foi dividida em 3 séries de treinamento (A, B e C) com suas correspondentes séries de teste. A seguir, a partir das estruturas representadas em 3 dimensões das moléculas, foram gerados 1497 descritores através do programa DRAGON (v. 3.0) para cada série (I, II e III). Estes descritores foram submetidos a um pré-tratamento de dados, excluindo-se aqueles que não contribuiriam para as análises PLS - Partial Least Squares (mínimos quadrados parciais). Através das análises PLS foram selecionados os descritores mais significativos das equações de regressão linear, que a seguir foram submetidos a uma análise de freqüência, ou seja, foram selecionados os descritores presentes em pelo menos em 2 dos 3 modelos obtidos das séries de treinamento (A, B e C). A partir destes descritores selecionados foram obtidos modelos de QSAR clássico com 5 descritores que foram validados por três filtros. Estes modelos de QSAR validados, apresentaram valores de coeficiente de correlação (r) e do quadrado do coeficiente de predição interna (Qcv2) maiores que 0,9 e 0,7 respectivamente. / It has been observed an enormous improvement in the methods concerning data generation, leading to a large amount of information, especially for chemical and biological systems. Through these developments, it becomes relevant to have reliable methods, mainly new mathematical tools, for structure-activity relationship (SAR) data examination, which means that there is a need for developing datasets screening tools. Although a huge number of descriptors and methods for selection have been described in the literature, it becomes a crucial aspect to develop new concepts and tools that assure selection of relevant information as well as a high predictive power for the generated QSAR models. Concerning antichagasic compounds, in the literature, there is a huge number of data in anti Chagas disease drug research fields. Cruzain, known also as cruzipain, is the major cysteine protease of T. cruzi. The protease is expressed in all life cycle stages of the parasite. Therefore, cruzain is essential for replication of the intracellular parasite. Thus, cruzain is an appealing target for new antitrypanosomal chemotherapy. In this work, it has been taken from selected literature 90 compounds, including 29 substituted alpha-(N)- heterocyclic carboxaldehyde thiosemicarbazones, (set I, compounds I.1 to I. 29) and 37 substituted thiosemicarbazones (set II, compounds II.1 to II.37) and 61 structurally different compounds (set III, compounds II.1 to III.61, namely 45 thiosemicarbazones (37 from set II) and 16 isatin derivatives). Sets II and III showed inhibitory activity against cruzain, a cysteine protease of T. cruzi. Although set I compounds showed inhibitory activity against ribonucleotide reductase enzyme of H.Ep.-2 cells they have been included in this study taking into account that they are structurally similar to sets II and III, studied by H. Ishiki in his PhD thesis. Each set was divided in 3 training sets (A, B and C) with its corresponding test sets. Initially, 1497 descriptors have been obtained by means of DRAGON program (v.3.0) using 3D structures of sets I, II and III compounds. In a second step to reduce the data size, all descriptors have been submitted to a pre-treatment, including the use of different filters, followed by PLS analyses with external validation. Relevant descriptors have been selected using PLS followed by frequency analysis. That means, it has been selected descriptors, which were present at least in 2 or 3 models, generated from training sets (A, B an C). These descriptors have been used to generate QSAR models with up to 5 descriptors. The QSAR models had been validated by three filters. Values of correlation coefficient (r) and the squared correlation coefficient of internal predictions (Qcv2) were higher than 0.9 and 0.7, respectively, for the validated QSAR models.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-01032007-112133
Date05 May 2005
CreatorsScotti, Marcus Tullius
ContributorsAmaral, Antônia Tavares do
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeDissertação de Mestrado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.0027 seconds