• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 8
  • 1
  • Tagged with
  • 9
  • 8
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Emprego de ferramentas de quimioinformática no estudo do perfil metabólico de plantas e na desreplicação de matrizes vegetais / Application of chemoinformatic tools in the study of plant metabolic profiles and dereplication

Oliveira, Tiago Branquinho 10 September 2015 (has links)
Com o surgimento da era computacional com especial aplicação em química, as substâncias de origem naturais puderam ter suas informações armazenadas em bancos de dados. Desta forma, surge a oportunidade de se empregar bancos de dados de produtos naturais e de algumas ferramentas de quimioinformática como os estudos de Quantitative Structure-Retention Relationship (QSRR) para acelerar a identificação de substâncias em estudos metabolômicos. Este trabalho propôs o desenvolvimento de três estudos de QSRR, bem como a construção de um banco de dados (AsterDB) com estruturas químicas da família Asteraceae e informações a elas associadas (ex.: ocorrências botânicas e taxonômicas, atividade biológica, informações analíticas etc.) para auxiliar a desreplicação de substâncias em extratos vegetais. O primeiro estudo foi elaborado com 39 lactonas sesquiterpênicas (LST) analisadas em dois diferentes sistemas de solventes (MeOH-H2O 55:45 e MeCN-H2O 35:65), três grupos de descritores estruturais (2D-descr, 3D-1conf e 3D-weigh), dois diferentes conjuntos para treino e teste (26:13 e 29:10), quatro algoritmos para seleção de descritores (best first, linear forward - LFS, greedy stepwise e algoritmo genético - GA), três diferentes tamanhos de modelos (quatro, cinco e seis descritores) e dois métodos de modelagem (mínimos quadrados parciais - PLS e redes neurais artificiais - ANN). O segundo foi desenvolvido com 50 substâncias de diferentes classes químicas com intuito de avaliar as diferenças entre substâncias analisadas individualmente e em mistura em três diferentes equipamentos e dois métodos cromatográficos. O terceiro foi elaborado com 2.635 estruturas químicas com um teste externo comum a todos os modelos (25%, n = 656), três métodos de separação para teste e treino (partição baseada na resposta e baseada nos preditores 2D e 3D), três diferentes tamanhos de modelos selecionados por GA e dois métodos de modelagem (MLR e redes neurais feed-forward com regularização bayesiana - BRNN). O banco de dados AsterDB foi desenvolvido para ser preenchido de forma gradual e atualmente possui cerca de 2.000 estruturas químicas. O primeiro estudo de QSRR gerou bons modelos capazes de estimar o logaritmo do fator de retenção (logk) das LST com P2>0,81 para o sistema MeCN-H2O. O segundo estudo mostrou que não houve diferença estatística entre as substâncias analisadas individualmente e em mistura (p-valor>0,95) e que a correlação entre os dois métodos cromatográficos e equipamentos utilizados foi reprodutível (R>0,95). Estas análises mostraram que foi possível desenvolver modelos de QSRR para um método cromatográfico e equipamento e transpô-los para outro equipamento seguindo o uso de substâncias em comum. O terceiro estudo produziu modelos com boa capacidade de predição (P2>0,81) utilizando alta amplitude de espaço químico e rigor estatístico. Conclui-se que, estas informações podem ser utilizadas como uma plataforma piloto para análises de dados com objetivo de auxiliar na desreplicação de extratos de plantas em estudos metabolômicos / After the emergence of the computing era with special application in chemistry, all substances from natural sources might have their information stored in databases. Therefore, the opportunity arises to employ natural product databases and some chemoinformatic tools such as QSRR studies to speed up the identification of substances from metabolomic studies. This paper proposes the development of three QSRR studies as well as the building of a database (AsterDB) with chemical structures from the Asteraceae family and related information (i.e.: botanical and taxonomic occurrences, biological activity, analytical information, etc.) aiming to assist the dereplication of substances in plant extracts. The first study was carried out with 39 sesquiterpene lactones (STLs) analysed using two different solvent systems (MeOH-H2O 55:45 and MeCN-H2O 35:65), three groups of structural descriptors (2D-descr, 3D-1conf, and 3D-weigh), two different sets for training and testing (26:13 and 29:10), four algorithms for selection of descriptors (best first, LFS, greedy stepwise, and GA), three different model sizes (four, five, and six descriptors) and two modelling methods (PLS and ANN). The second study was developed with 50 compounds of different chemical classification in order to assess the differences between individual and mixed compounds analysed in three different equipments and two chromatographic methods. The third was elaborated with 2,635 chemical structures with a common external test to all models (25%, n = 656), three separation methods for testing- and training-set (based on response and on 2D and 3D predictors partitions), three different sizes of models selected by GA and two modelling methods (MLR and BrNN). The AsterDB database was developed to be populated gradually and currently, it has about 2,000 chemical structures. The first QSRR study generated good models, able to estimate the logarithm of the retention factor (logk) of STLs with P2>0.81 for the MeCN-H2O system. The second study showed that there was no statistical difference between the substances analysed individually and mixed (p-value>0.95) and the correlation between the two chromatographic methods and equipments used was reproducible (R>0.95). These analyses showed that it was possible to develop QSRR models for a chromatographic method and equipment and translate them into other equipment following the use of substances in common. The third study produced models with good predictive capacity (P2>0.81) using a high range of chemical space and statistical accuracy. In conclusion, this information can be used as a pilot platform for data analysis in order to assist in plant dereplication in metabolomics studies
2

Emprego de ferramentas de quimioinformática no estudo do perfil metabólico de plantas e na desreplicação de matrizes vegetais / Application of chemoinformatic tools in the study of plant metabolic profiles and dereplication

Tiago Branquinho Oliveira 10 September 2015 (has links)
Com o surgimento da era computacional com especial aplicação em química, as substâncias de origem naturais puderam ter suas informações armazenadas em bancos de dados. Desta forma, surge a oportunidade de se empregar bancos de dados de produtos naturais e de algumas ferramentas de quimioinformática como os estudos de Quantitative Structure-Retention Relationship (QSRR) para acelerar a identificação de substâncias em estudos metabolômicos. Este trabalho propôs o desenvolvimento de três estudos de QSRR, bem como a construção de um banco de dados (AsterDB) com estruturas químicas da família Asteraceae e informações a elas associadas (ex.: ocorrências botânicas e taxonômicas, atividade biológica, informações analíticas etc.) para auxiliar a desreplicação de substâncias em extratos vegetais. O primeiro estudo foi elaborado com 39 lactonas sesquiterpênicas (LST) analisadas em dois diferentes sistemas de solventes (MeOH-H2O 55:45 e MeCN-H2O 35:65), três grupos de descritores estruturais (2D-descr, 3D-1conf e 3D-weigh), dois diferentes conjuntos para treino e teste (26:13 e 29:10), quatro algoritmos para seleção de descritores (best first, linear forward - LFS, greedy stepwise e algoritmo genético - GA), três diferentes tamanhos de modelos (quatro, cinco e seis descritores) e dois métodos de modelagem (mínimos quadrados parciais - PLS e redes neurais artificiais - ANN). O segundo foi desenvolvido com 50 substâncias de diferentes classes químicas com intuito de avaliar as diferenças entre substâncias analisadas individualmente e em mistura em três diferentes equipamentos e dois métodos cromatográficos. O terceiro foi elaborado com 2.635 estruturas químicas com um teste externo comum a todos os modelos (25%, n = 656), três métodos de separação para teste e treino (partição baseada na resposta e baseada nos preditores 2D e 3D), três diferentes tamanhos de modelos selecionados por GA e dois métodos de modelagem (MLR e redes neurais feed-forward com regularização bayesiana - BRNN). O banco de dados AsterDB foi desenvolvido para ser preenchido de forma gradual e atualmente possui cerca de 2.000 estruturas químicas. O primeiro estudo de QSRR gerou bons modelos capazes de estimar o logaritmo do fator de retenção (logk) das LST com P2>0,81 para o sistema MeCN-H2O. O segundo estudo mostrou que não houve diferença estatística entre as substâncias analisadas individualmente e em mistura (p-valor>0,95) e que a correlação entre os dois métodos cromatográficos e equipamentos utilizados foi reprodutível (R>0,95). Estas análises mostraram que foi possível desenvolver modelos de QSRR para um método cromatográfico e equipamento e transpô-los para outro equipamento seguindo o uso de substâncias em comum. O terceiro estudo produziu modelos com boa capacidade de predição (P2>0,81) utilizando alta amplitude de espaço químico e rigor estatístico. Conclui-se que, estas informações podem ser utilizadas como uma plataforma piloto para análises de dados com objetivo de auxiliar na desreplicação de extratos de plantas em estudos metabolômicos / After the emergence of the computing era with special application in chemistry, all substances from natural sources might have their information stored in databases. Therefore, the opportunity arises to employ natural product databases and some chemoinformatic tools such as QSRR studies to speed up the identification of substances from metabolomic studies. This paper proposes the development of three QSRR studies as well as the building of a database (AsterDB) with chemical structures from the Asteraceae family and related information (i.e.: botanical and taxonomic occurrences, biological activity, analytical information, etc.) aiming to assist the dereplication of substances in plant extracts. The first study was carried out with 39 sesquiterpene lactones (STLs) analysed using two different solvent systems (MeOH-H2O 55:45 and MeCN-H2O 35:65), three groups of structural descriptors (2D-descr, 3D-1conf, and 3D-weigh), two different sets for training and testing (26:13 and 29:10), four algorithms for selection of descriptors (best first, LFS, greedy stepwise, and GA), three different model sizes (four, five, and six descriptors) and two modelling methods (PLS and ANN). The second study was developed with 50 compounds of different chemical classification in order to assess the differences between individual and mixed compounds analysed in three different equipments and two chromatographic methods. The third was elaborated with 2,635 chemical structures with a common external test to all models (25%, n = 656), three separation methods for testing- and training-set (based on response and on 2D and 3D predictors partitions), three different sizes of models selected by GA and two modelling methods (MLR and BrNN). The AsterDB database was developed to be populated gradually and currently, it has about 2,000 chemical structures. The first QSRR study generated good models, able to estimate the logarithm of the retention factor (logk) of STLs with P2>0.81 for the MeCN-H2O system. The second study showed that there was no statistical difference between the substances analysed individually and mixed (p-value>0.95) and the correlation between the two chromatographic methods and equipments used was reproducible (R>0.95). These analyses showed that it was possible to develop QSRR models for a chromatographic method and equipment and translate them into other equipment following the use of substances in common. The third study produced models with good predictive capacity (P2>0.81) using a high range of chemical space and statistical accuracy. In conclusion, this information can be used as a pilot platform for data analysis in order to assist in plant dereplication in metabolomics studies
3

Proteômica, quimioproteômica e quimioinformática na identificação de compostos anti-Paracoccidiodies spp., seus alvos moleculares e modo de ação / Proteomics, chemoproteomics and chemoinformatics in the identification of anti-Paracoccidiodies spp., their molecular targets and mode of action

Silva, Lívia do Carmo 01 December 2017 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2017-12-18T13:15:58Z No. of bitstreams: 2 Tese - Lívia do Carmo Silva - 2017.pdf: 33507637 bytes, checksum: 4e4e645677db485bad788889218760cd (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-12-18T13:17:23Z (GMT) No. of bitstreams: 2 Tese - Lívia do Carmo Silva - 2017.pdf: 33507637 bytes, checksum: 4e4e645677db485bad788889218760cd (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-12-18T13:17:23Z (GMT). No. of bitstreams: 2 Tese - Lívia do Carmo Silva - 2017.pdf: 33507637 bytes, checksum: 4e4e645677db485bad788889218760cd (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017-12-01 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Paracoccidioidomycosis (PCM) is the cause of several deaths from systemic mycoses. The etiological agents of PCM belong to the genus Paracoccidioides spp., restricted to the regions of Latin America. The infection is acquired by inhaling conidia that primarily settle in the lungs, and can spread to other organs. The treatment of PCM is commonly performed with administration of antifungals such as amphotericin B, itraconazole and co-trimoxazole. The toxicity and side effects of antifungals, added over the long treatment time, has stimulated research for new bioactive compounds. Thus, with the objective of to identify the anti- Paracoccidioides spp. of compounds derived from chalcones and nitrogen heterocycles and to identify the molecular targets and mode of action of argentilactone and RRF-128 in P. brasiliensis were used methodologies such as shape-based virtual screening, minimum inhibitory and fungicidal concentration, cytotoxicity in fibroblast cells, interactions between antifungal, proteomic and chemoproteomics. After the virtual screening, 33 chalcones were proposed as anti-Paracoccidioides molecules, being this activity confirmed by biological assays. Among the compounds, eight aryl and heteroaryl chalcones had selectivity index considered attractive, highlighting Labmol-75 with selectivity index of 64.4 in P. lutzii and 32.2 in P. brasiliensis. In addition, Labmol-75 showed additive interaction with amphotericin B and co-trimoxazole. In relation to nitrogen heterocycles, of the 22 tested compounds, RRF-128 was the most important. RRF-128 showed to inhibit the growth of P. brasiliensis in low concentrations, selectivity index of 64.10, interacting synergistically with itraconazole. In addition, the proteomic analyzes of P. brasiliensis in the presence of the compound provided evidence that the energy metabolism of the fungus is induced to produce acetyl-CoA and that the synthesis of membrane sterols is impaired. In relation to argentilactone, 331 proteins were identified as ligands to this compound in the chemoproteomics assay and after being functionally classified, it was observed that the most representative functional classes are related to amino acid metabolism, energetic and detoxification. The inhibition of the enzymatic activity of malate dehydrogenase, citrate synthase and pyruvate dehydrogenase by argentilactone was confirmed. In addition, argentilactone induced the production of reactive oxygen species, and inhibited chitin and glucan synthesis and arrest of the cell cycle in the G0/G1 phase. From these results, it can be concluded that the compounds Labmol-75, RRF- 128 and argentilactone showed to be promising antifungal agents. / Paracoccidioidomicose (PCM) é a causa de várias mortes por micoses sistêmicas. Os agentes etiológicos da PCM pertencem ao gênero Paracoccidioides spp., restritos às regiões da América Latina. A infecção é adquirida por inalação de conídios que primariamente se instalam nos pulmões, podendo disseminar para outros órgãos. O tratamento da PCM é comumente realizado com a administração de antifúngicos como anfotericina B, itraconazol e co-trimoxazol. A toxidade e efeitos colaterais dos antifúngicos, adicionado ao longo tempo de tratamento, têm impulsionado pesquisas por novos compostos bioativos. Assim, com objetivo de identificar a atividade anti-Paracoccidioides spp. de compostos derivados de chalconas e heterociclos nitrogenados e identificar os alvos moleculares e modo de ação de argentilactona e RRF-128 em P. brasiliensis foram empregadas metodologias como rastreio virtual shape-based, concentração inibitória e fungicida mínima, citotoxicidade em células de fibroblastos, interações entre antifúngicos, proteômica e quimioproteômica. Após o rastreio virtual, 33 chalconas foram propostas como moléculas anti-Paracoccidioides, sendo esta atividade confirmada pelos ensaios biológicos. Dentre os compostos, oito aril e heteroaril chalconas tiveram índices de seletividades considerados promissores, destacando-se Labmol-75 com índice de seletividade de 64,4 em P. lutzii e 32,2 em P. brasiliensis. Além disso, Labmol-75 apresentou interação aditiva com anfotericina B e co-trimoxazol. Dos 22 compostos heterociclos nitrogenados, o RRF-128 apresentou resultados promissor. RRF-128 foi capaz de inibir o crescimento de P. brasiliensis em baixas concentrações e apresentou índice de seletividade de 64,10. Além disso, RRF-128 interagiu de forma sinérgica com itraconazol. As análises proteômicas de P. brasiliensis na presença de RRF-128 forneceram evidências de que o metabolismo energético do fungo é direcionado para produção de acetil-CoA e que a síntese de esteróis de membrana está comprometida. Quanto à argentilactona, 331 proteínas foram identificadas como ligantes a este composto utilizando abordagem quimioproteômica e após serem classificadas funcionalmente, observou-se que as classes funcionais mais representativas são relacionadas ao metabolismo de aminoácidos, energético e detoxificação. A inibição da atividade enzimática de malato desidrogenase, citrato sintase e piruvato desidrogenase por argentilactona foi confirmada. Além disso, argentilactona induziu a produção de espécies reativas de oxigênio, inibiu síntese de quitina e glicana, bem como o aprisionamento do ciclo celular na fase G0/G1. A partir destes resultados, conclui-se que os compostos Labmol-75, RRF-128 e argentilactona são promissores antifúngicos.
4

Planejamento e identificação de novos compostos moluscicidas para Biomphalaria glabrata (Mollusca, Planorbidae) / Planning and discovery of new molluscicidal compounds for Biomphalaria glabrata (Mollusca, Planorbidae)

Moreira Filho, José Teófilo 29 July 2016 (has links)
Submitted by Erika Demachki (erikademachki@gmail.com) on 2016-08-23T18:34:08Z No. of bitstreams: 2 Dissertação_José Teófilo Moreira Filho.pdf: 3739532 bytes, checksum: 781ef593c7c871e1b885d3e654832a3c (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Erika Demachki (erikademachki@gmail.com) on 2016-08-23T18:34:31Z (GMT) No. of bitstreams: 2 Dissertação_José Teófilo Moreira Filho.pdf: 3739532 bytes, checksum: 781ef593c7c871e1b885d3e654832a3c (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2016-08-23T18:34:31Z (GMT). No. of bitstreams: 2 Dissertação_José Teófilo Moreira Filho.pdf: 3739532 bytes, checksum: 781ef593c7c871e1b885d3e654832a3c (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2016-07-29 / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / Schistosomiasis is a neglected tropical disease caused by parasites of the genus Schistosoma. Worldwide, there are about 240 million people infected and have more than 700 million people at risk of infection in 78 countries. Biomphalaria glabrata is the main intermediate host of Schistosoma mansoni in Brazil. Niclosamide is the molluscicide recommended by the WHO. However, this molluscicide is toxic to other species of aquatic animals and plants, has difficult solubilization both in organic solvents and in water and also high cost. The utilization of in silico methods for virtual screening of new compounds rationalizes costs, reduces the time and also the number of animals in the early stages of research and development. The work’s purpose was plan and identify new molluscicidal compounds potentially active against B. glabrata through in silico methods. Known active and inactive molluscicidal compounds against B. glabrata were selected from literature. Decoys were generated to validate the shape-based models and QSAR models. First, the top 10,000 compounds from Chembridge and ZINC "DrugsNow" databases were screened with the best shape-based model, selected using TanimotoCombo socre function. Later, the activity of the compounds was predicted using consensus QSAR models. Finally, the water solubility of the compounds was calculated for the best molluscicidal candidates, leading to the identification of 20 potentially active compounds as molluscicides against B. glabrata. / A esquistossomose é uma doença tropical negligenciada causada por parasitos do gênero Schistosoma. No mundo, existem cerca de 240 milhões de pessoas infectadas e mais de 700 milhões de pessoas em 78 países sob risco de infecção. Biomphalaria glabrata é o principal hospedeiro intermediário de Schistosoma mansoni no Brasil. A niclosamida é o moluscicida recomendado pela Organização Mundial de Saúde. No entanto, este moluscicida é tóxico a outras espécies de animais aquáticos e plantas, possui difícil solubilização tanto em solventes orgânicos quanto em água e, também, possui alto custo. A utilização de métodos in silico para triagem virtual de novos compostos racionaliza os custos, diminui o tempo e reduz número de animais nas fases iniciais de pesquisas e desenvolvimento. O objetivo deste trabalho foi planejar e identificar novos compostos moluscicidas potencialmente ativos contra B. glabrata através de métodos in silico. Compostos ativos e inativos como moluscicidas contra B. glabrata foram selecionados na literatura. Decoys foram gerados para a validação dos modelos de similaridade pela forma 3D e modelos de QSAR. Primeiramente, os melhores 10.000 compostos das bases de dados Chembridge e ZINC "DrugsNow" foram triados com o melhor modelo de similaridade pela forma 3D, utilizando a função de score TanimotoCombo. Posteriormente, a atividade dos compostos foi predita utilizando os modelos de QSAR gerados. Ao final, a solubilidade em água dos compostos com melhor atividade predita foi calculada, levando à identificação de 20 compostos potencialmente moluscicidas contra B. glabrata.
5

Estrategias de aprendizaje profundo aplicadas al descubrimiento de fármacos : representación molecular, modelado de bioactividad y analítica visual para cribado virtual

Sabando, Vir January 2024 (has links)
El desarrollo de nuevos fármacos constituye un área de investigación fundamental en la medicina moderna. Más allá de los vertiginosos avances científicos en informática molecular y bioquímica que abonan a su mejora continua, la inversión en tiempo y recursos es sumamente elevada, en contraste a su exigua tasa de éxito. Las estrategias computacionales juegan un rol clave en la optimización y eficiencia de las múltiples tareas involucradas en el desarrollo de medicamentos, que abarcan desde la representación molecular y el modelado predictivo de bioactividad hasta el cribado virtual de fármacos y el diseño de nuevas estructuras químicas. El objetivo de esta tesis se centró en el desarrollo y aplicación de estrategias computacionales novedosas basadas en aprendizaje profundo para contribuir a la optimización de las diversas etapas del descubrimiento de nuevos medicamentos. Las contribuciones de la presente tesis parten de un análisis crítico y permanente del estado del arte en informática molecular e involucran el diseño de nuevas estrategias aplicando conceptos y desarrollos de vanguardia en aprendizaje profundo. Como resultado de este trabajo, se lograron propuestas novedosas alineadas en tres ejes fundamentales del proceso de desarrollo de fármacos: representaciones moleculares, modelado predictivo de bioactividad, y analítica visual aplicada a cribado virtual de fármacos. En materia de modelado predictivo de bioactividad, desarrollamos enfoques de modelado QSAR capaces de alcanzar rendimientos predictivos superiores a los previamente reportados para un gran número de propiedades de relevancia en el área, sin necesidad de realizar selección de características. Propusimos un enfoque de definición del dominio de aplicabilidad químico para dichos modelos eficaz en la determinación del rango de confiabilidad de las predicciones, y desarrollamos una estrategia para brindar interpretabilidad a modelos QSAR basados en redes neuronales. Además, experimentamos con aprendizaje profundo multi-tarea, logrando un enfoque pionero para el modelado de mutagenicidad de Ames, que permite el aprendizaje conjunto de información de diferentes blancos farmacológicos, superando en rendimiento a los resultados previamente publicados. En el área de representación molecular, desarrollamos un riguroso trabajo de investigación y análisis comparativo de diversas estrategias de representación molecular tradicionales y basadas en aprendizaje profundo. Propusimos un diseño experimental para la comparación y evaluación del desempeño de dichas representaciones en modelado QSAR, cuyos resultados evidenciaron la importancia de la selección cuidadosa de la representación elegida y proporcionan un marco de referencia para posteriores estudios similares. Por último, presentamos una herramienta integral de analítica visual para cribado virtual que integra diferentes fuentes de información química y representaciones moleculares complementarias. Esta herramienta interactiva demostró ser eficaz en la asistencia a expertxs de química medicinal para la exploración visual de patrones de similitud estructural en grandes conjuntos de datos químicos y para el diseño de nuevos compuestos candidatos. / The development of new drugs constitutes a fundamental research area in modern medicine. Beyond the rapid scientific advances in molecular informatics and biochemistry, which contribute to its continuous improvement, the investment in time and resources is extremely high, in contrast to its limited success rate. Computational strategies play a key role in optimizing and streamlining the multiple tasks involved in drug development, ranging from molecular representation and predictive modeling of bioactivity profiles, to virtual drug screening and the design of novel chemical structures. The goal of this thesis focused on the development and application of novel computational strategies based on deep learning to contribute to the optimization of the many stages involved in the drug discovery process. The contributions of this thesis stem from a critical and ongoing analysis of the state of the art in molecular informatics and involve the design of new strategies by applying recent concepts and developments in deep learning. As a result of this work, we achieved a series of innovative proposals which align to three fundamental cornerstones of the drug development process: molecular representation, predictive modeling of bioactivity profiles, and visual analytics applied to virtual drug screening. In the field of predictive bioactivity modeling, we developed QSAR modeling approaches that achieved higher predictive performances than those previously reported for numerous relevant biochemical properties, while at the same time overcoming the need for a feature selection step. We proposed an approach to define the chemical applicability domain for these models, effectively determining the reliability range of predictions, and developed a strategy to provide interpretability to QSAR models based on neural networks. Additionally, we experimented with multi-task deep learning, achieving a pioneering approach for modeling Ames mutagenicity that allows the joint learning of information from different pharmacological targets, which outperformed previously published results. In the field of molecular representation, we conducted a rigorous research and comparative analysis of various traditional and deep learning-based molecular representation strategies. We proposed an experimental design for the comparison and evaluation of the performance of these representations in QSAR modeling, and the results highlighted the importance of carefully selecting the molecular representation for each task, while also providing a reference framework for subsequent similar studies. Finally, we introduced a comprehensive visual analytics tool for virtual screening that integrates different sources of chemical information and complementary molecular representations. This interactive tool proved to be effective in assisting medicinal chemistry experts in visually exploring structural similarity patterns in large chemical datasets and in the design of new candidate compounds.
6

Quimitaxonomia e fitoquímica de espécies da tribo Heliantheae (Asteraceae) e uso de Quimioinformática em elucidação estrutural / Chemotaxonomy and phytochemistry of Heliantheae (Asteraceae) species and the use of Chemoinformatics in structure elucidation

Stefani, Ricardo 02 October 2002 (has links)
A química de produtos naturais sempre foi uma fonte importante de novas substâncias e de substâncias bioativas. No mundo moderno, o homem utiliza os produtos naturais para diversos fins: corantes, edulcorantes, essências, defensivos agrícolas e principalmente medicamentos. Com o desenvolvimento das técnicas de isolamento de substâncias, cresceu a necessidade de organizar as informações obtidas e também a criação de meios para a identificação mais rápida das substâncias isoladas. Esta foi uma das necessidades que fez surgir a Quimioinformática. Quimioinformática é uma disciplina que utiliza os métodos da informática para organizar dados químicos, analisar estes dados e gerar novas informações a partir destes dados. Esta ferramenta tem sido utilizada com sucesso em procura por novas drogas (QSAR/QSPR), elucidação estrutural automatizada de substâncias orgânicas e em cálculos e previsão de propriedades físico-químicas de diversas moléculas. Os objetivos do presente trabalho foram o estudo fitoquímico de espécies dos gêneros Dimerostemma e Ichthyothere com o intuito de isolar novas substâncias e o desenvolvimento de técnicas envolvendo quimioinformática com o intuito de auxiliar a elucidação estrutural de produtos naturais. Realizou-se a técnica de microamstragem de tricomas glandulares de diversas espécies pertencentes a gêneros da tribo Heliantheae (Viguiera, Tithonia, Dimerostemma). Através da microamostragem foi possível identificar diversas substâncias presentes nos tricomas glandulares das espécies analisadas. Das duas espécies de Dimerostemma investigadas (D. brasilianum e D. rotundifolium) foi possível identificar dois germacrolidos e dois eudesmanolidos, enquanto que de Ichthyothere terminalis foi possível a identificação de dois melampolidos, todos eles lactonas sesquiterpênicas. Foram treinadas redes neurais artificiais para a realização da identificação dos esqueletos carbônicos de determinadas substâncias a partir dos dados obtidos através dos espectros de RMN 13C, sendo que os resultados obtidos podem ser considerados satisfatórios. Foi desenvolvido um software para efetuar a identificação automática de substâncias através da comparação com uma biblioteca de padrões que possui dados cromatográficos de 51 lactonas sesquiterpênicas. Esse software, chamado de NAPROSYS, também é capaz de fazer comparação de dados de RMN de amostra com dados de RMN presentes em uma biblioteca de dados, tornando possível a identificação imediata de substâncias presentes na biblioteca e também auxiliar a elucidação estrutural de substâncias que não estão nela presentes. Para testar a eficiência do NAPROSYS, o programa foi utilizado com sucesso para identificar LSTs através da microamostragem de tricomas glandulares. A eficiência do NAPROSYS em identificar dados de RMN de substâncias presentes na biblioteca foi testada com substâncias isoladas do gênero Tithonia e Viguiera que possuem substâncias bem descritas na literatura e já isoladas no nosso laboratório, sendo que os resultados apresentados foram excelentes. Criou-se também dois modelos de redes neurais para prever tempos de retenção de lactonas sesquiterpênicas em cromatografia líquida (QSRR) com o objetivo de melhorar o desempenho do NAPROSYS em análises de dados cromatográficos. Os resultados para este caso, embora coerentes, precisam ser melhorados. Neste trabalho concluimos que o uso das técnicas clássicas juntamente com as novas técnicas de Quimoinformática pode se tornar uma ferramenta muito eficaz para a elucidação estrutural e busca de substâncias com determinadas propriedades químicas ou mesmo na bioprospecção de novas substâncias bioativas. / Natural products chemistry has always been an important source for new andbioactive compounds. In modern world, mankind uses natural products to do many tasks: colouring, as essences, as agricultural defensives and many as medicines. Within the development of compound isolation techniques, the need for information organisation has grown. The need for quickly identification of isolated compounds has also grown. This was one of the necessities that made Chemoinformatics emerge. Chemoinformatics is a discipline that uses informatics as a tool to organise, analise and to generate new knowledge from chemical data. This tool has been used with success in automate structure elucidation, drug development (QSAR/QSPR) and to predict chemical-physical data of many molecules. The aims of the present work were the phytochemical study of species of the genera Dimerostemma and Ichthyothere to isolate new compounds, and the development of chemoinformatics techniques to aid natural products structure elucidation. The glandular trichome microsampling was made for diverse species of genera from the tribe Heliantheae (Viguiera, Tithonia, Dimerostemma). Many compounds were identified through glandular trichome microsampling. Two germacrolides and two eudesmanolides were identified from Dimerostemma species (D. brasilianum and D. episcopale), while from Ichthyothere terminalis two melampolides were identified, all of them being sesquiterpene lactones. Artificial Neural Networks were trained to make skeleton identification from data obtained from 13C NMR and the obtained results can be considered satisfactory. A software was developed to make automatic compound identification through the comparation with a compound library that possesses data from 51 STLs. This software is called NAPROSYS is also able to compare the NMR data of the sample with the NMR data stored into a compound library, making the imediate identification of compounds present into library possible and also help the structure elucidation of unknown compounds. To test NAPROSYS\' efficience to identify NMR data of compunds sored into the library was made with compounds isolated from species of Tithonia and Viguiera genera, because these genera has well describe compounds in the literature and that has been isolated in our laboratory, and the obtained results are excellent. Two Artificial Neural Network models were created to predict the retention time of sesquiterpene lactones in liquid cromatography (QSRR) with the aim of improve NAPROSYS performance in cromatographic data analysis. The results for this case, although coherent, can be improved. The conclusion of this work is that the use of classical techniques with the new techniques of chemoinformatics can be a very efficient tool to make structure elucidation, search for compounds with certain chemical properties and even the search for new bioactive compounds.
7

Quimitaxonomia e fitoquímica de espécies da tribo Heliantheae (Asteraceae) e uso de Quimioinformática em elucidação estrutural / Chemotaxonomy and phytochemistry of Heliantheae (Asteraceae) species and the use of Chemoinformatics in structure elucidation

Ricardo Stefani 02 October 2002 (has links)
A química de produtos naturais sempre foi uma fonte importante de novas substâncias e de substâncias bioativas. No mundo moderno, o homem utiliza os produtos naturais para diversos fins: corantes, edulcorantes, essências, defensivos agrícolas e principalmente medicamentos. Com o desenvolvimento das técnicas de isolamento de substâncias, cresceu a necessidade de organizar as informações obtidas e também a criação de meios para a identificação mais rápida das substâncias isoladas. Esta foi uma das necessidades que fez surgir a Quimioinformática. Quimioinformática é uma disciplina que utiliza os métodos da informática para organizar dados químicos, analisar estes dados e gerar novas informações a partir destes dados. Esta ferramenta tem sido utilizada com sucesso em procura por novas drogas (QSAR/QSPR), elucidação estrutural automatizada de substâncias orgânicas e em cálculos e previsão de propriedades físico-químicas de diversas moléculas. Os objetivos do presente trabalho foram o estudo fitoquímico de espécies dos gêneros Dimerostemma e Ichthyothere com o intuito de isolar novas substâncias e o desenvolvimento de técnicas envolvendo quimioinformática com o intuito de auxiliar a elucidação estrutural de produtos naturais. Realizou-se a técnica de microamstragem de tricomas glandulares de diversas espécies pertencentes a gêneros da tribo Heliantheae (Viguiera, Tithonia, Dimerostemma). Através da microamostragem foi possível identificar diversas substâncias presentes nos tricomas glandulares das espécies analisadas. Das duas espécies de Dimerostemma investigadas (D. brasilianum e D. rotundifolium) foi possível identificar dois germacrolidos e dois eudesmanolidos, enquanto que de Ichthyothere terminalis foi possível a identificação de dois melampolidos, todos eles lactonas sesquiterpênicas. Foram treinadas redes neurais artificiais para a realização da identificação dos esqueletos carbônicos de determinadas substâncias a partir dos dados obtidos através dos espectros de RMN 13C, sendo que os resultados obtidos podem ser considerados satisfatórios. Foi desenvolvido um software para efetuar a identificação automática de substâncias através da comparação com uma biblioteca de padrões que possui dados cromatográficos de 51 lactonas sesquiterpênicas. Esse software, chamado de NAPROSYS, também é capaz de fazer comparação de dados de RMN de amostra com dados de RMN presentes em uma biblioteca de dados, tornando possível a identificação imediata de substâncias presentes na biblioteca e também auxiliar a elucidação estrutural de substâncias que não estão nela presentes. Para testar a eficiência do NAPROSYS, o programa foi utilizado com sucesso para identificar LSTs através da microamostragem de tricomas glandulares. A eficiência do NAPROSYS em identificar dados de RMN de substâncias presentes na biblioteca foi testada com substâncias isoladas do gênero Tithonia e Viguiera que possuem substâncias bem descritas na literatura e já isoladas no nosso laboratório, sendo que os resultados apresentados foram excelentes. Criou-se também dois modelos de redes neurais para prever tempos de retenção de lactonas sesquiterpênicas em cromatografia líquida (QSRR) com o objetivo de melhorar o desempenho do NAPROSYS em análises de dados cromatográficos. Os resultados para este caso, embora coerentes, precisam ser melhorados. Neste trabalho concluimos que o uso das técnicas clássicas juntamente com as novas técnicas de Quimoinformática pode se tornar uma ferramenta muito eficaz para a elucidação estrutural e busca de substâncias com determinadas propriedades químicas ou mesmo na bioprospecção de novas substâncias bioativas. / Natural products chemistry has always been an important source for new andbioactive compounds. In modern world, mankind uses natural products to do many tasks: colouring, as essences, as agricultural defensives and many as medicines. Within the development of compound isolation techniques, the need for information organisation has grown. The need for quickly identification of isolated compounds has also grown. This was one of the necessities that made Chemoinformatics emerge. Chemoinformatics is a discipline that uses informatics as a tool to organise, analise and to generate new knowledge from chemical data. This tool has been used with success in automate structure elucidation, drug development (QSAR/QSPR) and to predict chemical-physical data of many molecules. The aims of the present work were the phytochemical study of species of the genera Dimerostemma and Ichthyothere to isolate new compounds, and the development of chemoinformatics techniques to aid natural products structure elucidation. The glandular trichome microsampling was made for diverse species of genera from the tribe Heliantheae (Viguiera, Tithonia, Dimerostemma). Many compounds were identified through glandular trichome microsampling. Two germacrolides and two eudesmanolides were identified from Dimerostemma species (D. brasilianum and D. episcopale), while from Ichthyothere terminalis two melampolides were identified, all of them being sesquiterpene lactones. Artificial Neural Networks were trained to make skeleton identification from data obtained from 13C NMR and the obtained results can be considered satisfactory. A software was developed to make automatic compound identification through the comparation with a compound library that possesses data from 51 STLs. This software is called NAPROSYS is also able to compare the NMR data of the sample with the NMR data stored into a compound library, making the imediate identification of compounds present into library possible and also help the structure elucidation of unknown compounds. To test NAPROSYS\' efficience to identify NMR data of compunds sored into the library was made with compounds isolated from species of Tithonia and Viguiera genera, because these genera has well describe compounds in the literature and that has been isolated in our laboratory, and the obtained results are excellent. Two Artificial Neural Network models were created to predict the retention time of sesquiterpene lactones in liquid cromatography (QSRR) with the aim of improve NAPROSYS performance in cromatographic data analysis. The results for this case, although coherent, can be improved. The conclusion of this work is that the use of classical techniques with the new techniques of chemoinformatics can be a very efficient tool to make structure elucidation, search for compounds with certain chemical properties and even the search for new bioactive compounds.
8

Técnicas de transferência de aprendizagem aplicadas a modelos QSAR para regressão / Transfer learning techniques applied to QSAR models for regression

Simões, Rodolfo da Silva 10 April 2018 (has links)
Para desenvolver um novo medicamento, pesquisadores devem analisar os alvos biológicos de uma dada doença, descobrir e desenvolver candidatos a fármacos para este alvo biológico, realizando em paralelo, testes em laboratório para validar a eficiência e os efeitos colaterais da substância química. O estudo quantitativo da relação estrutura-atividade (QSAR) envolve a construção de modelos de regressão que relacionam um conjunto de descritores de um composto químico e a sua atividade biológica com relação a um ou mais alvos no organismo. Os conjuntos de dados manipulados pelos pesquisadores para análise QSAR são caracterizados geralmente por um número pequeno de instâncias e isso torna mais complexa a construção de modelos preditivos. Nesse contexto, a transferência de conhecimento utilizando informações de outros modelos QSAR\'s com mais dados disponíveis para o mesmo alvo biológico seria desejável, diminuindo o esforço e o custo do processo para gerar novos modelos de descritores de compostos químicos. Este trabalho apresenta uma abordagem de transferência de aprendizagem indutiva (por parâmetros), tal proposta baseia-se em uma variação do método de Regressão por Vetores Suporte adaptado para transferência de aprendizagem, a qual é alcançada ao aproximar os modelos gerados separadamente para cada tarefa em questão. Considera-se também um método de transferência de aprendizagem por instâncias, denominado de TrAdaBoost. Resultados experimentais mostram que as abordagens de transferência de aprendizagem apresentam bom desempenho quando aplicadas a conjuntos de dados de benchmark e a conjuntos de dados químicos / To develop a new medicament, researches must analyze the biological targets of a given disease, discover and develop drug candidates for this biological target, performing in parallel, biological tests in laboratory to validate the effectiveness and side effects of the chemical substance. The quantitative study of structure-activity relationship (QSAR) involves building regression models that relate a set of descriptors of a chemical compound and its biological activity with respect to one or more targets in the organism. Datasets manipulated by researchers to QSAR analysis are generally characterized by a small number of instances and this makes it more complex to build predictive models. In this context, the transfer of knowledge using information other\'s QSAR models with more data available to the same biological target would be desirable, nince its reduces the effort and cost to generate models of chemical descriptors. This work presents an inductive learning transfer approach (by parameters), such proposal is based on a variation of the Vector Regression method Adapted support for learning transfer, which is achieved by approaching the separately generated models for each task. It is also considered a method of learning transfer by instances, called TrAdaBoost. Experimental results show that learning transfer approaches perform well when applied to some datasets of benchmark and dataset chemical
9

Técnicas de transferência de aprendizagem aplicadas a modelos QSAR para regressão / Transfer learning techniques applied to QSAR models for regression

Rodolfo da Silva Simões 10 April 2018 (has links)
Para desenvolver um novo medicamento, pesquisadores devem analisar os alvos biológicos de uma dada doença, descobrir e desenvolver candidatos a fármacos para este alvo biológico, realizando em paralelo, testes em laboratório para validar a eficiência e os efeitos colaterais da substância química. O estudo quantitativo da relação estrutura-atividade (QSAR) envolve a construção de modelos de regressão que relacionam um conjunto de descritores de um composto químico e a sua atividade biológica com relação a um ou mais alvos no organismo. Os conjuntos de dados manipulados pelos pesquisadores para análise QSAR são caracterizados geralmente por um número pequeno de instâncias e isso torna mais complexa a construção de modelos preditivos. Nesse contexto, a transferência de conhecimento utilizando informações de outros modelos QSAR\'s com mais dados disponíveis para o mesmo alvo biológico seria desejável, diminuindo o esforço e o custo do processo para gerar novos modelos de descritores de compostos químicos. Este trabalho apresenta uma abordagem de transferência de aprendizagem indutiva (por parâmetros), tal proposta baseia-se em uma variação do método de Regressão por Vetores Suporte adaptado para transferência de aprendizagem, a qual é alcançada ao aproximar os modelos gerados separadamente para cada tarefa em questão. Considera-se também um método de transferência de aprendizagem por instâncias, denominado de TrAdaBoost. Resultados experimentais mostram que as abordagens de transferência de aprendizagem apresentam bom desempenho quando aplicadas a conjuntos de dados de benchmark e a conjuntos de dados químicos / To develop a new medicament, researches must analyze the biological targets of a given disease, discover and develop drug candidates for this biological target, performing in parallel, biological tests in laboratory to validate the effectiveness and side effects of the chemical substance. The quantitative study of structure-activity relationship (QSAR) involves building regression models that relate a set of descriptors of a chemical compound and its biological activity with respect to one or more targets in the organism. Datasets manipulated by researchers to QSAR analysis are generally characterized by a small number of instances and this makes it more complex to build predictive models. In this context, the transfer of knowledge using information other\'s QSAR models with more data available to the same biological target would be desirable, nince its reduces the effort and cost to generate models of chemical descriptors. This work presents an inductive learning transfer approach (by parameters), such proposal is based on a variation of the Vector Regression method Adapted support for learning transfer, which is achieved by approaching the separately generated models for each task. It is also considered a method of learning transfer by instances, called TrAdaBoost. Experimental results show that learning transfer approaches perform well when applied to some datasets of benchmark and dataset chemical

Page generated in 0.0404 seconds