Global ETD Search

521	MOIRAE : a computational strategy to predict 3-D structures of polypeptides Dorn, Márcio January 2012 (has links) Currently, one of the main research problems in Structural Bioinformatics is associated to the study and prediction of the 3-D structure of proteins. The 1990’s GENOME projects resulted in a large increase in the number of protein sequences. However, the number of identified 3-D protein structures have not followed the same growth trend. The number of protein sequences is much higher than the number of known 3-D structures. Many computational methodologies, systems and algorithms have been proposed to address the protein structure prediction problem. However, the problem still remains challenging because of the complexity and high dimensionality of a protein conformational search space. This work presents a new computational strategy for the 3-D protein structure prediction problem. A first principle strategy which uses database information for the prediction of the 3-D structure of polypeptides was developed. The proposed technique manipulates structural information from the PDB in order to generate torsion angles intervals. Torsion angles intervals are used as input to a genetic algorithm with a local-search operator in order to search the protein conformational space and predict its 3-D structure. Results show that the 3-D structures obtained by the proposed method were topologically comparable to their correspondent experimental structure. Bioinformática Biologia molecular Algoritmos 3D Algoritmos geneticos 3-D protein structure prediction Structural bioinformatics GA local-search operator Genetic algorithms Artificial neural networks
522	"Aplicação da bioinformática no estudo dos genes e enzimas envolvidos na síntese da goma fastidiana produzida pela xylella fastidiosa" / "Bioinformatic applied in studies of the enzymes involved in the biosynthesis of the exopolysaccharide, fastidian gum, produced by Xylella Fastidiosa" João Renato Carvalho Muniz 25 April 2003 (has links) Xylella fastidiosa é uma bactéria Gram-negativa, limitada ao xilema das plantas e o agente causador de diversas doenças em importantes plantações como citros, videiras, mirta, amêndoa, arbustos e café. Em citros, X. fastidiosa causa a Clorose Variegada dos Citros (CVC) ou amarelinho. Nove enzimas (GumB, C, D, E, F, H, J, K e M) estão envolvidas nas etapas biossintéticas de um polissacarídeo extracelular (EPS), chamado de goma fastidiana, um dos mecanismos envolvidos na patogênese da bactéria. Essas enzimas catalisam reações de adição de açúcares, polimerização e exportação do EPS através da membrana da bactéria. No presente trabalho, ferramentas de bioinformática foram utilizadas para o estudo e entendimento da biossíntese da goma fastidiana. As nove enzimas foram estudadas quanto ao seu conteúdo de estrutura secundária, análise de hidrofobicidade e das regiões transmembrânicas, classificação quanto as suas funções. A construção de modelos estruturais para as enzimas Gums através de comparação por homologia seqüencial mostrou ser um processo impossível, devido a falta de moléculas homólogas com estruturas tridimensionais conhecidas. Por outro lado, métodos de reconhecimento de enovelamento mostraram bons resultados e comparações entre as estruturas secundárias das enzimas Gums foram calculadas com a utilização dos programas GenThreader e THREADER 3.3. Modelos tridimensionais para as enzimas GumB, GumK, GumM, GumJ e GumC foram construídos com o programa MODELLER 6.0a e validados com o programa Procheck e VERIFY 3D. Para construção do modelo da GumH (enzima que catalisa a adição da GDP-manose em um lipídio carreador poliprenol), o GenThreader encontrou similaridades quando comparada a MurG (E.coli), 2-epimerase (E. coli), GtfB (Amycolatopsis orientalis) e beta-GT de fago T4. Todos os modelos são bastante semelhantes e compostos por dois domínios (alfa/beta), ambos similares ao motivo de ligação de nucleotídeos Rossmann fold e separados por uma fenda profunda, que, provavelmente, forma o sítio de ligação da GDP-manose. Estudos da interação entre proteína e substrato foram obtidos com a utilização do programa FLO. O alinhamento seqüencial da GumH com outras onze glicosiltransferases mostrou regiões bastante conservadas, incluindo o motivo EX7E presente no sítio de ligação do substrato na proteína. Considerações a respeito das interações do substrato GDP-manose com a enzima GumH e do mecanismo da reação foram feitas. Essas análises enfatizam o modelo obtido para a GumH, que representa a primeira estrutura proposta para as enzimas envolvidas na síntese da goma fastidiana. / Xylella fastidiosa is a xylem-dwelling, insect-transmitted gamma-protobacterium that causes pathogenicity in citrus plants and many others important crops such as grapevine, periwinkle, almond, oleander and coffee. In citrus plants, X. fastidiosa causes citrus variegated chlorosis (CVC) or amarelinho. Nine enzymes (GumB, C, D, E, F, H, J, K and M) are involved in the biosynthetic pathway of an exopolysaccharide (EPS) called fastidian gum which could be involved in the pathogenicity of the bacterium. These enzymes catalyses sugars addition reactions, polymerization and discharge of the EPS through the bacterias membrane. We have used bioinformatic tools to study these enzymes and to understand the gum biosynthesis. The nine enzymes were studied regarding to its secondary structure content, analysis of hidrophobicity and transmembrane regions, and yet function classification. The construction of structural models using sequential homology was shown to be impossible, due to the necessity of homologues molecules whose three-dimensional structures are known. On the other hand, pairwises comparisons of secondary structures showed good results and were realized with GenThreader and THREADER 3.3 programs. Three-dimensional structures to GumB, GumK, GumM, GumJ and GumC enzymes were constructed using MODELLER 6.0a and validated with Procheck and VERIFY 3D programs. To construct the model of GumH (enzyme that catalyse the addiction of a GDP-mannose on a polyprenol phosphate carrier), GenThreader found folding similarities when compared to MurG and UDP-Acetylglucosamine 2-Epimerase (from E. coli), GtfB (from Amycolatopsis orientalis) and beta-GT (from T4 phage). The models are very similar consisting of two alpha/beta open sheet domains, both alike in topology to the Rossmann nucleotide-binding folds, and separated by a deep cleft which probably forms the GDP-mannose binding site. Studies of the interaction between enzyme and docked substrate were carried out using the FLO program. The sequence alignment between GumH and another eleven glycosiltransferases showed several preserved regions including the EX7E motif present on the substrate binding site. The interactions between enzyme-GDP-mannose substrate and the mechanism of the reaction were studied. These analyses emphasize the three-dimensional model constructed for GumH that represents the first structural information for enzymes involved in fastidian gum synthesis. amarelinho bioinformática CVC enzimas goma fastidiana GumH modelagem molecular modeller operon gum xylella fastidiosa amarelinho bioinformatic CVC enzymes fastidian gum GumH modeller molecular modeling operon gum Xylella fastidiosa
523	Análise computacional da diversidade viral presente na comunidade microbiana do processo de compostagem do Zoológico de São Paulo / Computational analysis of the viral diversity in the Sao Paulo Zoo composting microbial community Deyvid Emanuel Amgarten 18 November 2016 (has links) O estudo da diversidade viral em amostras ambientais tem se tornado cada vez mais importante devido a funções-chave desempenhadas por esses organismos. Estudos recentes têm fornecido evidências de que vírus de bactérias (bacteriófagos) podem ser os principais determinantes em ciclos biogeoquímicos de grandes ecossistemas, além de atuarem no fluxo de genes entre comunidades ambientais e na plasticidade funcional das mesmas frente a estresses ambientais. Neste trabalho, propomos a investigação e caracterização da diversidade viral presente em amostras de compostagem através de abordagens não dependentes e dependentes de cultivo. Na primeira abordagem, coletamos amostras seriadas de uma unidade de compostagem do zoológico de São Paulo para realização de sequenciamento metagenômico. O conjunto de sequências gerado foi extensivamente minerado (data-mining) para a produção de resultados de diversidade e abundância de táxons virais ao longo do processo de compostagem. Adicionalmente, procedemos com a montagem e recuperação de sequências virais candidatas a genomas completos e/ou parciais de novos vírus ambientais. Os dois protocolos computacionais utilizados para a mineração de dados encontram-se definidos e automatizados, podendo ser aplicados em quaisquer conjuntos de dados de sequenciamento metagenômico ou metatranscritômico obtidos através da plataforma Illumina. A segunda abordagem correspondeu ao isolamento e caracterização de novos fagos de Pseudomonas obtidos de amostras de compostagem. Três novos fagos foram identificados e tiveram os seus genomas sequenciados. A caracterização genômica desses fagos revelou genomas com alto grau de novidade, insights sobre a evolução de Caudovirales e a presença de genes de tRNA, cuja função pode estar relacionada com um mecanismo dos fagos para contornar o viés traducional apresentado pela bactéria hospedeira. A caracterização experimental dos novos fagos isolados demonstrou grande potencial para lise e dissolução de biofilme da cepa Pseudomonas aeruginosa PA14, conhecida como agente causador de infecções hospitalares em pacientes imunodeprimidos. Em suma, os dados reunidos nesta dissertação caracterizam a diversidade presente no viroma da compostagem e contribuem para o entendimento dos perfis taxonômico, funcional e ecológico do processo. / The study of the viral diversity in environmental samples has become increasingly important due to key-roles that are performed by these organisms in our ecosystems. Recent publications provide evidence that viruses of bacteria (bacteriophages) may be key-players in biogeochemical cycles of large ecosystems, as oceans and forests. Besides, they may also be determinant in the genes flux among populations and in the plasticity of the communities face to environmental stresses. In this work, we propose the investigation and characterization of the viral diversity in composting samples through non-culturable and culturable-dependent approaches. In the first approach, we sampled a composting unit from the Sao Paulo Zoo Park in different time points and proceeded with metagenomic sequencing. The dataset generated was extensively mined to provide results of diversity and abundance of viral taxa through the composting process. Additionally, we proceeded with the assembly and retrieval of candidate sequences to partial or/and complete viral genomes. The two computational protocols were automatized as pipelines and can be applied to any metagenomic dataset of illumina reads. The second approach refers to the isolation and characterization of new Pseudomonas phages obtained from composting samples. Three new phages were identified and their genomes were sequenced. A detailed characterization of these genomes revealed high degree of novelty, insights about evolution of tailed-phages and the presence of tRNA genes, which may be related to a mechanism to bypass host translational bias. The experimental characterization of the new phages demonstrated great potential to lyse bacterial cells and to degrade Pseudomonas aeruginosa PA14 biofilms. In short, the data presented in this dissertation shed light to the composting virome diversity, as well as to the functional and ecological profiles of viruses in the composting environment. Bioinformática Compostagem Diversidade Fagos Homing-endonucleases Metagenômica Pipeline Vírus Vírus ambientais Bioinformatics Composting Diversity Environmental viruses Homing-endonucleases Metagenomics Phages Pipeline Virus
524	Análise da via de regulação gênica por ácido retinóico: uma abordagem por bioinformática e biologia estrutural / Analysis of retinoic acid pathway: an approach by bioinformatics and structural biology. Tiago José Paschoal Sobreira 11 December 2008 (has links) As vias de sinalização celular por meio de moléculas são um dos principais meios de controle funcional de um organismo. O entendimento das funções de moléculas sinalizadoras facilita a compreensão das vias metabólicas de um organismo, assim possibilitando uma melhor compreensão de vários eventos biológicos e também de várias doenças. A sinalização pelo ácido retinóico (AR), e seus derivados, é responsável pelo controle de várias funções, por exemplo: crescimento celular, diferenciação celular, formação da retina, desenvolvimento cardíaco e também relacionado a várias patologias como diabetes, obesidades, cânceres, e doenças cardiovasculares. A ação do ácido retinóico é controlada em dois níveis: no metabolismo de síntese/degradação e na sua utilização na sinalização para a expressão gênica. A maquinaria que controla o metabolismo inclui as enzimas de síntese do AR (aldeído desidrogenase ALDH) e as enzimas de degradação do AR (Cyp26), que controlam a distribuição espaço-temporal do AR durante a embriogênese. As ALDHs são enzimas NAD(P)+ dependentes, que oxidam uma ampla gama de aldeídos para os seus correspondentes ácidos carboxílicos, sendo ALDH1A2 a principal enzima na transformação de retinal em ácido retinóico. A maquinaria da sinalização celular por AR contém os receptores nucleares controlados por AR (RARs) que estão envolvidos com o controle da transcrição gênica. Os mecanismos de controle de expressão mais comuns são os que ocorrem na fase transcricional. Um desses mecanismos envolve proteínas que se ligam às regiões promotoras de transcrição, representadas por trechos de DNA que geralmente estão localizados próximo à região de início da transcrição, mas que também podem estar a centenas ou até milhares de pares de bases desse início. Essas proteínas modulam a maquinaria transcricional, podendo ativá-la ou inibi-la. A associação de várias técnicas como a biologia molecular, bioinformática, filogenia, análises estruturais de biomoléculas, mecânica molecular e métodos termodinâmicos tem se mostrado uma poderosa abordagem para compreensão de sistemas biológicos simplificando e agilizando o desenvolvimento do conhecimento científico. Nessa direção, esse estudo desenvolveu duas análises: a primeira estudando a evolução das funções das enzimas ALDH, utilizando-se de técnicas de genômica combinatória, filogenia, bioinformática, estrutura de biomoléculas e de biologia do desenvolvimento, tentando compreender o modo como as ALDHs, que apresentam as seqüências de aminoácidos bastante similares, puderam divergir para gerar funções diversas como a destoxificação e a sinalização. Para este estudo foram analisados os genomas de 487 organismos em busca de seqüências de ALDHs e também o genoma do organismo modelo Branchiostoma floridae. Foram obtidas 190 seqüências que foram utilizadas em uma análise filogenética para tentar compreender a função primordial e também para definir grupos de aminoácidos candidatos a marcadores das diferentes famílias de ALDHs. Essas 190 seqüências também foram modeladas estruturalmente e analisada a forma e o volume do canal onde se aloja o aldeído a ser oxidado. A partir dessas informações foi possível prever que as ALDHs passaram das funções ancestrais de controle do padrão corporal para algo mais abrangente como funções protetoras. A segunda análise, utilizando-se das estruturas tridimensionais dos fatores de transcrição ligados ao DNA em diferentes posições e submetendo esses complexos a processos de mecânica molecular, cálculos termodinâmicos e análises das ligações de hidrogênio para tentar prever os mais prováveis sítios de interação entre os receptores e o DNA. O modelo escolhido para essa análise foram os fatores de transcrição regulados por ácido retinóico o RAR e RXR utilizando a região promotora do gene RARE-2 para avaliar as mais prováveis regiões de ligação desses fatores. Para esse estudo foram construídos 71 complexos proteína-DNA que foram submetidos a processos de mecânica molecular e cálculos termodinâmicos. A partir dessas informações foi possível prever uma região de maior afinidade entre o fator de transcrição e o DNA. As análises de ligações de hidrogênio possibilitaram definir exatamente a região de interação entre os fatores de transcrição e o DNA, e também descrever as interações moleculares responsáveis pela especificidade da interação. / Cellular signaling paths through molecules are one of the main processes of functional control of an organism. The comprehension of signaling molecules functions enables one to understand the metabolic pathways of an organism, along with related biological events and several diseases. The signaling through retinoic acid (RA) and its secondary products is responsible for controlling several functions, such as cellular growth and differentiation, retinas formation and cardio development, and is also related to several pathologies such as diabetes, obesity, cancers and cardiovascular disorders. There are two levels of control of retinoic acid activity: synthesis/degradation metabolism and its use in gene expression signaling. The machinery that controls the metabolism includes RAs synthesis (aldehyde dehydrogenase ALDH) and degradation (Cyp26) enzymes, which control the space-temporal distribution of RA during the embryogenesis. The ALDHs are NAD(P)+ dependent enzymes that oxidize many types of aldehydes into the related carboxylic acids, being the ALDH1A2 the main enzyme involved in the process of transformation of retinal into retinoic acid. The machinery of cellular signaling through RA contains the nuclear receptors controlled by RA (RARs) that are involved in the control of gene transcription. The most common mechanisms of expression control are the ones that occur during the transcriptional phase. One of these mechanisms involves proteins that bind to the transcription promoter regions, represented by DNA sequences that are usually located close to the region where the transcription starts, but can also be hundreds or thousands of base pairs apart from the starting point. These proteins modulate the transcriptional machinery, being responsible for both its activation and inhibition. The association of several techniques as molecular biology, bioinformatics, phylogeny, structural analysis of biomolecules, molecular mechanics and thermodynamic methods has been shown as a powerful tool for the understanding of biological systems, simplifying and speeding up the production of related scientific knowledge. Facing this direction, the present study developed two analyses. The first one studied the evolution of ALDH enzymes functions, using the techniques of combinatory genomic, phylogeny, bioinformatics, structure of biomolecules and developmental biology, in the attempt of understanding how the ALDHs could diverge and acquire different functions as detoxification and signaling, despite the fact that they have very similar aminoacid sequences. For this study, ALDHs sequences were searched for in the genome of 487 organisms plus the model organisms, Branchiostoma floridae. All 190 sequences obtained were used in a phylogenetic analysis, in the attempt of understanding the primordial function of the enzyme and defining possible groups of conserved aminoacids in the different families of ADLHs. These 190 sequences were also structurally modeled and the shape and volume of the channel where the aldehyde is placed to be oxidized were analyzed. Based on this information, it became possible to predict that the ALDHs moved from ancestral functions of corporal pattern control to a wider spectrum of protection functions. For the second analysis we submitted the complex formed by tridimensional structures of the transcriptional factors bond to DNA in different positions to processes of molecular mechanics, thermodynamic calculi and analysis of the hydrogen bonds, in order to predict the most probable sites of interaction between the receptors and the DNA. The model chosen for this analysis were the transcription factors regulated by retinoic acid, RAR and RXR, using the promoter region of the gene RARE-2 to assay the most probable binding regions of these factors. For this study, 71 protein-DNA complexes were built and submitted to processes of molecular mechanics and thermodynamic calculi. Based on the resulting data, it became possible to predict a region of greater affinity between the transcription factor and the DNA. The analyses of hydrogen bonds enabled us to define the exact region where the interaction between the transcription factor and the DNA takes place and also enabled us to describe the molecular interactions responsible for the specificity of this interaction. Ácido retinóico Bioinformática Fatores de transcrição Mecânica molecular Modelagem molecular por homologia Sinalização celular Bioinformatics Cellular signaling Molecular homology modeling Molecular mechanics Retinoic acid Transcription factors
525	Redes neurais e algoritmos genéticos para problemas de classificação hierárquica multirrótulo / Neural networks and genetic algorithms for hierarchical multi-label classification Ricardo Cerri 05 December 2013 (has links) Em problemas convencionais de classificação, cada exemplo de um conjunto de dados é associado a apenas uma dentre duas ou mais classes. No entanto, existem problemas de classificação mais complexos, nos quais as classes envolvidas no problema são estruturadas hierarquicamente, possuindo subclasses e superclasses. Nesses problemas, exemplos podem ser atribuídos simultaneamente a classes pertencentes a dois ou mais caminhos de uma hierarquia, ou seja, exemplos podem ser classificados em várias classes localizadas em um mesmo nível hierárquico. Tal hierarquia pode ser estruturada como uma árvore ou como um grafo acíclico direcionado. Esses problemas são chamados de problemas de classificação hierárquica multirrótulo, sendo mais difíceis devido à alta complexidade, diversidade de soluções, difícil modelagem e desbalanceamento dos dados. Duas abordagens são utilizadas para tratar esses problemas, chamadas global e local. Na abordagem global, um único classificador é induzido para lidar com todas as classes do problema simultaneamente, e a classificação de novos exemplos é realizada em apenas um passo. Já na abordagem local, um conjunto de classificadores é induzido, sendo cada classificador responsável pela predição de uma classe ou de um conjunto de classes, e a classificação de novos exemplos é realizada em vários passos, considerando as predições dos vários classificadores. Nesta Tese de Doutorado, são propostos e investigados dois métodos para classificação hierárquica multirrótulo. O primeiro deles é baseado na abordagem local, e associa uma rede neural Multi-Layer Perceptron (MLP) a cada nível da hierarquia, sendo cada MLP responsável pelas predições no seu nível associado. O método é chamado Hierarchical Multi- Label Classification with Local Multi-Layer Perceptrons (HMC-LMLP). O segundo método é baseado na abordagem global, e induz regras de classificação hierárquicas multirrótulo utilizando um Algoritmo Genético. O método é chamado Hierarchical Multi-Label Classification with a Genetic Algorithm (HMC-GA). Experimentos utilizando hierarquias estruturadas como árvores mostraram que o método HMC-LMLP obteve desempenhos de classificação superiores ao método estado-da-arte na literatura, e desempenhos superiores ou competitivos quando utilizando hierarquias estruturadas como grafos. O método HMC-GA obteve resultados competitivos com outros métodos da literatura em hierarquias estruturadas como árvores e grafos, sendo capaz de induzir, em muitos casos, regras menores e em menor quantidade / conventional classification problems, each example of a dataset is associated with just one among two or more classes. However, there are more complex classification problems where the classes are hierarchically structured, having subclasses and superclasses. In these problems, examples can be simultaneously assigned to classes belonging to two or more paths of a hierarchy, i.e., examples can be classified in many classes located in the same hierarchical level. Such a hierarchy can be structured as a tree or a directed acyclic graph. These problems are known as hierarchical multi-label classification problems, being more difficult due to the high complexity, diversity of solutions, modeling difficulty and data imbalance. Two main approaches are used to deal with these problems, called global and local. In the global approach, only one classifier is induced to deal with all classes simultaneously, and the classification of new examples is done in just one step. In the local approach, a set of classifiers is induced, where each classifier is responsible for the predictions of one class or a set of classes, and the classification of new examples is done in many steps, considering the predictions of all classifiers. In this Thesis, two methods for hierarchical multi-label classification are proposed and investigated. The first one is based on the local approach, and associates a Multi-Layer Perceptron (MLP) to each hierarchical level, being each MLP responsible for the predictions in its associated level. The method is called Hierarchical Multi-Label Classification with Local Multi-Layer Perceptrons (HMC-LMLP). The second method is based on the global approach, and induces hierarchical multi-label classification rules using a Genetic Algorithm. The method is called Hierarchical Multi-Label Classification with a Genetic Algorithm (HMC-GA). Experiments using hierarchies structured as trees showed that HMC-LMLP obtained classification performances superior to the state-of-the-art method in the literature, and superior or competitive performances when using graph-structured hierarchies. The HMC-GA method obtained competitive results with other methods of the literature in both tree and graph-structured hierarchies, being able of inducing, in many cases, smaller and in less quantity rules Algoritmos genéticos Aprendizado de máquina Bioinformática Redes neurais bioinformatics Genetic algorithms Hierarchical multi-label classification Machine learning Neural networks
526	"Investigação de estratégias para a geração de máquinas de vetores de suporte multiclasses" / Investigation of strategies for the generation of multiclass support vector machines Ana Carolina Lorena 16 February 2006 (has links) Diversos problemas envolvem a classificação de dados em categorias, também denominadas classes. A partir de um conjunto de dados cujas classes são conhecidas, algoritmos de Aprendizado de Máquina (AM) podem ser utilizados na indução de um classificador capaz de predizer a classe de novos dados do mesmo domínio, realizando assim a discriminação desejada. Dentre as diversas técnicas de AM utilizadas em problemas de classificação, as Máquinas de Vetores de Suporte (Support Vector Machines - SVMs) se destacam por sua boa capacidade de generalização. Elas são originalmente concebidas para a solução de problemas com apenas duas classes, também denominados binários. Entretanto, diversos problemas requerem a discriminação dos dados em mais que duas categorias ou classes. Nesta Tese são investigadas e propostas estratégias para a generalização das SVMs para problemas com mais que duas classes, intitulados multiclasses. O foco deste trabalho é em estratégias que decompõem o problema multiclasses original em múltiplos subproblemas binários, cujas saídas são então combinadas na obtenção da classificação final. As estratégias propostas visam investigar a adaptação das decomposições a cada aplicação considerada, a partir de informações do desempenho obtido em sua solução ou extraídas de seus dados. Os algoritmos implementados foram avaliados em conjuntos de dados gerais e em aplicações reais da área de Bioinformática. Os resultados obtidos abrem várias possibilidades de pesquisas futuras. Entre os benefícios verificados tem-se a obtenção de decomposições mais simples, que requerem menos classificadores binários na solução multiclasses. / Several problems involve the classification of data into categories, also called classes. Given a dataset containing data whose classes are known, Machine Learning (ML) algorithms can be employed for the induction of a classifier able to predict the class of new data from the same domain, thus performing the desired discrimination. Among the several ML techniques applied to classification problems, the Support Vector Machines (SVMs) are known by their high generalization ability. They are originally conceived for the solution of problems with only two classes, also named binary problems. However, several problems require the discrimination of examples into more than two categories or classes. This thesis investigates and proposes strategies for the generalization of SVMs to problems with more than two classes, known as multiclass problems. The focus of this work is on strategies that decompose the original multiclass problem into multiple binary subtasks, whose outputs are then combined to obtain the final classification. The proposed strategies aim to investigate the adaptation of the decompositions for each multiclass application considered, using information of the performance obtained for its solution or extracted from its examples. The implemented algorithms were evaluated on general datasets and on real applications from the Bioinformatics domain. The results obtained open possibilities of many future work. Among the benefits observed is the obtainment of simpler decompositions, which require less binary classifiers in the multiclass solution. algoritmos genéticos árvores geradoras mínimas Bioinformática problemas multiclasses Bioinformatics genetic algorithms minimum spanning trees multiclass problems support vector machines
527	Caracterização in silico de microssatélites no genoma do arroz e análise comparativa com outras espécies vegetais. / In silico characterization of microsatellites in the rice genome and comparative analysis to other plant species. Maia, Luciano Carlos da 03 July 2009 (has links) Made available in DSpace on 2014-08-20T13:25:42Z (GMT). No. of bitstreams: 1 Tese_Luciano_Carlos_da_Maia.pdf: 871025 bytes, checksum: fcb02e5ff38b9223264b40df7fe04318 (MD5) Previous issue date: 2009-07-03 / Molecular markers have been successfuly applied in genetic mapping and marker assisted selection as an auxiliary tool for plant breeding and transfer of genetic information among related species. In this sense, the understanding of genome elements occurring in important crop species such as wheat, rice and maize can be used towards the improvement of basic knowledge in orphan grass species. Rice, after the completion of its genome sequence, has been proposed as a genetic model in the grasses. Among the different types of molecular markers, microsatellites have been indicated as the preferred class for such studies. In general, the strategy of transposing molecular markers between species still poses some questions/difficulties regarding the most conserved microsatellite patterns among plant species, genera and families. This study had as objective to use bioinformatic tools to characterize microsatellites from rice and other Grass species of economical importance, enabling the prediction of microsatellite patterns that are most promising in transfer strategies. Three studies were performed. The first was concerned about developping and validating a microsatellite searching tool plus primer design and PCR simulation. A database containing 28,469 fl-cDNA sequences originating from japonica rice genome was used. From a total of 3,907 microsatellite loci, 3,329 primer pairs were designed and tested using the simulated PCR feature showing that only 2,397 (72%) of pairs amplified in specific regions. The second study had as objective to describe the occurrence of microsatellites in expressed regions originating from ten species from three different plant families. The results indicated the frequency and patterns of occurrence of microsatellites within and between the different families. The third study had as objective to characterize the complete occurrence of microsatellites in the rice genome. The results showed a different pattern of occurrence of microsatellites for the different chromosomes and which arrangements are most abundant. Inferences on which elements allow better genome coverages are discussed. / Marcadores moleculares têm sido utilizados com sucesso em mapeamento genético e seleção assistida como uma ferramenta auxiliar para o melhoramento de plantas e transferência de informações entre espécies relacionadas. Neste sentido, o entendimento da ocorrência de microssatélites no genoma nas diferentes espécies melhoradas como trigo, arroz e milho pode ser utilizado no sentido da melhoria do conhecimento básico das espécies gramíneas descritas como “orfãs”. O arroz, após a conclusão do seqüênciamento do seu genoma, tem sido proposto como modelo genético entre as gramíneas. Dentre os diferentes tipos de marcadores moleculares, os microssatélites são indicados como a classe preferida para estes estudos. De maneira geral, as estratégias de transposição de marcadores moleculares entre espécies ainda apresentam algumas dificuldades e questionamentos referentes os padrões mais conservados de microssatélites entre espécies, genêro e famílias vegetais. Este estudo teve como objetivo, o uso de ferramentas de bioinformática para caracterizar microssatélites oriundos do genoma do arroz e outras espécies, possibilitando predizer padrões de microssatélites mais promissores na transferência. Três estudos foram realizados. O primeiro consistiu no desenvolvimento e validação de uma ferramenta para localização de microssatélites, desenho de iniciadores e simulação da PCR. Foi utilizado um banco de dados contendo 28.469 seqüências fl-cDNA de arroz japonica. Do total de 3.907 loci encontrados, foram desenhados 3.329 conjuntos de iniciadores e testados pela simulação da PCR, mostrando que somente 2.397 (72%) iniciadores amplificaram regiões específicas. No segundo estudo foi analisada a ocorrência de microssatélites em regiões expressas de dez espécies de três diferentes famílias de plantas. Os resultados indicaram a freqüência e padrões de microssatélites dentro e entre as diferentes famílias. No terceiro estudo foi feita a caracterização de microssatélites no genoma completo do arroz. Os resultados mostraram um conservado padrão de ocorrência dos diferentes microssatélites nos diferentes cromossomos e quais os arranjos foram os mais abundantes. Inferências sobre quais elementos permitem a melhor cobertura do genoma foram discutidas. Oryza sativa subsp. japonica Simple sequence repeat Microsatélites Bioinformática Genômica Melhoramento vegetal Gramíneas Bioinformatics Genomics Plant breeding Grasses CNPQ::CIENCIAS AGRARIAS::AGRONOMIA
528	ANÁLISE DA INTERAÇÃO PROTEICA NA EVOLUÇÃO DO CÂNCER Rodrigues, Luiz Henrique Rauber 30 March 2015 (has links) Submitted by MARCIA ROVADOSCHI (marciar@unifra.br) on 2018-08-16T19:48:44Z No. of bitstreams: 2 Dissertacao_LuizHenriqueRauberRodrigues.pdf: 17209406 bytes, checksum: f1f5406222de4f0c348643f546a9a971 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-08-16T19:48:44Z (GMT). No. of bitstreams: 2 Dissertacao_LuizHenriqueRauberRodrigues.pdf: 17209406 bytes, checksum: f1f5406222de4f0c348643f546a9a971 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2015-03-30 / Dysplasia such as cancer can be identified by expression patterns involving mechanisms genome maintenance pathways (GMM). Activation pathways involved in the cell cycle (CC), in the DNA damage response (DDR) and apoptosis (APO), significantly contribute to tumor development. In previous studies, it was found that the precancerous activation process there is an anticancer barrier which is responsible for prevention of tumor progression. The identification of more expressed genes during activation of the anti-cancer barrier, with interactions associated GMM, is a complementary study of the way to evolution of cancer. In this work, the objective was investigate the anti-cancer barrier activation in pre-cancer and cancer, in tissues of adrenal gland, colon, pancreas and thyroid follicles, using networks of interaction between proteins. To describe this barrier was proposed modeling the interaction networks between proteins GMM routes with Cytoscape software. The results obtained with the most important genes in expression and quantity of interactions were compared with the results of previous publications and reconfirmed the relevance of genes CDKN1A, CHEK1, ATR, P53, MRE11A, BRCA1 and XRCC4. Through analysis allowed the identification of other genes, complementary to previous studies, as SKP2, CCNO, FADD, RAD50, NBN, BIRC3, CDK2 and XRCC6. These genes are associated with and complement activation studies of anti-cancer barrier. These considerations emphasize that it is important to observe all systemic biological context, soaking, as in nanoscience where the study makes sense to take into account the interactions. Analyses of interactions enable the development of future work, for example, treatment with drugs nanocapsules, activating or inhibitory acting proteins such as interlocking routes GMM, or nanosensors to monitor the development of cancer. / Displasias como o câncer podem ser identificadas por padrões de expressão envolvendo vias de mecanismos de manutenção do genoma (GMM). A ativação de vias GMM envolvidas em ciclo celular (CC), resposta ao dano no DNA (DDR) e apoptose (APO) contribuem significativamente para o desenvolvimento tumoral. Em estudos anteriores, verificou-se que em processos pré-cancerosos há ativação de uma barreira anti-câncer que é responsável pela prevenção da progressão tumoral. A identificação dos genes mais expressos durante a ativação da barreira anti-câncer, associadas as interações nas vias GMM, tornam-se uma complementariedade ao estudo da evolução do câncer. Neste trabalho, o objetivo foi investigar a ativação da barreira anti-câncer, em pré-câncer e em câncer, presentes em tecidos da glândula adrenal, cólon, pâncreas e folículos da tireoide, usando redes de interação entre proteínas. Para descrever esta barreira foi proposta a modelagem das redes de interação entre as proteínas das vias GMM usando o software Cytoscape. Os resultados obtidos com os genes mais destacados em expressão e quantidade de interações foram comparados com os resultados de publicações anteriores e reconfirmaram a relevância dos genes CDKN1A, CHEK1, ATR, TP53, MRE11A, XRCC4 e BRCA1. A análise por vias permitiu a identificação de outros genes complementares aos trabalhos anteriores como os genes SKP2, CCNO, FADD, RAD50, NBN, BIRC3, CDK2 e XRCC6. Estes genes estão associados e complementam os estudos sobre a ativação da barreira anti-câncer. Estas considerações realçam que é importante observar todo o contexto biológico sistêmico, imersivo, assim como ocorre na nanociência, onde o estudo tem sentido se levar em consideração as interações. As análises sobre as interações permitirão o desenvolvimento de trabalhos futuros, por exemplo, tratamentos com fármacos nanoencapsulados, atuando de forma ativadora ou inibidora de proteínas interconectadas nestas vias GMM, ou nanosensores, para o acompanhamento da evolução do câncer. Biociências e Nanomateriais
529	Characterization of genes involved in lignin biosynthesis in Tectona grandis / Caracterização de genes envolvidos na biossíntese de lignina em Tectona grandis Esteban Galeano Gómez 06 March 2015 (has links) Teak tree (Tectona grandis L.f.) has a high value in the timber trade for fabrication of woody products due to its extraordinary qualities of color, density and durability. Despite the importance of this species, genetic and molecular studies available are limited. Also, the lack of molecular information about secondary xylem and tree maturation has hindered genetic exploration of teak. Therefore, gene expression studies and transcriptomic profiling are essential to explore wood formation and lignin biosynthesis through the development and aging of vascular plants. Aiming the gene expression studies, it was essential to identify and clone reference genes for teak. Eight genes were tested, commonly used in qRT-PCR, including TgRP60S, TgCAC, TgACT, TgHIS3, TgSAND, TgTUB, TgUBQ and TgEF1a. Expression profiles of these genes were evaluated by qRT-PCR in six tissue and organ samples (leaf, flower, seedling, root, stem and branch secondary xylem). Stability validation by NormFinder, BestKeeper, geNorm and Delta Ct programs showed that TgUBQ and TgEF1a are the most stable genes to use as qRT-PCR reference genes in teak in the conditions tested. Due to the availability of 12- and 60-year-old teak trees, RNA-seq was performed in diferent organs (seedlings, leaves, flowers, root, stem and branch secondary xylem). A total of 462,260 transcripts were obtained by assembling with \"Trinity\" software. Also, 1,502 and 931 genes differentially expressed were identified for stem and branch secondary xylem, respectively, using DESeq program, and MYB transcription factors, which were characterized. TgMYB1 amino acid sequence displayed a predicted coiled-coil (CC) motif while TgMYB2, TgMYB3 and TgMYB4 showed R2R3-MYB domain. All of them were phylogenetically grouped with several gymnosperms and flowering plants. High expression of TgMYB1 and TgMYB4 in lignified tissues of 60-year-old trees was observed. In this work, the Cinnamyl Alcohol Dehydrogenase (CAD) gene family was also studied. One complete (TgCAD1) and three partial (TgCAD2 to TgCAD4) members were characterized. The four enzymes presented residues for catalytic and structural zinc action, NADPH binding and substrate specificity, consistent with the mechanism of alcohol dehydrogenases. TgCAD3 and TgCAD4 were highly expressed in young and mature sapwood and seem to be duplicated and highly related with lignin biosynthesis. Tree genetic improvement, marker-assisted selection and plant transformation seem to be promising lines of research for the data obtained from this research. This is the first study addressing gene characterization and expression, phylogeny and transcriptomic profiling in teak. / A árvore de teca (Tectona grandis L.f.) tem alto valor no comércio de madeira para a fabricação de produtos lenhosos, devido às suas qualidades extraordinárias de cor, densidade e durabilidade. Apesar da importância desta espécie, são poucos os estudos genéticos e moleculares disponíveis. Também, a falta de informação molecular sobre xilema secundário e maturação da árvore tem dificultado a exploração genética de teca. Assim, estudos de expressão gênica e perfis transcricionais são relevantes para explorar a formação da madeira e a biossíntese de lignina durante o desenvolvimento e envelhecimento das plantas vasculares. Visando os estudos de expressão gênica, foi essencial identificar e clonar genes de referencia para a teca. Foram testados oito genes comumente usados em qRT-PCR, TgRP60S, TgCAC, TgACT, TgHIS3, TgSAND, TgTUB, TgUBQ e TgEF1a. Perfis de expressão destes genes foram avaliados por qRT-PCR em seis amostras de tecidos e órgãos (folhas, flores, plântulas, raiz, xilema secundário de caule e ramo). A validação da estabilidade pelos programas NormFinder, BestKeeper, geNorm e Delta CT mostrou que TgUBQ e TgEF1a são os genes mais estáveis para usar como genes de referência em teca nas condições testadas. Em virtude da disponibilidade de árvores de teca de diferentes idades, entre 12 e 60 anos, foi realizado o RNAseq de diferentes órgãos (plântulas, folhas, flores, raiz, ramos e caules de árvores de 12 e 60 anos). Obteve-se um total de 462.260 transcritos pela montagem com o software \"Trinity\". Foram identificados 1.502 e 931 genes diferencialmente expressos para xilema secundário de caule e ramo, respectivamente, utilizando o programa DESeq e fatores de transcrição MYB, que foram posteriormente caracterizados. A sequência de aminoácidos do TgMYB1 exibiu um motivo \"coiled-coil\" (CC), enquanto TgMYB2, TgMYB3 e TgMYB4 mostraram domínio R2R3-MYB. Todos eles foram filogeneticamente agrupados com várias gimnospermas e angiospermas. Observou-se alta expressão do TgMYB1 e TgMYB4 em tecidos lignificados de árvores de 60 anos de idade. Neste trabalho também foi estudada a família gênica Cinamil álcool desidrogenase (CAD). Foi caracterizado um membro completo (TgCAD1) e três parciais (TgCAD2 a TgCAD4). As quatro enzimas apresentaram resíduos de ação catalítica e estrutural de zinco, de ligação ao NADPH e de especificidade de substrato, em conformidade com o mecanismo conservado de álcool desidrogenases. TgCAD3 e TgCAD4 foram altamente expressos no alburno jovem e maduro e parecem estar duplicados e relacionados com a biossíntese de lignina. O melhoramento genético de árvores, a seleção assistida utilizando marcadores moleculares e a transformação de plantas parecem ser linhas promissoras de pesquisa, a partir dos dados obtidos nesta pesquisa. Este é o primeiro estudo sobre caracterização e expressão gênica, filogenia e perfis transcricionais em teca. Bioinformática Fatores de transcrição PCR em tempo real RNAseq Via fenilpropanóide Xilema secundário Bioinformatics Phenylpropanoid pathway Quantitative real-time PCR RNAseq Secondary xylem Transcription factors
530	Do laboratório ao campo virtual: desenvolvimento de um banco de dados de venenos de serpentes brasileiras e análise computacional de estruturas primárias de fosfolipases A2 / From the laboratory to the virtual field: development of a Brazilian-snake venom database and computational analysis of phospholipase A2 primary structures Saulo França Amui 25 October 2006 (has links) Os avanços tecnológicos vêm contribuindo cada vez mais nas áreas biológicas e científicas oferecendo ferramentas computacionais e sistemas específicos que em análise de dados in silico fornecem resultados rápidos e confiáveis. O presente projeto propõe o desenvolvimento de um portal na Internet para instalação e utilização de um banco de dados laboratoriais das principais serpentes brasileiras com seus respectivos venenos e antivenenos naturais, e a análise dos dados obtidos em ensaios farmacológicos, e bioquímicos. Utilizando a via de comunicação e interação mais simples atualmente, a Internet permite o compartilhamento de dados entre comunidades de pesquisadores, viabilizando recursos e tempo, além de permitir uma significante interação entre pesquisadores de todo o mundo, principalmente brasileira, na troca de informações e compartilhamento de dados. Dados elementares relacionados às serpentes foram armazenados no banco de dados, bem como as atividades tóxicas, farmacológicas e enzimáticas dos componentes dos venenos, e ainda, as aplicações biotecnológicas dos produtos que podem ser obtidos destes venenos, abrangendo ainda dados clínicos e valores estatísticos dos acidentes ofídicos. Aspectos bioquímicos dos ensaios realizados em laboratório permitiram a construção de uma ferramenta para análise comparativa de estruturas primárias de PLA2s, depositadas em bancos de dados internacionais. Além da interatividade entre pesquisadores, em Fóruns de Discussões, o sistema conta com listas dos principais artigos publicados em periódicos indexados, e devidamente atualizados periodicamente, com revisões bibliográficas. / Technological advances have been contributing, more and more, with biological and scientific areas, offering computational tools and specific systems which in silico data analysis supply reliable and fast results. The present project considers the development of an Internet portal for installation and use of laboratory data base for the main Brazilian serpents, with its respective venom and natural anti-venom, and the analysis of obtained data in pharmacological assays and biochemists. Using the easiest way of communication and interaction, the Internet allows sharing of data and information between communities of researchers around the world, especially for Brazilian researchers, making resources and time possible. Elementary data about serpents have been stored in the data base, as well as toxic, pharmacological and enzymatic activities of venom components, besides biotechnological applications of the products that can be obtained from these venom, enclosing clinical data and statistical values of ophidian accidents. Biochemists aspects of the assays carried through in laboratory allowed the construction of a comparative analysis tool for primary structures of PLA2s, deposited in international data bases. Beyond interactivity between researchers, in discussion forums, the system counts with lists of main articles published in indexed periodic, duly and constantly updated with bibliographical revisions. anti-toxinas. banco de dados bioinformática ensaios enzimáticos e farmacológicos fosfolipases A2 toxinas e enzimas venenos de serpentes anti-toxin bioinformatics database enzymatic and pharmacological assays phospholipase A2 snake venom toxins and enzymes

Search results