• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 28
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 566
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 43
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
311

Formalização de uma linguagem visual para descrição de sistemas biológicos / Formalization of a visual language to specify biological pathways

Medrado, Ramon Gomes January 2009 (has links)
Vias biológicas representam interações entre entidades químicas complexas (proteínas, substratos, metabólitos etc.) que ocorrem no nível molecular das células. A representação e compreensão do comportamento destas vias é o principal alvo de estudos da Biologia Sistêmica. Esta área de estudos envolve a construção de modelos matemáticos que possam simular in silico (computacionalmente) o comportamento destes sistemas biológicos verificados in vivo (experimentalmente). Do ponto de vista computacional é evidente que tais sistemas são complexos para abordar e descrever de modo intuitivo. São necessários modelos com valor preditivo, isto é, que permitam descrever os comportamentos do sistema que são experimentalmente verificáveis. Algumas notações gráficas foram propostas para descrever vias biológicas. Entre elas, os diagramas de processos tem sido amplamente utilizados. Um diagrama de processos é essencialmente um grafo no qual vértices e arestas representam componentes biológicos, e há uma notação gráfica associada com cada elemento. Nesta dissertação propomos uma fundamentação formal para a linguagem dos diagramas de processos definindo a sintaxe usando gramática de grafos. Nós definimos primeiramente um grafo chamado BioProc, descrevendo o meta-modelo dos diagramas de processos. Instâncias do grafo BioProc são portanto diagramas de processos modelando vias biológicas. Para descrever a semântica foi proposta uma tradução algébrica dos grafos BioProc para redes de Petri estocásticas generalizadas (GSPNs) já amplamente utilizadas na modelagem de processos biológicos. O uso de gramática de grafos como formalismo intermediário na tradução habilita a verificação sintática da via com a checagem dos tipos válidos que podem ser definidos para cada reação antes da simulação na rede de Petri e usá-las posteriormente para explorar propriedades estruturais e estocásticas do modelo. Além disso serve como base para a evolução do modelo proposto. Isto é relevante já que modelos frequentemente são construídos incrementalmente para se adaptar a novos requisitos e/ou incluir novas características. / Biological pathways represent interactions between complex chemical entities (proteins, substrates, metabolites, etc.) that occur at the molecular level of cells. The representation and comprehension of biological pathways behavior is the main target of research in the field of Systems Biology. This area investigates the construction of mathematical models that can simulate in silico (computationally) the behavior of biological systems checked in vivo (experimentally). From a computational view point it is clear that such systems are too complex to analyze and describe in an intuitiveway. Models with predictive value are needed, describing the behaviors that are experimentally verifiable. There are some graphical notations to describe biological pathways. Among them, process diagrams have been widely used. A process diagram is essentially a graph in which vertices and edges represent biological components, and there is a graphical notation associated with each element. In this master thesis we give a formal foundation for biological process diagrams, by defining their (concrete and abstract) syntax and semantics using a formalism called graph grammars. We first build a graph called BioProc Graph, describing the meta-model of process diagrams. Instances of this BioProc graph are concrete process diagrams modeling biological pathways. To describe the semantics we proposed a translation of BioProc diagrams to generalized stochastic Petri networks (GSPNs) already widely used in modeling biological processes. The use of graph grammar formalism as a basis for translation enables the syntatic verification to check the valid types that can be defined for each reaction after the simulation of Petri net and before that to explore structural and stochastic properties of the model. In addition it serves as the basis for model evolution proposed. This is relevant because models are often built incrementally to adapt to new requirements and/or include new features.
312

Arquitetura neural para controle da locomoção de um robô quadrúpede baseada em referências biológicas / Neural Architecture for the Locomotion Control of a Quadruped Robot Based on Biological References

Basso, Daniel Monteiro January 2005 (has links)
A natureza é uma fonte inesgotável de soluções elegantes para os mais diversos problemas, da aparente simplicidade do formato do ovo, que garante maior segurança ao organismo em desenvolvimento, à evidente complexidade do sistema nervoso humano, que é capaz de pensar sobre problemas e encontrar soluções para eles. Neste trabalho foram aplicados modelos computacionais inspirados em estudos neurológicos para a realização da locomoção de um robô quadrúpede. O corpo do robô foi simulado, permitindo incorporar características mais semelhantes às de um animal do que seria possível com um robô de verdade, como grande quantidade de articulações e força dos motores. A arquitetura neural responsável pelo controle do robô teve como referência para seu desenvolvimento os Geradores Centrais de Padrões, que são circuitos neurais capazes de gerar a seqüência de ativações musculares envolvidas em diversos movimentos rítmicos, como respirar e caminhar, e estão em sua maioria localizados na medula espinhal. Para compor esta rede foi usado um modelo de neurônio com algumas propriedades encontradas em um neurônio real, como a capacidade de inibir a ativação de outros neurônios, e outras puramente matemáticas, tornando-o uma ferramenta versátil para incorporar a funcionalidade de outros modelos de neurônios e de redes neurais. Trabalhos futuros farão uso dos resultados desta pesquisa como base para abordar temas mais complexos, como planejamento motor e tomada de decisão. / Nature is an endless source of elegant solutions to every kind of problem, from the seeming simplicity of the egg’s shape, which assures a safer environment to the developing organism, to the evident complexity of the human nervous system, which is capable of thinking about problems and finding solutions to them. In this work some computational models inspired on neurological research were applied to achieve the locomotion of a quadruped robot. The robot’s body was simulated, allowing to have features more similar to their animal counterparts than would be possible using a real robot, such as the high amount of articulations and the motors’ strength. The neural architecture responsible for the robot’s control was developed using Central Pattern Generators as reference, which are neural circuits capable of generating the sequence of muscle activations involved in a variety of rhythmic movements, such as breathing and walking, and are mostly located in the spine. To assemble this network a neuron model was used which has some properties found on a real neuron, as the ability to inhibit other neurons’ activation, and others purely mathematical, making it a versatile tool to incorporate the functionality of other neuron and neural networks models. Future works will make use of these research’s results as a base to approach more complex problems, such as motor planning and decision making.
313

Um sistema baseado em agentes para re-anotação de genomas / An agent-based system for re-annotation of genomes

Nascimento, Leonardo Vianna do January 2005 (has links)
A análise da informação contida em seqüências genéticas tem ganho cada vez mais importância nos dias atuais. A chamada anotação genética tem o objetivo de, a partir de uma ou mais seqüências, determinar suas características estruturais e funcionais. Muitos processos de anotação já foram realizados com êxito aumentando consideravelmente nosso conhecimento acerca do mecanismo genético de diversos organismos. A re-anotação genética é um processo que visa revisar o resultado da anotação, em virtude da disponibilidade de novas informações. Neste trabalho foi desenvolvido um sistema de re-anotação automática, onde tarefas de análise repetitivas podem ser automatizadas e os dados na anotação re-analisados periodicamente, a fim de que possíveis modificações possam ser detectadas. O sistema é baseado na tecnologia de agentes. Cada agente é responsável pela execução de diferentes ferramentas de bioinformática. Ao final do processo, os resultados individuais são combinados a fim de atingir o objetivo da análise. O sistema demonstrou eficácia na análise realizada em organismos procariontes durante a fase de validação. Ambientes de re-anotação como este são ferramentas interessantes a serem futuramente integradas a sistemas de anotação existentes. / The analysis of the information present in genetic sequences is gaining more importance nowadays. The genetic annotation aims to determine structural and functional characteristics of the sequences. Many annotation processes have already been carried out, improving our knowledge about the genetic mechanism of several organisms. The genetic re-annotation is a process that aims to review the annotation results when new information is available. This work presents an automatic re-annotation system where repetitive analysis tasks can be automated and annotation data are periodically re-analysed in order to detect possible differences. The system is based on the agent technology and each agent must execute different bioinformatics tools and merge its results in order to reach the analysis goals. The system proved to be efficient on the analysis carried out in procariotic organisms in the validation process, becoming an interesting tool to be integrated in annotation systems in the future.
314

Modelagem e simulação de algoritmos paralelos baseados em operações com DNA / DNA-Based modelling and simulation of parallel algorithms

Cervo, Leonardo Vieira January 2002 (has links)
A área de biologia computacional está vivendo um crescimento rápido causado pela revolução no estudo de genômas e pelo avanço das técnicas de manipulação do material genético. Com essas novas tecnologias para manipulação de seqüências, a importância de achar uma solução eficiente para os problemas chamados de intratáveis também cresceu, pois muitos problemas envolvidos na análise de DNA pertencem a essa classe de problemas. Uma abordagem para achar essas soluções é usar o próprio DNA para realizar computação, aproveitando o paralelismo massivo utilizado em operações que manipulam seqüências de DNA. Isto é estudado na área de computação com DNA. Esse trabalho propõe um modelo formal para representar a estrutura da molécula de DNA e das operações que são realizadas com ela em laboratório. Este modelo ajuda a preencher a necessidade de uma descrição matemática que possa ser usada para analisar algoritmos baseados em DNA, assim como possibilitar a simulaç~o desses algoritmos em um computador. Foi utilizada a teoria de gramáticas de grafos, uma linguagem de especificação formal, para modelar as seqüências de DNA e suas I operações. O trabalho apresenta um estudo da estrutura da molécula de DNA, deScrevendo suas características e as principais operações que são realizadas para sua manipulação em laboratório. Uma descrição da teoria de Gramática de Grafos e sua aplicação também é apresentada. Para validação do modelo proposto as especificações resultantes foram adaptadas para o formato L-systems, outra linguagem de especificação formal, permitindo realizar a simulação da especificação no ambiente L-Studio. / The area of computational biology is living a fast growth, fed with a revolution in the study of genomes and with the advance in the techniques of genetic material manipulation. With these new technologies for manipulation of sequences, the relevance of finding efficient solution to the so-called computer intractable problems has also grown, because many problems involved in analyzing DNA belong to this class of problems. One approach to find such solutions is to use DNA itself to perform computations, taking advantage of the massive parallelism involved in operations that manipulate DNA sequences. This is what is studied in the area ofDNA computing. This work proposes a formal model to represent the DNA structure and the operations performed in laboratory with it. This model helps to fill the need of a mathematical description that can be used to analyze DNA-based algorithms, as well as for simulating such algorithms in a computer. We use graph grammars, a formal specification language, to model the DNA sequences and operations. The work presents a study of the DNA molecule structure, describing its features and the main operations performed for manipulation in laboratory. A description of the theory of Graph Grammars and its application are presented too. To validate the proposed model, the resulting DNA-graph grammar specifications are then translated into the L-systems format, another formal specification language, allowing for the simulation of the specifications using the L-Studio environment.
315

Identificação das bases genéticas nas calcificações idiopáticas em gânglios da base do cérebro (IBGC) e screening de variações candidatas na Doença de Alzheimer

Lemos, Roberta Rodrigues de 31 January 2012 (has links)
Submitted by Amanda Silva (amanda.osilva2@ufpe.br) on 2015-04-08T14:22:20Z No. of bitstreams: 2 122Tese Roberta final Bib Central.pdf: 5487110 bytes, checksum: 1c6bb6e8403d263eac35107f5ca76519 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-04-08T14:22:20Z (GMT). No. of bitstreams: 2 122Tese Roberta final Bib Central.pdf: 5487110 bytes, checksum: 1c6bb6e8403d263eac35107f5ca76519 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2012 / CAPES; FACEPE; PROPESQ-UFPE / A Degeneração Neuronal (DN) é um processo complexo e multifatorial, presente em várias desordens neuropsiquiátricas, como a Doença de Fahr (DF) e a Doença de Alzheimer (DA), entre outras. Este trabalho teve como objetivo, estudar fatores de risco genéticos, em dois modelos de doenças neurodegenerativas, através de sequencimentos e métodos de bioinformática. O screening de genes e variações candidatas foi realizado através de Reação em Cadeia da Polimerase (PCR), seguido de Sequenciamento Automático Direto do DNA. Para a DF, também conhecida como Calcificação Idiopática dos Gânglios da Base (IBGC) dois genes foram investigados, o gene MGEA6/CTAGE lócus IBGC1 e o gene SLC20A2 lócus IBGC3. As variações candidatas para DA foram selecionadas a partir de um pipeline de bioinformática, onde informações genéticas de diferentes bancos de dados foram integradas, sendo os principais genes estudados: COX-2, IL1a e CD83. Os resultados das genotipagens não identificaram, em ambos os grupos de controles e afetados, a variação Pro521Ala (rs36060072) / MEGEA6 lócus IBGC1. Essas genotipagens contribuíram para a diminuição da freqüência alélica mínima dessa variante, demonstrando o quanto ela é rara e ausente nessa amostra da população Brasileira. Para o segundo lócus analisado, IBGC3 gene SLC20A2, os achados tem mostrado novas variações em diferentes exons e estes estão associadas a mais de 40% das famílias com IBGC analisadas. No entanto, algumas famílias recrutadas foram excluídas para esses dois loci, sugerindo adicional heterogeneidade genética. Paralelamente, os resultados do ensaio experimental do screening das variações candidatas para DA, só foi permito em parte, pois apenas variações do tipo SNPs: “rs2745557”_COX2 (exon 1) e “rs17561”_IL1A (exon5), foram detectadas, sendo a grande maioria das variações preditas, INDELs (1 a 10pb), não encontradas. O desafio atual é aperfeiçoar os métodos de sequenciamentos, principalmente através do uso novas plataformas de sequenciamentos. Há uma grande expectativa de que um melhor entendimento, das bases biológicas destes dois distúrbios investigados, possa contribuir para a compreensão amplamente de outras doenças neuropsiquiátricas.
316

Uma abordagem de alinhamento múltiplo de sequências utilizando evolução diferencial

SILVA JÚNIOR, Antônio Luiz Vieira da 27 February 2015 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-03-30T17:14:18Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) ANTONIO.pdf: 1896299 bytes, checksum: 6648d14ae9c1893123a82366b851c19a (MD5) / Made available in DSpace on 2016-03-30T17:14:18Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) ANTONIO.pdf: 1896299 bytes, checksum: 6648d14ae9c1893123a82366b851c19a (MD5) Previous issue date: 2015-02-27 / CAPES / Alinhamento Múltiplo de sequências (MSA) é uma das tarefas mais importantes em bioinformática. A MSA é uma técnica fundamental para o estudo da função, estrutura e evolução de biomoléculas. A partir do uso de métodos de MSA é possível a criação de modelos estatísticos para a classificação de famílias de proteína , análise filogenética e a previsão de estruturas secundárias de proteínas. Como trata-se de um problema do tipo NP-difícil, torna-se inviável o uso de métodos exatos para a busca da melhor solução. Por isso, é importante o uso de métodos de optimização baseado em heurística para resolver o problema de MSA. Nesta dissertação, propomos uma abordagem para alinhamento múltiplo de sequências por meio da otimização de uma função objetivo utilizando Evolução Diferencial. Embora a ideia de usar algoritmos evolutivos não seja nova, a abordagem apresentada difere pelo uso da Evolução Diferencial e pela definição do alinhamento como uma dispersão de lacunas ao longo das sequências, sem levar em consideração fenômenos biológicos, como os de inserção ou surgimento de bases, deleção ou mutação de bases. A solução proposta tem provado ser capaz de fazer melhorias significativas em alinhamentos quando comparadas com o método do estado da arte Clustal. / Multiple sequence alignment (MSA) is one of the most important tasks in bioinformatics. The MSA is a fundamental technique to the study of function, structure and evolution of biomolecules. By using of MSA methods it’s possible to create statistical models for classification of protein families, phylogenetic analysis and the prediction of secondary structures of proteins. Being a NPhard problem, it is infeasible due to its completely, the use of exact methods to search for optimal solutions. Because of this it is important to use heuristic-based optimization methods to solve the MSA problem. In this dissertation, we propose an approach to multiple sequence alignment by optimizing an objective function using Differential Evolution. Although the idea of using Evolutionary Algorithms is not new, the approach presented differs from the use of Differential Evolution and definition of alignment as a dispersion of gaps along the sequences, without considering biological events such as insertion or emergence of bases, deletion or mutation of bases. The proposed solution has proven to be able to make significant improvements in alignments when compared to the state-of-the art Clustal method.
317

Análise de polimorfismos genéticos, simulação proteômica e de painéis moleculares relacionados à degeneração neuronal

Ricardo Mendes de Oliveira, João January 2004 (has links)
Made available in DSpace on 2014-06-12T15:53:08Z (GMT). No. of bitstreams: 2 arquivo5101_1.pdf: 2688583 bytes, checksum: ec5016fd9265d3875ca7a0f2016ec186 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2004 / A degeneração neuronal (DN) é um fenômeno complexo, induzido por diversos fatores e presente em várias doenças neuropsiquiátricas tais como a doença de Alzheimer, doença de Fahr (DF) e esclerose lateral amiotrófica (ELA). No entanto, pouco se conhece sobre os fatores de risco genético para doenças neurodegenerativas. Atualmente tenta-se definir os painéis moleculares genéticos relacionados com a DN através do uso de diversas técnicas de biologia molecular e de bioinformática. O propósito deste estudo é utilizar várias dessas técnicas para investigar polimorfismos genéticos em doenças que se apresentem com DN, tais como a DF e a ELA. Análises de ligação em famílias com DF sugerem a presença de heterogeneidade genética, clínica e de neuroimagem, mesmo dentro da mesma família. Durante a caracterização deste processo foi identificado mais uma família com DF possivelmente ligada ao cromossomo 14 e um novo gene intitulado TULIP1. Além disso, com o auxílio de análise paramétrica e não paramétrica foi mapeado o gene no cromossomo 20 para uma extensa família com ELA. Após a identificação da mutação propriamente dita foi possível simular as alterações tridimensionais na estrutura da proteína sintetizada pelo gene mutado. Esses estudos sugerem que diversos grupos de genes atuam no processo de DN
318

Comparação metodológica de abordagens in silico no estudo de moléculas antiofídicas através de sua ação em toxinas isoladas de venenos de serpentes

RABELLO, Marcelo Montenegro January 2012 (has links)
Submitted by Caroline Falcao (caroline.rfalcao@ufpe.br) on 2017-04-04T19:45:56Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) 2012-Dissertação-MarceloRabello.pdf: 28475883 bytes, checksum: a9615b2d4a3b20d9263dba3af92c324c (MD5) / Made available in DSpace on 2017-04-04T19:45:56Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) 2012-Dissertação-MarceloRabello.pdf: 28475883 bytes, checksum: a9615b2d4a3b20d9263dba3af92c324c (MD5) Previous issue date: 2012 / Este projeto pode ser resumido como uma comparação metodológica de abordagens in silico, mais precisamente de docking molecular. Foram utilizadas como alvos biológicos as fosfolipases A2 (PLA2), sendo estas um grupo de toxinas presentes abundantemente em venenos de serpentes. Foram utilizadas, como ligantes (potenciais inibidores), um total de 103 moléculas conhecidas na literatura. Um banco de dados com os ligantes e alvos foi construído, agregando-se informações sobre a atividade biológica e também suas respectivas estruturas tridimensionais. Os programas AUTODOCK, AUTODOCK VINA, GOLD, DOCK, SURFLEX e PLANTS foram utilizados para gerar os resultados de docking. O programa BINANA foi utilizado na análise das interações intermoleculares presentes nos complexos ligante-receptor, obtidos como resultados dos cálculos. Os dados gerados foram analisados com métodos multivariados, como por exemplo, a Análise de Componentes Principais (PCA) e a Análise Hierárquica de Clusters (HCA). Resíduos de aminoácidos, importantes para a estabilidade do complexo ligantereceptor, também foram identificados através de uma análise detalhada dos melhores resultados. Adicionalmente, foi reportado um artigo publicado, envolvendo PLA2s, com foco especial na molécula Quercetina como inibidor dos efeitos de veneno de serpente. Foi possível identificar os programas que apresentaram menor demanda computacional na análise comparativa de seus tempos de processamento, o que pode vir a ser muito útil em futuros estudos de docking, até mesmo com um número ainda maior de ligantes e alvos que podem ser submetidos ao procedimento de docking molecular, no intuito de aumentar o banco de dados de inibidores potenciais de PLA2s. As abordagens analíticas multivariadas utilizadas foram capazes de revelar aspectos interessantes sobre as semelhanças e diferenças entre os resultados de docking obtidos. Com a aplicação destas análises, pôde-se estabelecer uma metodologia de análise para a interpretação dos resultados nas escalas visual, numérica e gráfica, através, respectivamente, da geração das imagens para visualização molecular, das análises estatísticas (multivariadas) e da elaboração dos gráficos provenientes destas análises. Este estudo foi importante para aumentar a base de conhecimento do nosso grupo de pesquisa, e da comunidade científica como um todo, a respeito dos cálculos de modelagem molecular que envolvem os métodos de docking, e certamente serão úteis em estudos futuros com PLA2s ou outros alvos farmacológicos. / This project can be summarized as a methodological comparison of in silico approaches, more precisely between docking methods. Several phospholipase A2 (PLA2), a group of toxins abundantly present in snake venoms, were used as targets. A total number of 103 molecules were used for the definition of the ligands. It was built a database with all these ligands, adding information about their activity and also their three-dimensional structures. The programs AUTODOCK, AUTODOCK VINA, GOLD, DOCK, SURFLEX and PLANTS were used in docking calculations. The program BINANA was used to analyze the intermolecular interactions present in the ligand-receptor complexes obtained as poses from docking results. The data generated by BINANA was statistically analyzed by applying multivariate analysis methods, such as principal component analysis (PCA) and hierarchical cluster analysis (HCA). Important aminoacids residues for the stability of the complex ligandreceptor were indetified through a detailed analysis of the best results. Additionally, an article was reported, involving PLA2s, with special focus on the Quercetin molecule as an inhibitor of snake venom. In a comparative analysis of the docking calculation’s time, it was possible to identify the programs that present low computational demands. This performance analysis can be very useful in future studies of docking, even with a much larger number of ligands and targets, increasing the database of potential PLA2s inhibitors. By applying these tests, we could establish a methodological analysis for the results interpretation on visual, numerical and graphic scales, means, respectively by the generation of images for molecular visualization, statistical analysis (multivariates) and graphing from these tests. This study was important to increase the knowledge of our research group and also of the scientific community, about the molecular modeling calculations that involves docking methods, and will certainly be useful in future studies with PLA2 or other pharmacological targets.
319

APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA INVESTIGAÇÃO DA ATIVIDADE GÊNICA DO CÂNCER DE COLO DE INTESTINO

Vieira, Sylvio Andre Garcia 30 March 2011 (has links)
Made available in DSpace on 2018-06-27T18:56:04Z (GMT). No. of bitstreams: 3 Sylvio Andre Garcia Vieira.pdf: 1367551 bytes, checksum: ca3f0ae13708a71ab3e4688f6bed15d7 (MD5) Sylvio Andre Garcia Vieira.pdf.txt: 115433 bytes, checksum: a82140f08dc158348e6d5247bd62e71b (MD5) Sylvio Andre Garcia Vieira.pdf.jpg: 3561 bytes, checksum: dba9926977a76649dac476531896ca64 (MD5) Previous issue date: 2011-03-30 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Data mining is the process of discovering patterns correlated with the various existing data in a database.GEO is a public biological database, maintained by NCBI, where they sought information relating to thirty-two patients of colorectal adenoma,with readings from the probes concerning the expression of genes,extracted RNA.The data deposited in biological banks alone do not produce useful information, and therefore, were selected respecting various factors such as the reliability of the information collected, the amount of information present in the greatest number of probes, and finally filtered by reading higher expression. After the database and be treated with the selected genes was then applied to the R tool with the SVM in order to identify this small set of genes, the possibility of their association with the presence of adenoma of the colon of the intestine. From the results obtained by classifying the data it was noticed that the characteristics of the genes are distinct and that the activity varies greatly from gene to gene. However, this occurs in a standardized manner, allowing the algorithm could identify these patterns and suggest their involvement in the adenoma / A mineração de dados é o processo de descoberta de padrões correlacionados entre os diversos dados existentes em uma base. O GEO é uma base de dados biológicos público, mantido pelo NCBI, onde se buscou as informações referentes a trinta e dois pacientes de Adenoma de colo de intestino, com leituras da expressão de sondas referentes aos genes, extraídas do RNA. Os dados depositados em bancos biológicos, por si só, não produzem informação útil, e por isto, foram selecionados respeitando diversos fatores, como a confiabilidade da informação colhida, a quantidade de informações presentes no maior numero de sondas, e finalmente filtrados pela leitura de maior expressão. Após a base de dados ser tratada e com os genes selecionados, foi então aplicada a ferramenta R com o classificador SVM com o objetivo de identificar, neste pequeno conjunto de genes, a possibilidade de associação deles com a presença do adenoma de colo de intestino. A partir dos resultados obtidos através da classificação dos dados percebeu-se que as características dos genes são bem distintas e que a atividade varia bastante de gene para gene. Porém, isto ocorre de forma padronizada, o que permitiu que o algoritmo pudesse identificar estes padrões e sugerir sua participação no processo do adenoma
320

Aplicação de máquina de vetores de suporte na investigação da atividade gênica do câncer de colo de intestino

Vieira, Sylvio André Garcia 30 March 2011 (has links)
Submitted by MARCIA ROVADOSCHI (marciar@unifra.br) on 2018-08-16T13:41:53Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_SylvioAndreGarciaVieira.pdf: 1371899 bytes, checksum: 6884c5455ed76729974e03777f962948 (MD5) / Made available in DSpace on 2018-08-16T13:41:53Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_SylvioAndreGarciaVieira.pdf: 1371899 bytes, checksum: 6884c5455ed76729974e03777f962948 (MD5) Previous issue date: 2011-03-30 / Data mining is the process of discovering patterns correlated with the various existing data in a database. GEO is a public biological database, maintained by NCBI, where they sought information relating to thirty-two patients of colorectal adenoma, with readings from the probes concerning the expression of genes, extracted RNA. The data deposited in biological banks alone do not produce useful information, and therefore, were selected respecting various factors such as the reliability of the information collected, the amount of information present in the greatest number of probes, and finally filtered by reading higher expression. After the databse and be treated with the selected genes was then applied to the R tool with the SVM in order to identify this small set of genes, the possibility of their association with the presence of adenoma of the colon of the intestine. From the results obtained by classifying the data it was noticed that the characteristics of the genes are distinct and that the activity varies greatly from gene to gene. However, this occurs in a standardized manner, allowing the algorithm could identify these patterns and suggest their involvement in the adenoma. / A mineração de dados é o processo de descoberta de padrões correlacionados entre os diversos dados existentes em uma base. O GEO é uma base de dados biológicos público, mantido pelo NCBI, onde se buscou as informações referentes a trinta e dois pacientes de Adenoma de colo e intestino, com leituras de expressão de sondas referentes aos genes, extraídas do RNA. Os dados depositados em bancos biológicos, por si só, não produzem informação útil, e por isto, foram selecionados respeitando diversos fatores, como a confiabilidade da informação colhida, a quantidade de informações presentes no maior número de sondas, e finalmente filtrados pela leitura de maior expressão. Após a base de dados ser tratada e com os genes selecionados, foi então aplicada a ferramenta R com o classificador SVM com o objetivo de identificar, neste pequeno conjunto de genes, a possibilidade de associação deles com a presença do adenoma de colo de intestino. A partir dos resultados obtidos através da classificação dos dados percebeu-se que as características dos genes são bem distintas e que a atividade varia bastante de gene para gene. Porém, isto ocorre de forma padronizada, o que permitiu que o algoritmo pudesse identificar estes padrões e sugerir sua participação no processo do adenoma.

Page generated in 0.0667 seconds