• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 28
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 566
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 43
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
291

Autogating em dados de citometria de fluxo utilizando classificadores SVM para identificação de bacterioplâncton

Cordeiro, Elionai Moura 22 March 2018 (has links)
Submitted by Automação e Estatística (sst@bczm.ufrn.br) on 2018-07-03T13:51:51Z No. of bitstreams: 1 ElionaiMouraCordeiro_DISSERT.pdf: 5123400 bytes, checksum: 64cad460a8333cb5f9cc23b82a4e1c1d (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2018-07-10T14:53:20Z (GMT) No. of bitstreams: 1 ElionaiMouraCordeiro_DISSERT.pdf: 5123400 bytes, checksum: 64cad460a8333cb5f9cc23b82a4e1c1d (MD5) / Made available in DSpace on 2018-07-10T14:53:20Z (GMT). No. of bitstreams: 1 ElionaiMouraCordeiro_DISSERT.pdf: 5123400 bytes, checksum: 64cad460a8333cb5f9cc23b82a4e1c1d (MD5) Previous issue date: 2018-03-22 / Neste trabalho é apresentada a proposta de desenvolvimento de uma metodologia - juntamente com a apresentação dos resultados de sua aplicação - que utiliza uma técnica de aprendizagem de máquina, SVM, para análise automatizada de dados de citometria de fluxo em amostras de ambientes aquáticos, na identificação de bacterioplâncton. As amostras utilizadas na execução desta metodologia foram coletadas em 19 lagos de montanhas de elevada altitude que foram classificados manualmente no Laboratório de Limnologia do Departamento de Oceanografia e Limnologia da UFRN. Previamente, iniciou-se com alguns testes de configuração da função kernel e uma análise quantitativa com base no número médio de acertos na classificação automatizada, na qual percebeu-se que a taxa de erro de predição variou entre 1,86% e 3,35%, em média. Foram realizadas duas etapas de desenvolvimento da metodologia proposta, onde foram criados modelos de predição e realizados uma série de testes com as bases de dados criadas a partir das informações disponíveis. Os resultados obtidos foram expostos a uma série de análises quantitativas e qualitativas, inclusive utilizando PCA para entender a importância de cada variável nos conjuntos de dados das mostras. Para uma avaliação qualitativa da metodologia proposta, foi aplicada uma análise estatística para comparar ambas estratégias de modelos de predição, que tem por base a classificação final apontada pelo algoritmo de Support Vector Machine. / This master tesis shows the proposal to develop a methodology - together with the presentation of the results of its application - that uses a machine learning technique, SVM, for automated analysis of flow cytometry data in samples of aquatic environments, identification of bacterioplankton. The samples used in the execution of this methodology were collected in 19 high altitude mountain lakes that were manually classified in the Laboratory of Limnology of the Department of Oceanography and Limnology of UFRN. Previously, it started with some tests of kernel configuration and a quantitative analysis based on the average number of hits in the automated classification, in which it was noticed that the prediction error rate varied between 1.86 % and 3, 35 % on average. Two stages of development of the proposed methodology were carried out, where prediction models were created and a series of tests were carried out with the databases created from the available information. The results were exposed to a series of quantitative and qualitative analyzes, including using PCA to understand the importance of each variable in the sample data sets. For a qualitative evaluation of the proposed methodology, a statistical analysis was applied to compare both strategies of prediction models, which is based on the final classification indicated by the algorithm of Support Vector Machine.
292

Estudo da estrutura da proteína SH do vírus sincicial respiratório humano : análise funcional da estrutura pentamérica por ferramentas de bioinformática /

Araujo, Gabriela Campos de. January 2013 (has links)
Orientador: Fátima Pereira de Souza / Banca: Alexandre Suman de Araujo / Banca: Luiz Paulo Barbour Scott / Resumo: O Vírus Sincicial Respiratório Humano (hRSV) é o maior causador de infecções respiratórias agudas (IRAs) em recém-nascidos e crianças no mundo inteiro. Seu genoma codifica 11 proteínas entre as quais as proteínas de superfície F, G e SH que são responsáveis pela entrada e instalação do vírus na célula do hospedeiro. Entre as proteínas de superfície, pouco se sabe sobre a função da proteína SH. O objetivo do presente estudo foi realizar a modelagem e caracterização da proteína SH e análizar o seu comportamento estrutural em diferentes meios: água e bicamada fosfolipídica. O modelo da proteína SH foi gerado pelo servidor I-Tasser, e suas características funcionais e estruturais analisados pelo PredictProtein e PsiPred. Simulações de Dinâmica Molecular foram realizadas para análise da hidrofobicidade da região central da proteína, do seu comportamento em membrana lipídica e possível formação de oligômeros. Os resultados da predição do modelo da proteína SH resultou em uma estrutura linear com uma alfa-hélice compreendida entre os aminoácido 20-42 e as análises realizadas pelo PsiPred indicaram essa região como sendo uma região transmembrânica. As simulações de Dinâmica Molecular mostraram que, quando em solução, a proteína muda sua conformação linear para globular confirmando a hidrofobicidade do domínio central. A presença da proteína SH sozinha ou das cinco estruturas na bicamada resultou num decréscimo considerável da área por lipídeo, conferindo as cadeias menor mobilidade e um maior alinhamento. As simulações do pentâmero mostraram a passagem de moléculas de água pelo poro em ambiente onde os resíduos de histidinas H22 e H51 apresentaram-se na forma protonada, indicando a dependência desta atividade com o pH do meio. Com base nessas análises foi possível propor uma estrutura terciária e quaternária da proteína SH e, com as análises da formação pentamérica da... / Abstract: The human Respiratory Syncytial Virus (hRSV) is the major cause of lower respiratory tract illnesses in children and elderly people worldwide. Its genome encodes 11 proteins including the surface protein F, G and SH which are responsible for entry and distribution of virus in the host cell. Among the protein surface, little is known about the function of protein SH. Knowing their structure and function is fundamental to a better understanding of its mechanism. The aim of this study was modeling and caracterization of the RSV SH protein and analysis of structural behavior in different environment : water and phopholipid bilayer for understanding and evaluating the formation of its pentameric structure. The SH protein model was generated by I-TASSER server, and its funcional and structural caracterisct was analyzed by PredictProtein and PsiPred. Molecular Dynimics Simulation were performed for analysis of hidrophobicit of protein central region, studies of the protein behavior on the membrane and pentamer formation. The SH protein model prediction resulted in a linear model with a helix-alpha between amino acid 20-42 and the anlysis performed by PsiPred indicated this region as transmembrane region. Molecular Dynamics Simulation showed that, when in solution,the proteína changes its linear conformations for globular conformation confirming the hydrophobicity of the central domain. The presence of the Sh protein itself or of the pentamer in bilayer resulted in a considerable decrease of the area per lipid, giving the chains less mobility and greater alignment. The pentamer simulation showed passage of water molecules through the pore in an environment where histidine residues H22 and H51 are protonated, indicating the dependence of this activity with the pH of the medium. Based on this analysis, it was proposed the structure tertiary and quaternary of the SH protein and, with the analysis of the ... / Mestre
293

GINGA - Graphical Interface for Comparative Genome Analysis: o desenvolvimento de um sistema computacional de visualização gráfica para a análise comparativa de genomas de bactérias / GINGA - Graphical Interface for comparative Genome Analysis: development of a computational system to visualize the comparative of bacterial genomes in a graphical view

Alexandre Rossi Paschoal 23 March 2007 (has links)
Esta dissertação resultou de um sistema computacional voltado para a visualização gráfica de análises comparativas entre genomas de procariotos. O sistema denominado de GINGA Graphical Interface for comparative Genome Analysis foi desenvolvido basicamente para analisar genomas parcialmente seqüenciados por meio da comparação com genomas completos. O sistema mostra a representação do alinhamento entre seqüências de reads, contigs e scaffolds do genoma parcial com a seqüência completa do outro genoma, permitindo a identificação de blocos comuns, regiões específicas e rearranjos. GINGA é um sistema web-based que foi desenvolvido em linguagem PERL para acessar um banco de dados MySQL, onde estão armazenadas as informações obtidas nas análises comparativas. O módulo de interface da biblioteca gráfica GD da linguagem PERL foi utilizado para a construção da ferramenta de visualização. A representação gráfica criada permite a navegação com opções de zoom in/out, disponibilizando as informações de montagem, anotação das seqüências codificadoras e da organização das seqüências entre os genomas. Relatórios são ainda disponibilizados como fonte complementar da apresentação dos resultados. O sistema GINGA foi utilizado para analisar de maneira comparativa o genoma das bactérias Leifsonia xyli subsp. cynodontis (Lxc genoma parcialmente seqüenciado) e Leifsonia xyli subsp. xyli (Lxx genoma completamente seqüenciado). Lxx provoca o raquitismo da soqueria em cana-de-açúcar, enquanto Lxc é capaz de colonizar cana-de-açúcar sem provocar sintomas de doença. O objetivo foi revelar, ainda durante o processo de seqüenciamento do genoma de Lxc, diferenças genéticas existentes entre os genomas dessas duas bactérias. Fizeram parte das análises comparativas um total de 9.754 reads do genoma de Lxc que formaram 1.064 contigs e 317 scaffolds, totalizando 1.470.731 de bases não redundantes. GINGA permitiu a identificação de 206.320 bases (~19%) em seqüências de contigs específicos (contigs que não apresentaram alinhamento algum com o genoma completo de Lxx) e 19 scaffolds (5,9%) que totalizaram 56.884 bases específicas ao genoma de Lxc, além de aproximadamente 1 milhão de nucleotídeos alinhados ao genoma de Lxx e pelo menos 6 grandes rearranjos. Estes resultados foram disponibilizados em uma interface gráfica e relatórios, permitindo orientar o andamento do projeto de seqüenciamento do genoma de Lxc quanto à seleção das regiões a serem seqüenciadas e, simultaneamente, oferecendo informações para a formalização de hipóteses relevantes à biologia destes microorganismos. / This study aimed to develop a computational system applied to the comparative analysis of prokaryotic genomes in a graphical view. The system named GINGA Graphical Interface for comparative Genome Analysis was developed to analyse a draft genome sequence in comparison to a complete genome. The system shows the alignment between sequence of reads, contigs and scaffolds from partial sequenced genomes and the complete sequence of another genome and allows the identification shared and unique regions as well as rearrangements. GINGA is a web-based system developed using the PERL language to access a MySQL database where all the information regard to the comparative analysis is stored. The module of the interface to GD (Graphics Library) was used to help the construction of the graphical tool. The graphical view allows zoom in/out on the information on assembly, annotation and the organization of the sequences. Supplementary information can be accessed in the form of reports. GINGA system was used to compare the genomes of Leifsonia xyli subsp. cynodontis (Lxc draft genome sequence) and Leifsonia xyli subsp. xyli (Lxx complete genome sequence). The mail goal was to identify genetic differences that may help to understand the pathogeniciy of Lxx towards sugarcane. A total of 9.754 reads assembled in 1.064 contigs and 317 scaffolds produced 1.470.731 of no redundant bases of Lxc genome and were used in the analysis. GINGA allowed the identification of 206.320 bp (~20%) of Lxc specific sequences organized in contigs and 56.884 bp organized in 19 scaffolds (5,9%), around 1 milion bp aligned to Lxx genome and at least 6 large scale genomic rearrangements. These results were presented in a graphical interface and allowed to guide the partial genome sequencing, helping to decide which regions should be further sequenced and at the same time allowing the formulation of hypothesis related to important biological aspects of these microorganisms
294

Identification of Non-Coding RNAS in Marine Vibrios / Identificação de RNAs não-codificantes em vibrios marinhos

Ana Cristina Gomes Silveira 22 July 2010 (has links)
The discovery of the non-coding RNA (ncRNA) has been primarily focused on the genomes of eukaryotes and pathogenic bacteria. In vibrios, all that is known up to now regarding ncRNAs involves V. cholerae N16961 e V. campbellii ATCC BAA-1116. In this study, ncRNA candidate genes were identified in the genomes of V. campbellii ATCC BAA-1116, V. alginolyticus 40B, V. communis 1DA3 e V. mimicus VM573. V. alginolyticus 40B and V. campbellii ATCC BAA-1116 are abundant in brazilian corals, whereas V. mimicus VM573 is a toxic strain (carrying the Vibrio pathogenicity island) atypical to this species. In order to identify the ncRNAs in silico, the tools Infernal and Rfam database were used. Perl programs were developed in the present work. The Infernal tool and the Rfam database are based on the Covariance Model (CM), a special case of Stochastic Context Free Grammars (SCFG). Up to 38 ncRNAs were identified per species. They were classified into seven classes according to their regulatory function and/or structural (1. riboswitches, 2. modulators of protein activity, 3. RNA's antisensus of trans action, 4. RNA's antisensus of cis action, 5. ribonucleoproteins, 6. regulation by transcription termination and 7. unknown classification). The most abundant group was the riboswitch, whereas the less abundant group was the ribonucleoprotein. This work demonstrated that the ncRNAs show a great diversity in functional classes, possibly associated with the regulation of different cellular processes in vibrios, including regulation of pathogenicity. / A descoberta de RNA não-codificante (ncRNA) tem focado principalmente nos genomas de eucariontes e de bactérias patogênicas. Em vibrios, o que se conhece até o momento sobre ncRNAs envolve V. cholerae N16961 e V. campbellii ATCC BAA-1116. Neste estudo, são identificados genes candidatos de ncRNAs no genoma de V. campbellii ATCC BAA-1116, V. alginolyticus 40B, V. communis 1DA3 e V. mimicus VM573. V. alginolyticus 40B e V. campbellii ATCC BAA-1116 são abundantes em corais brasileiros, enquanto que V. mimicus VM573 é uma linhagem toxigênica (CT e TCP positiva) atípica desta espécie. Para identificar os ncRNAs através de análise in silico foram utilizadas ferramentas já disponíveis (Infernal e a base de dados Rfam) e programas em Perl desenvolvidos no presente trabalho. A ferramenta Infernal e a base de dados Rfam são baseados em modelo de covariância (CM), um caso especial de gramáticas estocásticas livres de contexto (SCFG). Foram identificados até 38 ncRNAs por espécie, os quais foram classificados em sete classes de acordo com sua função regulatória e /ou estrutural (riboswitches, moduladores da atividade de proteínas, RNAs antisenso de ação trans, RNAs antisenso de ação cis, ribonucleoproteinas, regulação por término de transcrição e classificação desconhecida). O grupo mais abundante foi o riboswitch, enquanto que o grupo menos abundante foi o ribonucleoproteina. Este trabalho demonstrou que os ncRNAs apresentam uma ampla diversidade de classes funcionais, estando possivelmente associados com a regulação de diferentes processos celulares em vibrio, incluindo a regulação da patogenicidade.
295

Identificação e análise de sequências codificantes com atributos conflitantes em genomas procariotos / Analysis and identification of prokaryotic coding sequences with confliting atributes eng

Guadalupe Del Rosario Quispe Saji 23 August 2010 (has links)
O advento de novas tecnologias de sequenciamento e o desenvolvimento de ferramentas computacionais que facilitam a análise dos genomas gerou o aumento exponencial dos bancos de dados genômicos. As abordagens in-silico da genômica comparativa usam esse tipo de dados nas suas comparações. Trabalhos recentes desenvolvidos sobre o genoma de Escherichia coli indicam que o estado atual das sequências codificantes (CoDing Sequences CDS) de genomas anotados nos bancos de dados contêm erros nas sequências que precisam ser verificados (Ochman e Davalos 2006). Portanto a correta descrição de uma CDS é importante para permitir futuras comparações genômicas. Atualmente existe uma nova proposta da comunidade científica de bancos de dados biológicos para estabelecer padrões para a submissão de sequências dos projetos de genoma na nova era de sequenciamento. Dentro desse contexto, destaca-se a identificação e/ou correção de frameshifts durante o processo de montagem de sequências genômicas. A finalidade deste trabalho foi desenvolver uma ferramenta com dois métodos comparativos para identificar CDSs com atributos conflitantes. Usa-se a descrição de conflito para descrever atributos como frameshifts, grandes inserções ou deleções, truncamentos, que são detectados a partir de uma CDS ou várias CDSs usadas como referência, dependendo do modelo. Finalmente, a ferramenta proposta permite visualizar os resultados graficamente e fornecer acesso a outras ferramentas, dando suporte para futuras análises genômicas de maneira amigável e rápida. Foi realizada a busca de CDSs com atributos conflitantes no genoma de E. coli estirpe CFT073 (NCBI) versão AE014075.1, (última data de atualização: 20 de abril do 2006), como referência foi usado o genoma da E.coli estirpe O157:H7 EDL933 versão AE005174.2 ( última data de atualização : 6 de junho do 2008). Através dessa análise foram identificadas e armazenadas 1.865 CDSs (incluem-se possíveis parálogos), por apresentarem alinhamentos únicos com cobertura superior a 30% da CDS de referência. Em uma análise mais fina destes resultados, sobressaltam 144 CDSs no genoma alvo que provavelmente apresentam frameshifts, dos quais 21 acontecem em regiões intergênicas. A ferramenta desenvolvida neste trabalho foi também aplicada para o caso de estudo de uma região genômica da bactéria Klebsiella pneumoniae estirpe KP13. O genoma dessa bactéria foi sequenciado na Unidade Genômica Computacional (UGC) Darcy Fontoura de Almeida do LNCC (dados ainda não publicados). A partir das análises destes genomas, pode se concluir a importância do uso da ferramenta nas fases de identificação, verificação e correção de erros de anotação e, portanto a necessidade da sua inclusão em projetos de sequenciamento que desejam atingir altos padrões na submissão de dados genômicos. / The advent of new sequencing technologies and the development of computational tools that facilitate the analysis of genomes, generated the exponential growth of genome databases. New approaches in-silico of the comparative genomics use such data in its comparisons. Nevertheless, recent work on the genome of Escherichia coli indicate that the current state of coding sequences (Coding Sequences - CDS) from annotated genomes contain several errors, which need to be verified (Ochman e Davalos 2006). Therefore the correct description of a CDS is important to allow future genomic comparisons. Currently, there is an innovated proposal of the scientific community of biological databases to establish standards for the submission of the draft genome sequences in the new era of sequencing. Within this context, it is highlighted the identification and/or correction of frameshifts during the assembly of genomic sequences. The goal of this work was developing a tool with two comparative methods to identify CDSs with conflicting attributes. It uses the description of conflict to describe attributes such as frameshifts, large insertions or deletions, truncations, etc.. that are detected from a CDS or several CDSs used as references, depending on model. Also, the proposed tool allows to user to view of the results graphically and provide access to other tools, providing support for future friendly and faster genomic analysis. As a model of study, it was used the analysis of CDSs with conflicting attributes of the genome of E. coli strain CFT073 (NCBI) version AE014075.1, (last update date: April 20 of 2006), with this purpose was used as a reference genome of E.coli strain O157: H7 EDL933 version AE005174.2 (last update date: 6 June of 2008). Through this analysis were identified and stored 1865 CDSs (Included possible paralogs) because they present only alignments with coverage exceeding 30% of the CSD of reference. In a more detailed analysis of these results, 144 CDSs startle in the target genome by probably present frameshifts, of which 21 occur in intergenic regions. The tool developed in this work, also was applied to the case study of a genomic region of the bacterium Klebsiella pneumoniae strain KP13. The genome of this bacterium was sequenced in Computational Genomics Unit (UGC) Darcy Fontoura de Almeida LNCC (unpublished data). From the analysis of these genomes, one can conclude the importance of using the tool in the stages of identification, verification and correction of errors in annotation,and thus the need for its inclusion in the sequencing projects that want to reach high standards in the submission of genomic data.
296

Estudo da aplicação de redes neuronais artificiais para apoio à decisão na liberação do perfil lipídico e de glicemia em jejum.

Prado, Ademir Luiz do January 2011 (has links)
Orientadora : Profª Drª Jeroniza Nunes Marchaukoski / Co-Orientador: Prof. Dr. Geraldo Picheth / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 21/02/2011 / Bibliografia: fls. 84-88 / Resumo: As determinações do perfil lipídico (colesterol total, HDL-colesterol, LDL-colesterol, triglicérides) e da glicemia em jejum são ensaios de grande demanda nos laboratórios clínicos. A liberação destes resultados por profissionais consome tempo e atenção. O estudo se propõe avaliar a aplicação das redes neuronais, Multilayer Perceptron (MLP) e Free Associative Neurons (FAN), como ferramentas de inteligência artificial para colaborar na liberação dos resultados, em processo designado "segunda opinião". O projeto tem a aprovação do Comitê de Ética em Pesquisa com Seres Humanos do HC-UFPR (CAE: 0253.0.208.000-10). Uma amostra contendo 60.006 registros obtidos do banco de dados do HC-UFPR foi analisada. A idade média dos pacientes foi cerca de 47 anos (amplitude de variação de 2 a 99 anos), com predomínio de mulheres (~65%). Esta amostra foi classificada em "liberado" quando todo os valores dentro dos critérios estabelecidos de normalidade e "retido" quando qualquer analito estudado se mostrou fora da referência. Esta classificação resultou em 62% da amostra classificada no grupo "retido". Quando as redes neuronais foram testadas com arquivos completos (n=30.003) a rede FAN apresentou divergência cerca de 6 vezes superior à rede MLP (7,6% vs. 1,2%) embora ambas tenham um desempenho satisfatório em acurácia (>90%). Foram treinadas e testadas as redes FAN e MLP com arquivos incompletos, aracterizados pela ausência de algum dos parâmetros em estudo com diferentes tamanhos de arquivos (30.536, 65.536 e 120.000 registros). Nesta condição que mimetiza os resultados liberados pelo laboratório clínico, a rede neuronal MLP apresentou desempenho superior à rede FAN. O estudo permitiu concluir que: (1) a rede neuronal FAN perde desempenho com arquivos incompletos, (2) a rede neuronal MLP apresentou desempenho superior à rede FAN quando estudada com arquivos completos ou incompletos, (3) o tamanho amostral utilizado para treinamento e teste não afetaram o desempenho da rede neuronal MLP, enquanto que a rede FAN é afetada por perda de sensibilidade, (4) resultados divergentes da rede neuronal MLP avaliados por especialistas humanos evidenciaram que os ensaios com valores alterados foram o principal elemento de inconsistência. Em síntese, a rede neuronal MLP é recomendada para outros estudos com desenho amostral semelhante e apresenta potencial para aplicação no laboratório clínico como suporte a decisão na liberação de resultados. / Abstract: The lipid profile (total cholesterol, HDL-cholesterol, LDL-cholesterol, triglycerides) and fasting blood glucose are tests of high throughput in clinical laboratories. In the process of liberate these results professionals needs to takes time and attention. The study aims to evaluate the application of neural networks, Multilayer Perceptron (MLP) and Free Associative Neurons (FAN), as artificial intelligence tools to assist in the release of the results, a process called "second opinion". The project was approved by the Ethic Committee in Human Research of the HC-UFPR (CAE: 0253.0.208.000-10). A sample containing 60,006 registers obtained from HC-UFPR Database was analyzed. The mean age of patients was about 47 years (range: 2-99 years) with predominance of women (~65%). This sample was classified as "released", when all values were within the established criteria of normality and "retained" when any studied analyte showed values outside the reference of normality. This classification resulted in 62% of the sample classified as "retained". When neural networks were tested with complete files (n=30,003) FAN network disagreement was about 6 times higher compared with the MLP network (7.6% vs. 1.2%) although both have a satisfactory performance in accuracy (> 90%). The FAN and MLP networks were also trained and tested with incomplete files, characterized by the absence of any of the parameters under study with different file sizes (30,536, 65,536 and 120,000 registers). In this condition that mimics the results released by a clinical laboratory, the MLP neural network showed a superior performance compared to the FAN network. The study concluded that: (1) the FAN neural network loses performance with incomplete files, (2) the performance of MLP neural network was superior to the FAN network when tested with complete or incomplete files, (3) the sample size used to training and testing did not affect the performance of MLP neural network, while FAN network that is affected by loss of sensitivity, (4) divergent results of the MLP neural network evaluated by human experts showed that the tests with high values were the main element of inconsistency. In summary, the MLP neural network is recommended for other studies with similar sample design and presents a potential for application in the clinical laboratory as a decision support system.
297

Estudo estrutural de quinases dependentes de ciclinas por métodos de modelagem molecular comparativa

Silva, Alessandra Renata Lente da [UNESP] 22 December 2006 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:22:54Z (GMT). No. of bitstreams: 0 Previous issue date: 2006-12-22Bitstream added on 2014-06-13T19:08:27Z : No. of bitstreams: 1 silva_arl_me_sjrp.pdf: 1113092 bytes, checksum: 4bc901361a078aaf5ad31ba8777c0f38 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / As CDKs têm sido extensivamente estudadas, porque exercem papéis essenciais na regulação da proliferação celular, nos processos neuronais e transcricionais. A progressão do ciclo celular é firmemente controlada pela atividade das CDKs. Este projeto de Mestrado tem como objetivo estudar a interação das proteínas CDK8 e CDK10 com vários inibidores, e estabelecer as bases estruturais para inibição das mesmas. Foram realizadas modelagens moleculares dos complexos binários CDKs:Inibidores, utilizando como molde a estrutura da CDK2 complexada com os mesmos ligantes: ATP, flavopiridol, olomoucina e roscovitina. Para realização dessas modelagens foi utilizado o programa Parmodel, que é uma implementação paralela do programa MODELLER. Espera-se que os modelos computacionais produzam avanços no entendimento de suas estruturas, destacando-se seus sítios de ligações, para um possível estudo sobre inibidores específicos para estas CDKs. / The CDKs have been extensively studied because of their essential role in the regulation of cell proliferation, in the neuronal process and transcription. Cell cycle progression is tightly controlled by the activity of CDKs. This master project aimed to study the interaction of the CDK8 and CDK10 with several inhibitors in order to establish the structural bases for its inhibition. Were carried out the molecular modeling of the binary complexes CDKs:Inhibitors, using as template the CDK2 structure with the following ligands and inhibitors: ATP, Flavopiridol, Olomoucine and Roscovitine. For the achievement of those modeling was utilized the Parmodel program which is a parallel implementation of the MODELLER program. One expects that the computational models produce advances in the agreement structures, showing their binding sites, for a possible study about specific inhibitors against CDKs.
298

Uma abordagem para obtenção de regiões ortólogas em múltiplos proteomas

Silva, Anderson Pegoraro 17 August 2006 (has links)
Made available in DSpace on 2016-06-02T19:05:30Z (GMT). No. of bitstreams: 1 1904.pdf: 8596621 bytes, checksum: bb1a64e6ce17817f414ced4cd74b8404 (MD5) Previous issue date: 2006-08-17 / With the progress of the sequencing techniques and the inevitable increasing number of sequenced genomes, it becomes interesting studying computational techniques to analyze these data. One of the possible analyses refers to the extraction of functional and evolutionary characteristics of the studied organisms. Thus, in this line of research, this study is motivated in identifying common regions, in terms of the genes that they contain, in multiple proteomes that keep the order and the gene content. The problem is modeled with a colored graph, and the common regions between proteomes are like clicks in the graph. Using peculiarities of the constructed graph, an algorithm for search space reduction was developed, making it possible to get complete results in a short time. Therefore, the contribution of this work constitutes an approach to find common regions in multiple proteomes, added of an implementation from which the Multiple Proteome Comparison (MPC) tool originated. / Com o avanço das técnicas de seqüenciamento e o inevitável crescimento do número de genomas seqüenciados, torna-se necessário o uso de técnicas computacionais para analisar e gerenciar essa grande massa de dados. Uma das análises possíveis diz respeito à extração de características funcionais e evolutivas dos organismos estudados. Assim, nesta linha de pesquisa, este estudo preocupa-se em identificar regiões comuns, em termos dos genes que elas contêm, em múltiplos proteomas, que conservam a ordem e o conteúdo gênico. O problema é modelado com o auxílio de um grafo colorido, sendo que regiões comuns entre proteomas são como cliques no grafo. Aproveitando-se de peculiaridades do grafo construído, um algoritmo para redução do espaço de busca foi desenvolvido, possibilitando obter resultados completos em um pequeno espaço de tempo. Portanto, a contribuição deste trabalho constitui numa abordagem para encontrar regiões comuns em múltiplos proteomas, acrescida de uma implementação, que originou a ferramenta Multiple Proteome Comparison (MPC).
299

Bio-TIM - Ambiente para convergência de informações em Bioinformática.

Oliveira, Gustavo Borges de 31 August 2005 (has links)
Made available in DSpace on 2016-06-02T19:06:28Z (GMT). No. of bitstreams: 1 DissGBO.pdf: 1833938 bytes, checksum: 24ceae16595b3b1073dda4958829de16 (MD5) Previous issue date: 2005-08-31 / Currently, some genomas of creatures are being mapping, so enormous amounts of data are being generated. This data is sometimes stored in different data sources and at many times, these sources are heterogeneous and distributed, which results in the necessity of the use of new query techniques and integration of data. After this, the biologists can usufruct greaters and better resources during the research process. This work has the proposal of to build a Bioinformatics environment for the integration of different data sources and their reorganization in a centered source that supports a flexible and efficient manner to build queries. The environment is called as Bio-TIM, which is composed by three layers. The main one is called "Mediator" and it is composed by a connection manager for databases management systems, by wrappers, by a Data Warehouse and by a specific database. / Atualmente, vários genomas de seres vivos estão sendo mapeados gerando enormes quantidades de dados, as quais são armazenadas em diferentes fontes de informações. O fato dos dispositivos de armazenamento de dados serem heterogêneos e distribuídos resulta na necessidade de criação de técnicas de consulta e integração de dados para que os biólogos possam usufruir de maiores e melhores recursos durante o processo de pesquisa. Este trabalho propôs um ambiente de bioinformática para a integração de diferentes fontes de dados e sua reorganização em uma fonte centralizada propiciando consultas flexíveis e eficientes. O ambiente foi denominado Bio-TIM, o qual é composto por três camadas, sendo a principal denominada Mediador . Ela é composta por um gerenciador de conexões a sistemas gerenciadores de bancos de dados, por tradutores, por um Data Warehouse e por um banco de dados específico.
300

Desenvolvimento de um pipeline para análise genômica e transcriptômica com base em Web services

Melo, Henrique Velloso Ferreira 04 September 2009 (has links)
Made available in DSpace on 2016-08-17T18:39:30Z (GMT). No. of bitstreams: 1 2590.pdf: 1752867 bytes, checksum: 7dd2196f0a9d489b35a0759a6cc018c6 (MD5) Previous issue date: 2009-09-04 / Pipeline systems for genomic and transcriptomic analysis aim to create communication bridges among the existing analysis tools, therefore reducing researchers efforts. Most of the pipelines found in the literature lack important features which would be useful to the development of genome or transcriptome sequencing projects. Among them, the capacity of tracking the project results along its development, including the generation of partial reports; the presence of a collaborative environment where the involved laboratories can contribute with new data and chromatograms; the possibility to configure analysis parameters; multiple pipeline support and the possibility to include new tools and modules. In this work, a pipeline prototype was developed to overcome these shortcomings. Sequencing projects progresses are tracked along all over their developments. Chromatograms are progressively received along the development of the project and partial reports over newly received data are generated. The communication with the processing server is done via Web service, which offers a universal language interface, allowing client applications in heterogeneous platforms to submit data and execute operations and queries. Pipelines are configured in XML documents written in a predefined format, through which the researchers choose the tools and parameters to be used. The prototype offers support to multiple pipelines executed simultaneously in the same project. Pipelines are executed in parallel by the means of thread pools, what increases efficiency by distributing the workload in multiprocessed systems. Another feature of the prototype is the extensibility as each pipeline step is wrapped in a module. New modules can be easily inserted in the system through the implementation of a programming interface, therefore without the needing of recompilation. Module insertions are done in a declarative way through XML documents. A client application was also developed in the collaborative platform Sakai, allowing different research groups involved in a sequencing project to create pipelines, view results and exchange information on the project current status. To evaluate the efficiency of the prototype, a case study was carried out. Sequences generated from sequencing of Sphenophorus levis transcriptome were submitted and a pipeline was configured to analyze the data. The case study has pointed out that the prototype is efficient and produces good results. / Sistemas de pipeline para análise de genomas e transcriptomas têm o objetivo de criar pontes de comunicação entre as diferentes ferramentas no intuito de reduzir os esforços do pesquisador no processo de análise. A maioria dos pipelines descritos na literatura carece de funcionalidades importantes para o desenvolvimento de projetos de sequenciamento. Entre elas, a capacidade de acompanhar e gerar resultados parciais das análises ao longo do desenvolvimento do projeto; a presença de um ambiente colaborativo onde os diferentes laboratórios envolvidos possam contribuir com novos dados e cromatogramas; a possibilidade da configuração dos parâmetros da análise; o suporte a múltiplos pipelines com diferentes configurações; e o suporte à inclusão de novos programas e módulos. Neste trabalho, foi desenvolvido um protótipo que supre essas deficiências. O progresso dos projetos é acompanhado ao longo de todo o seu desenvolvimento. Para isso, recebe dados brutos de cromatogramas, realiza análises dos dados parciais e emite relatórios com os resultados. A comunicação com o servidor de processamento é realizada via Web service, oferecendo uma interface na linguagem universal XML que permite que aplicações cliente em plataformas heterogêneas submetam dados e realizem operações e consultas. Os pipelines são configurados através de arquivos XML em formato específico, no qual o pesquisador define os programas a parâmetros a utilizar. O protótipo dá suporte a múltiplos pipelines com execução simultânea em um mesmo projeto. A execução dos pipelines é realizada em paralelo por meio de um pool de threads, o que aumenta a eficiência dividindo a carga de processamento em servidores com mais de um núcleo. Uma aplicação cliente foi desenvolvida na plataforma colaborativa, permitindo que os diferentes grupos de pesquisa envolvidos no sequenciamento criem pipelines, visualizem resultados e troquem informações sobre o andamento do projeto. Outro diferencial do protótipo desenvolvido é a extensibilidade. Cada etapa do pipeline é encapsulada em um módulo. Novos módulos podem ser facilmente inseridos sem a necessidade de recompilação de todo o sistema, bastando para isso que o mesmo implemente uma interface específica. A inserção no sistema é realizada declarativamente em arquivos XML. Um estudo de caso foi realizado com a submissão de cromatogramas a partir do sequenciamento de ESTs (Expressed Sequence Tags) de Sphenophorus Levis. Um pipeline foi configurado para o estudo, e sua execução mostrou que o sistema é eficiente e apresenta bons resultados.

Page generated in 0.114 seconds