71 |
Uma aplica??o para automa??o de experimentos de docagem molecularSilva, Andr? Lu?s da 31 August 2010 (has links)
Made available in DSpace on 2015-04-14T14:49:54Z (GMT). No. of bitstreams: 1
443882.pdf: 1538805 bytes, checksum: 0ca0fe774889aa54673d3442302094d2 (MD5)
Previous issue date: 2010-08-31 / PEDS can be used in research activities and in the teaching of molecular modeling, being enough flexible to be integrated to other software of molecular docking. The preparation and Execution of Docking Simulation (PEDS), is auxiliary tool in preparation of a set of molecules obtained from the ZINC database, automatically positioning the ligand candidate in a region determined by the specialist using the residues of the ligand candidate to calculate the coordinates to move it to. Based on this information, PEDS can prepare scripts e execute the molecular docking to run with AutoDock 3.0.5. PEDS was validated using InhA as receptor in two conformations, (1ENY e 1BVR), always with same structure as reference and two ligands, TCL and ETH. It was possible to verify that molecular docking moved the ligand near to active site of receptor, using the position calculated by PEDS. PEDS can be enhanced to use another input and output file formats, having its code available for free distribution. / O PEDS pode ser utilizado nas atividades de pesquisa bem como no ensino de modelagem molecular sendo suficientemente flex?vel para ser integrado a outros programas de docagem molecular. O Preparation and Execution of Docking Simulation (PEDS), ? auxiliar na prepara??o de um conjunto de mol?culas obtidas do banco de dados ZINC, posicionando automaticamente os candidatos a ligantes em ?reas determinadas pelo especialista, usando um conjunto de res?duos informados para calculo de coordenadas, e com base nestas informa??es, prepara os scripts de processamento e executa a docagem molecular utilizando o AutoDock 3.0.5. O PEDS foi validado utilizando-se o receptor InhA em duas conforma??es (1ENY e 1BVR), sempre com uma estrutura de refer?ncia e dois ligantes, o TCL e a ETH. Foi poss?vel verificar que a docagem molecular colocou o ligante pr?ximo ao s?tio ativo, partindo da posi??o calculada pelo PEDS. O PEDS pode ser aprimorado para utiliza??o de outros formatos de arquivos de entrada e sa?da, sendo seu c?digo fonte dispon?vel para distribui??o.
|
72 |
Otimiza??es qualitativas e quantitativas nas fases de leitura e an?lise em pipelines metagen?micosDias, Raquel 06 August 2012 (has links)
Made available in DSpace on 2015-04-14T14:49:55Z (GMT). No. of bitstreams: 1
444045.pdf: 8676416 bytes, checksum: 5dc6fddb810c5c4102aeef934f1d8983 (MD5)
Previous issue date: 2012-08-06 / Metagenomic sequencing technologies are advancing rapidly and the size of output data from high-throughput genetic sequencing has increased substantially over the years. Our optim?zations and performance evaluations are focused in some of the most critical and time-consuming steps of a metagenomic analys?s: pre-processing, taxonomic classification assignment and post-processing of classification results. Optimizations and functions were implemented and introduced in a new architecture, PANGEA+, based on the PANGEA metagenomic pipeline. The main improvements of the present tool are: support of new input file formats and NCBI taxonomy database, new species classification methods, consensus analysis, implementation of distributed memory (MPI) for species classification step, and low complexity optimizations for the post-processing of classification results. The evaluation of the new architecture, shows remarkable improvements in many features and, mainly, in the species classification accuracy and performance. / As tecnologias de sequenciamento metagen?mico tem avan?ado rapidamente e a quantidade de dados gerados a partir do sequenciamento em larga escala tem aumentado substancialmente ao longo dos anos. As presentes otimiza??es e avalia??es de desempenho tem foco em algumas das etapas mais cr?ticas e que consomem mais tempo em uma an?lise metagen?mica: pr?-processamento, classifica??o taxon?mica e p?s - processamento dos resultados de classifica??o. Otimiza??es e fun??es foram implementadas e introduzidas em uma nova arquitetura, PANGEA+, baseada no pipeline metagen?mico PANGEA. Os principais melhoramentos alcan?ados com a presente ferramenta foram: suporte a v?rios formatos de arquivos de entrada e a base de dados taxon?micos do NCBI, novos m?todos de classifica??o de esp?cies inclu?dos, an?lise consenso, implementa??o de mem?ria distribu?da para a fase de classifica??o de esp?cies, otimiza??es de baixa complexidade para o p?s-processamento dos resultados de classifica??o. A avalia??o da nova arquitetura, PANGEA+, demonstra melhoramentos consider?veis em v?rias funcionalidades e, principalmente, na etapa de classifica??o de esp?cies, tanto em exatid?o quanto em desempenho computacional.
|
73 |
Pro-smart : predi??o de estruturas terci?rias de prote?nas utilizando sistemas multiagentePaes, Thiago Lipinski 15 March 2013 (has links)
Made available in DSpace on 2015-04-14T14:50:06Z (GMT). No. of bitstreams: 1
451616.pdf: 18264447 bytes, checksum: 02e74b31d71030af5f9b0355ff4fef90 (MD5)
Previous issue date: 2013-03-15 / There currently are approximately 16 million of unique (non-redundant) protein sequences in
the GenBank. In the PDB, we can only find about 89,000 three-dimensional (3-D) protein
structures and only 1,393 different SCOP protein folds. Thus, there is a huge gap between our
ability to generate protein sequences and that of solving 3-D structures of proteins with
unique, novel folds. This gap has been reduced with the aid from structural bioinformatics by
addressing the problem of how a protein reaches its 3-D structure starting only from its amino
acid sequence. This is called the protein structure prediction (PSP) problem.
Thermodynamics considerations presented by Christian Anfinsen and co-workers in 1973
have it that a protein native structure is the one that minimizes its global free energy. Hence,
we can treat the PSP problem as a minimization one within an NP-complete class of
computation complexity. Several techniques have been used to predict the 3-D structure of
proteins. In this work we supplement these techniques by adding artificial intelligence
concepts still not much exploited in bioinformatics. More specifically, we propose a
framework, based on an ab initio approach, of a cooperative hierarquical multi-agent system
guided by a Simulated Annealing and a Monte Carlo scheme to address the PSP problem.
Our multi-agent system has as input the protein amino acid sequence. Amino acids are
represented by two agents: The C-Alpha agent (in lieu of the C alpha carbon atom) and the CBeta
agent (in lieu of the side chain centroid). These Amino Acid agents can interact with
each other. There are two other agents: one coordinates the Amino Acid agents; the other
coordinates the protein system. The multi-agent system was created using the NetLogo
platform. A clustering protocol was implemented for obtaining each simulation representant
model. The results were compared with published papers regarding similar methodology and
the use of Multi-Agent Systems to address the Protein Structure Prediction Problem. We
present partial results which are encouraging for mini proteins. / Atualmente existem aproximadamente 16 milh?es de sequ?ncias ?nicas de prote?nas
(n?o redundantes) no GenBank. Entretanto, no PDB, podemos encontrar apenas cerca de
85.000 estruturas tridimensionais (3D) de prote?nas das quais apenas 1.393 possuem
dobramento SCOP diferentes. Existe ent?o uma grande lacuna entre nossas atuais habilidades
no que se trata de gerar sequ?ncias de prote?nas e nossas habilidades em resolver estruturas
3D de prote?nas com novos dobramentos. Essa lacuna vem sendo reduzida com a ajuda da
bioinform?tica estrutural por meio do endere?amento do problema de como uma prote?na
alcan?a sua estrutura 3D partindo-se apenas de sua sequencia de amino?cidos. Esse ?
conhecido como o Problema PSP, do ingl?s Protein Structure Prediction Problem.
Considera??es termodin?micas apresentadas por Christian Anfinsen e colaboradores em 1973
deram inicio a uma forma de abordar o problema que hoje ? conhecida como a hip?tese de
Anfinsen, a qual afirma que a estrutura nativa de uma prote?na ? aquela que minimiza sua
energia global livre. Podemos ent?o, tratar o problema PSP como um problema de
minimiza??o, tendo em mente ser um problema de complexidade NP-Completo. Neste s?o
utilizados conceitos adventos da intelig?ncia artificial at? hoje n?o muito explorados na
bioinform?tica. Mais especificamente, propomos um arcabou?o baseado em uma abordagem
ab initio, envolvendo um sistema multi-agente hierarquicamente cooperativo e guiado por um
esquema baseado no m?todo de Monte Carlo e de Arrefecimento Simulado, a fim de obter-se
a otimiza??o de uma fun??o de energia. O sistema multi-agente tem como entrada apenas a
sequencia de amino?cidos das prote?nas. Cada amino?cido ? representado por dois agentes: O
agente C-Alfa (correspondendo o ?tomo C alfa) e um agente C-Beta (correspondendo ao
centroide da cadeia lateral do amino?cido). Esses agentes amino?cidos interagem entre si.
Existem dois outros tipos de agentes: um coordena os agentes Amino?cidos (C-Alfa e CBeta)
e outro coordena o sistema por inteiro. O sistema multi-agente foi criado utilizando a
plataforma NetLogo. Um protocolo de clusteriza??o foi desenvolvido para a obten??o da
estrutura modelo de cada simula??o e os resultados foram comparados com a literatura no
que se trata de PSP e multi-agentes e se mostraram promissores.
|
74 |
Um workflow cient?fico para a modelagem do processo de desenvolvimento de f?rmacos assistido por computador utilizando receptor flex?velMachado, Karina dos Santos 30 March 2007 (has links)
Made available in DSpace on 2015-04-14T14:50:21Z (GMT). No. of bitstreams: 1
391202.pdf: 2565991 bytes, checksum: a1f131e3f03bd916c91d19ddca5c04ff (MD5)
Previous issue date: 2007-03-30 / O desenho de drogas assistido por computador (CADD) ? um processo que envolve a execu??o seq?encial de diferentes programas, no qual ? testado se um determinado ligante (pequena mol?cula) interage bem com um receptor (geralmente uma prote?na ou enzima). Esse processo geralmente ? executando com o aux?lio de shell scripts. Por?m a modifica??o dos par?metros de entrada e an?lise dos resultados nesse tipo de abordagem ? uma tarefa complexa e que consome muito tempo. Al?m disso, para considerar a flexibilidade do receptor durante experimentos de docking, ? necess?rio que se utilize milhares de snapshots do receptor. Neste trabalho, esses snapshots s?o obtidos da trajet?ria de simula??es por din?mica molecular do receptor. Devido aos desafios associados ? manipula??o desse grande n?mero de snapshots do receptor e ? necessidade de um melhor controle sobre os diferentes programas associados a esse processo, esse trabalho apresenta um workflow cient?fico para automa??o do processo de desenvolvimento de drogas assistido por computador, incluindo de forma expl?cita a flexibilidade do receptor. Os softwares JAWE e Shark foram utilizados para modelar e executar respectivamente o workflow. Mesmo com essa automa??o no processo, ainda h? problemas relacionados ao n?mero de snapshots do receptor que deve ser utilizado. O tempo necess?rio para a execu??o de experimentos de docking, considerando aproximadamente tr?s mil snapshots do receptor, ? em torno de 500 horas. Para simplificar e agilizar esse processo, foi desenvolvida uma forma de sele??o de snapshots baseado na energia livre de liga??o (FEB). Assim, durante os experimentos de docking, chamados de docking seletivo, somente uma parte dos snapshots s?o utilizados: aqueles que obtiveram os melhores resultados de intera??o em termos de FEB durante um experimento exaustivo com um determinado ligante. Para validar essa implementa??o e sele??o, foram executados experimentos de docking com a enzima InhA de M. tuberculosis como receptor e cinco ligantes diferentes. Os resultados desses experimentos ilustram a efici?ncia do workflow implementado e da forma de sele??o de snapshots do receptor que est? sendo realizada
|
75 |
Aplicação de redes neurais artificiais na classificação de padrões filogeográficos com base na variabilidade genômica do DNA mitocondrialGOMES, Larissa Luz 20 December 2007 (has links)
Submitted by Edisangela Bastos (edisangela@ufpa.br) on 2012-04-12T17:06:14Z
No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_AplicacaoRedesNeurais.pdf: 1147631 bytes, checksum: 0cc08fca626cf59a4b1641eb44f906fd (MD5) / Approved for entry into archive by Edisangela Bastos(edisangela@ufpa.br) on 2012-04-12T17:11:15Z (GMT) No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_AplicacaoRedesNeurais.pdf: 1147631 bytes, checksum: 0cc08fca626cf59a4b1641eb44f906fd (MD5) / Made available in DSpace on 2012-04-12T17:11:15Z (GMT). No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_AplicacaoRedesNeurais.pdf: 1147631 bytes, checksum: 0cc08fca626cf59a4b1641eb44f906fd (MD5)
Previous issue date: 2007 / Historicamente, o processo de formação das populações da Amazônia, assim como de todo território brasileiro, envolveu três grupos étnicos principais: o ameríndio, o europeu e o africano. Como conseqüência, estas populações possuem em geral constituição miscigenada do ponto de vista social e biológico. Desde o final do século passado, estudos do DNA mitocondrial (mtDNA) tem sido desenvolvidos com o propósito de estimar a mistura interétnica presente nestas populações. Para isto, é de fundamental importância a classificação de uma determinada linhagem de mtDNA em um dos mais de 250 haplogrupos/subclados propostos na literatura. Com o objetivo de desenvolver um sistema automatizado, preciso e acurado de classificação de seqüências (linhagens) de mtDNA, o presente trabalhou lançou mão da técnica de Redes Neurais Artificiais (RNA’s) tendo como base os estudos de filogeografia. Para esta classificação, foram desenvolvidas quatro redes neurais artificiais diretas, com múltiplas camadas e algoritmo de aprendizagem de retropropagação. As entradas de cada rede equivalem às posições nucleotídicas polimórficas da região hipervariável do DNA mitocondrial, as quais retornam como saída a classificação específica de cada linhagem. Posterior ao treinamento, todas as redes apresentaram índices de acerto de 100%, demonstrando que a técnica de Rede Neural Artificial pode ser utilizada, com êxito, na classificação de padrões filogeográficos com base no DNA mitocondrial. / Historically, the process of formation of the populations of the Amazon, as well as from all Brazilian territory, involved three main ethnic groups: the Amerindian, European and African. As a result, these populations have in general admixed constitution the point of view of social and biological. Since the end of the last century, studies of mitochondrial DNA (mtDNA) has been developed for the purpose of estimating the mixture inter present in these populations. For this, it is of fundamental importance classification of a particular strain of mtDNA in one of more than 250 haplogroups/sub-clades proposed in the literature. With the goal of developing an automated system, precise and accurate classification of the sequences (strains) of mtDNA, this has worked hand of the art of Artificial Neural Networks (RNAs) on the basis of the studies of Philogeography. For this classification, four networks have been developed artificial neural direct, with multiple layers and the learning algorithm to backpropagation. The entries of each network equivalent positions at nucleotide polymorphic region's hipervariable of mitochondrial DNA, which returned as output classification specific to each lineage. Subsequent to the training, all the networks had indices of adjustment of 100%, demonstrating that the technique of Artificial Neural Network (ANN) can be used, with success, in the classification of standards Philogeography based on mitochondrial DNA.
|
76 |
Identificação e avaliação da expressão de marcadores moleculares envolvidos na tumorigênese de pulmãoHenrique, Tiago 05 July 2010 (has links)
Submitted by Fabíola Silva (fabiola.silva@famerp.br) on 2016-06-28T18:01:18Z
No. of bitstreams: 1
tiagohenrique_dissert.pdf: 1562127 bytes, checksum: 0d0b4da7bf071396a3c701c40e27e3ed (MD5) / Made available in DSpace on 2016-06-28T18:01:18Z (GMT). No. of bitstreams: 1
tiagohenrique_dissert.pdf: 1562127 bytes, checksum: 0d0b4da7bf071396a3c701c40e27e3ed (MD5)
Previous issue date: 2010-07-05 / Introduction: Lung cancer is the most common malignancy in human. The average
5 years survival rate is one of the lowest among aggressive cancers, showing no
significant improvement in recent years. When detected early, lung cancer has a
good prognosis, but most patients present metastatic disease at the time of
diagnostic, which significantly reduces survival rates. Despite all the recent
advances in cancer treatment, prognostic of these patients have improved
minimally. Objectives: The present study aimed to investigate the molecular profile
of non-small cell lung cancer as well as new tumor makers relevant to diagnosis and
prognosis of this disease. Methods: Total RNA from frozen surgical tissues was
extracted using TRIZOL reagent and RNeasy FFPE kit was used for RNA extraction
from formalin fixed, paraffin embedded tissue. Aiming to identify differentially
expressed genes involved in lung cancer, we analyzed combined data from normal
and tumor SAGE (Serial Analysis of Gene Expression) libraries available in the
public domain. Proteome profiling was also analyzed in adenocarcinoma, squamous
cell carcinoma and normal surgical margin samples using two-dimensional
electrophoresis and mass spectrometry. Results: The statistical analysis of SAGE
data indentified a subset of differentially expressed tags between normal surgical
margins and adenocarcinoma libraries. Three genes displaying differential regulation
in SAGE or proteomic analysis, two up- (COL3A1, CTSB) and one down-regulated
(ITGB1) in neoplastic cells, were selected for real-time polymerase chain reaction
(PCR) experiments using the same set of samples. Similar to the statistical results,
quantitative PCR confirmed the upregulation of COL3A1 and CTSB in carcinomas
when compared to tumor free tissues. Conclusion: RNA from frozen and arquived
samples is appropriate for amplification experiments by real time PCR, although with
lower efficiency among the last ones. Therefore, improved methods of RNA
extraction in arquived tissues are suitable for Real Time quantitative RT-PCR, and
may be used for gene expression profiling of paraffin embedded tissues from cancer
patients. To the best of our knowledge, this is the first study reporting SAGE data
analysis in lung cancer. The statistical approach as well as the proteomic evaluation
were effective in identifying differentially expressed genes and proteins reportedly
involved in cancer development and may be useful to disclose new tumor makers
relevant to lung tumorigenesis. / Introdução: O câncer de pulmão é a neoplasia humana mais comum. As taxas de
sobrevida em 5 anos estão entre as mais baixas para tumores agressivos e seus
valores não têm mostrado diferenças importantes nos últimos anos. Quando
detectado nos estágios precoces, o câncer de pulmão mostra bom prognóstico, mas
a maioria dos pacientes apresenta doença metastática no momento do diagnóstico,
o que reduz a sobrevida significativamente. Apesar de todo o progresso obtido nos
últimos anos em tratamento do câncer, o prognóstico desses pacientes permanece
desfavorável. Objetivos: O presente estudo teve como objetivo investigar o perfil
molecular de câncer de pulmão de células não pequenas, bem como de novos
marcadores tumorais relevantes para diagnóstico e prognóstico dessa doença.
Métodos: O RNA total de espécimes cirúrgicos congelados foi extraído pelo
método do trizol e o kit RNeasy FFPE foi utilizado para extração de RNA de tecidos
fixados em formalina e emblocados em parafina. Com o objetivo de identificar
genes diferencialmente expressos envolvidos em câncer de pulmão, dados
combinados de bibliotecas SAGE (Serial Analysis of Gene Expression) públicas
foram analisados. O perfil protéico foi também avaliado em amostras de
adenocarcinoma, carcinoma epidermóide e de margens cirúrgicas normais,
utilizando eletroforese bidimensional e espectrometria de massas. Resultados: A
análise estatística dos dados de SAGE identificou um conjunto de tags
diferencialmente expressas entre as bibliotecas de adenocarcinoma e de margens
cirúrgicas. Três genes com expressão alterada na análise de SAGE e de
proteômica, dois com níveis elevados (COL3A1, CTSB) e um com nível reduzido
(ITGB1) em células neoplásicas, foram selecionados para experimentos de PCR
(reação em cadeia da polimerase) em tempo real no mesmo conjunto de amostras.
Consistente com os resultados estatísticos, a PCR quantitativa confirmou a
expressão elevada de COL3A1 e CTSB em carcinomas quando comparados com o
tecido livre de tumor. Conclusão: O RNA de amostras congeladas e arquivadas é
adequado para amplificação por PCR em tempo real, embora exiba qualidade mais
baixa nessas últimas. Portanto, métodos otimizados para tecidos arquivados
permitem análises por PCR quantitativa e podem ser utilizados para avaliação do
perfil transcricional de espécimes embebidos em parafina procedentes de pacientes
com câncer. Este é aparentemente o primeiro estudo descrevendo a análise de
dados de SAGE em câncer de pulmão. As abordagens estatística e proteômica
foram efetivas em identificar genes e proteínas diferencialmente expressas
envolvidas no desenvolvimento do câncer e podem revelar novos marcadores
relevantes para a tumorigênese de pulmão.
|
77 |
Do ambiente aos genes : o uso de ferramentas bioinformáticas na procura de um mínimo denominador molecular e celular comum no espectro autistaZeidán-Chuliá, Fares January 2014 (has links)
O autismo pode ser definido como um transtorno associado ao desenvolvimento e caracterizado por prejuízo na interação social, na comunicação e no comportamento. Sua etiologia ainda é pouco conhecida, existindo alterações no desenvolvimento encefálico durante a embriogênese e na vida pós-natal. Sugere-se uma complexa interface entre fatores genéticos e ambientais. Existem provas que mostram uma desregulação do controle da homeostase e redes neuronais por parte de células astrogliais, ativação da microglia e respostas neuroinflamatórias no encéfalo de pacientes autistas até a idade adulta, representando uma alteração celular comum dentro do espectro autista (ASD). A grande variabilidade dos sintomas encontrados nos pacientes torna extremamente difícil a identificação de cascatas de sinalização comuns associadas com a patologia tipicamente autista, críticas para a procura de marcadores periféricos de diagnóstico e para identificar novos alvos terapêuticos. Neste trabalho, (i) caracterizamos a natureza multifatorial do autismo, funções moleculares, componentes celulares e processos biológicos associados, (ii) mostramos que RAC1, em particular, e a família das RHO GTPases, em geral, poderiam ter um papel crítico nos eventos neuropatológicos associados ao autismo, sendo o cálcio (Ca2+) a molécula mais central na complexa interface entre fatores genéticos e ambientais e (iii) sugerimos um modelo baseado na ativação da enzima α-secretase, mediada por receptores de glutamato (NMDARs), influxo de Ca2+, ativação de Erk e adaptação da mitocôndria a apoptose, como cascata de sinalização bioquímica que poderia explicar o aumento do volume encefálico e a falha da conectividade cerebral observada em crianças autistas e que, potencialmente, poderia ser tratada com derivados de magnésio e rapamicina. / Autism is a neurodevelopmental disorder characterized by specific activity patterns and aberrant social interaction and communication. Even though its etiology is not well understood, a number of neuropathological events during central nervous system development, in childhood and adolescence, have already been described. A complex interface between genetic and environmental factors is also suggested to account for the disorder. Evidence shows a deregulation of the homeostatic control of neuronal networks by astroglia, microglial activation, and neuroinflammation; changes that persist even until adulthood and may represent a common cellular disturbance in autism spectrum disorders (ASD). The great variability of symptoms found in the patients makes a difficult challenge the identification of disrupted signaling pathways associated to ASD, which is critical to identify potentially novel biomarkers for diagnoses as well as novel therapeutic targets. In the present study, (i) we characterized the multifactorial nature of autism, molecular functions, cellular components, and biological processes associated to the disorder, (ii) we showed RAC1, in particular, and the RHO family of GTPases, in general, could play a critical role in the neuropathological events associated with autism, with calcium (Ca2+) as the most central component in interface between genetic and environmental factors, and (iii) we proposed a model of glutamate receptors (NMDARs)-mediated Erk activation of α-secretase activity and mitochondrial adaptation to apoptosis that may explain the early brain overgrowth and disruption of synaptic plasticity and connectome in autistic children, which could potentially be targeted by magnesium-based drugs and rapamycin.
|
78 |
Arquiteturas em FPGA para comparação de sequências biológicas em espaço linear / FPGA architectures for biological sequence comparison in linear spaceCorrêa, Jan Mendonça 05 1900 (has links)
Tese (doutorado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2008. / Submitted by Jaqueline Oliveira (jaqueoliveiram@gmail.com) on 2008-12-04T18:50:12Z
No. of bitstreams: 1
TESE_2008_JanMendoncaCorrea.pdf: 1697042 bytes, checksum: 1f33d862081703c73ca93cae5ea50d48 (MD5) / Approved for entry into archive by Georgia Fernandes(georgia@bce.unb.br) on 2009-02-12T17:40:49Z (GMT) No. of bitstreams: 1
TESE_2008_JanMendoncaCorrea.pdf: 1697042 bytes, checksum: 1f33d862081703c73ca93cae5ea50d48 (MD5) / Made available in DSpace on 2009-02-12T17:40:50Z (GMT). No. of bitstreams: 1
TESE_2008_JanMendoncaCorrea.pdf: 1697042 bytes, checksum: 1f33d862081703c73ca93cae5ea50d48 (MD5) / O alinhamento de seqüências biológicas é uma das operações mais básicas em bioinformática, tendo por objetivo determinar a similaridade entre as seqüências. A solução deste problema envolve geralmente a comparação de seqüências através de programação dinâmica. Este tipo de comparação gera resultados ótimos mas possui complexidade quadrática de tempo,
justificando métodos para sua aceleração em hardware como o FPGA. Na presente tese foram projetadas arquiteturas wavefront em FPGA utilizando espaço linear para três diferentes algoritmos. O primeiro algoritmo foi o de Smith-Waterman. Ele foi implementado na forma de um vetor wavefront e foi utilizado na aceleração da fase inicial de
um algoritmo de alinhamento. Esta arquitetura foi capaz de recuperar o maior escore e posição em espaço linear. Esta arquitetura foi sintetizada em FPGA e o melhor resultado da arquitetura foi 246,9 vezes mais rápido que em software, demonstrando a utilidade da arquitetura. A seguir, foi projetada uma arquitetura para a recuperação do escore ótimo do algoritmo de programação dinâmica DIALIGN também em espaço linear. Foram obtidos resultados até 383,41 vezes superiores ao programa em software. Para recuperar o alinhamento ótimo no DIALIGN é necessário espaço quadrático. Assim, foi projetada uma variante do DIALIGN
capaz de recuperar o alinhamento de duas seqüências em espaço linear. Após a implementação em hardware, os resultados obtidos foram até 141,38 vezes mais rápido que a implementação em software.
______________________________________________________________________________________ ABSTRACT / The alignment of biological sequences is one of the more basic operations in bioinformatics.
Its purpose is to find the similarity between sequences. The solution to this problem generally involves sequence comparison through dynamic programming. This kind of comparison yields optimal results but has quadratic time complexity thus justifying its hardware acceleration in FPGA. In this thesis, linear space wavefront architectures were designed in FPGA for three different
algorithms. The first algorithm was Smith-Waterman. It was implemented in a wavefront array and utilized to accelerate the initial phase of a sequence alignment algorithm. This architecture was able to retrieve the largest score and its position in linear space. It was synthesized in
FPGA and the best result was 246,9 times faster than software, showing the appropriateness of the architecture. Also, an architecture to retrieve the optimal DIALIGN score in linear space was designed. The
results were up to 383,41 times better than software. The retrieval of the optimal alignment for DIALIGN needs quadratic space. Therefore, a variant for the DIALIGN dynamic programming algorithm was proposed to retrieve the alignment in linear space. This variant was implemented in hardware and the results were up to 141,38 times faster than the software implementation.
|
79 |
Classificador hierárquico multirrótulo usando uma rede neural competitiva / Helyane Bronoski Borges ; orientador, Júlio Cesar NievolaBorges, Helyane Bronoski January 2012 (has links)
Tese (doutorado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2012 / Bibliografia: f. 132-140 / Esta tese propõe um novo algoritmo baseado em Redes Neurais Artificiais (RNA)
Competitivas para classificação hierárquica multirrótulo usando a abordagem de classificação
global, no qual o classificador processa e avalia todas as classes da hierárquica / This thesis proposes a new algorithm based on Competitive Artificial Neural Networks for
multi-label hierarchical classification using the global approach, in which the classifier
processes and evaluates all classes in the hierarchy once. This approach,
|
80 |
Classificação hierárquica utilizando análise formal de conceitos / Mauri Ferrandin ; orientador, Bráulio Coelho Ávila ; co-orientador, Júlio Cesar NievolaFerrandin, Mauri January 2012 (has links)
Tese (doutorado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2012 / Bibliografia: f. 91-97 / Problemas de classificação hierárquica multirr´otulo na atualidade são considerados complexos e desafiadores por apresentarem grandes diferen¸cas em relação `a classificação plana. Fundamentalmente, na classificação hierárquica as classes estão organizada / Hierarchical multilabel classification problems are considered nowadays complex and challenging
because they had major dierences from the flat classification. Fundamentally, in
hierarchical classification classes are organized in a taxonomy represented
|
Page generated in 0.0691 seconds