1 |
[en] A CONCEPTUAL MODEL FOR MOLECULAR BIOLOGY / [pt] UM MODELO CONCEITUAL PARA BIOLOGIA MOLECULARJOSE ANTONIO FERNANDES DE MACEDO 17 March 2006 (has links)
[pt] Projetos de genômica e biológica molecular estão gerando
dados cujos volumes e complexidades jamais foram
observados nesta área. Além disso, fontes de dados e de
conhecimento são produzidas e utilizadas por grupos de
pesquisa os quais utilizam terminologias diferentes
(sinônimos, apelido e fórmulas), sintaxes diferentes
(estrutura de arquivos e separadores) e semânticas
diferentes (intra e interdisciplinares homônimos). O
sucesso da pesquisa em biologia dependerá da correta
representação e manipulação dos dados biológicos
permitindo os cientistas criarem, gerenciarem,
manipularem, integrarem e analisarem os dados de forma a
gerar informação e conhecimento. Neste trabalho, estudamos
os problemas para representação de dados biológicos
apresentados nas principais linguagens de modelagem
tradicionais. Em seguida, levantamos os requisitos para um
novo modelo de dados conceitual para biologia molecular.
Finalmente, propomos um novo modelo conceitual contendo
construtores específicos para solucionar alguns dos
problemas estudados. Além disso, formalizamos o modelo
proposto usando lógica de primeira ordem e utilizamos esta
descrição lógica para realizar inferências que auxiliem o
trabalho do projetista de banco de dados durante a criação
de um esquema de banco de dados. / [en] Genomic and molecular biology projects are generating
knowledge data whose volume and complexity are
unparalleled in this research area. In addition, data and
knoweledge sources produced and used by research groups
have terminological differences (synonyms, aliases and
formulae), syntactic differences (file structure,
separators and spelling) and semantic differences (intra-
and interdisciplinary homonyms). In this context, data
management techniques play a fundamental role for
biological applications development because it offers
adequate abstractions to desing, implement, access and
manage data, in order to generate knowledge. In this work,
we study the representation problems presentd in
traditional languages. Following, we raise the main
requiremants for a new conceptual data model specially
conceived for molecular biology. Finally, we propose a new
conceptual data model with special types of constructor
tryng to solve some of the representation problems
discurssed before. In addition, we formalize our proposed
model using first-order logic and we use this logical
description to infer some properties that may help
database designer during the elaboration of database
schema.
|
2 |
[en] A NEW LAYERED APPROACH TO BIOLOGICAL DATA REPRESENTATION AND ITS APPLICATIONS COMPARING SEQUENCES / [pt] UMA NOVA ABORDAGEM EM CAMADAS PARA REPRESENTAÇÃO DE DADOS BIOLÓGICOS E SUAS APLICAÇÕES EM COMPARAÇÃO DE SEQUÊNCIASDIOGO MUNARO VIEIRA 09 December 2024 (has links)
[pt] A identificação e categorização de proteínas homólogas são tarefas fundamentais no campo da biologia, que dependem de ferramentas que analisam
sequências de nucleotídeos ou aminoácidos. No entanto, a detecção automatizada de padrões evolutivos, assim como outras características, usando métodos tradicionais, ainda apresenta desafios científicos. Neste estudo, propomos
uma nova abordagem de representação de dados em camadas, que permite
explorar padrões evolutivos e outras características de sequências na busca
por similaridades, classificação e agrupamento. Utiliza-se um processo livre de
alinhamento e são propostos novos algoritmos de similaridade que permitem
aprimorar a eficácia dessa abordagem. Esses algoritmos utilizam técnicas inspiradas na percepção humana para capturar similaridades dentro das representações de moléculas biológicas. Avaliações experimentais demonstram bom
desempenho e alta precisão em comparação com abordagens propostas anteriormente. Essa representação em camadas se mostra promissora na identificação
de proteínas similares, principalmente com características de homólogas distantes. Além disso, sugere-se também o desenvolvimento de novos métodos
e algoritmos de aprendizado de máquina em bioinformática que envolvam a
privacidade e segurança de dados biológicos. / [en] The identification and categorization of homologous proteins are fundamental tasks in the field of biology, relying on tools that analyze nucleotide oramino acid sequences. However, automated detection of evolutionary patternsand additional attributes using traditional methods still presents research challenges. In this study, we propose a novel layered data representation approachthat allows us to explore evolutionary patterns and other sequence features insimilarity searching, classification, and clustering. It employs an alignment-freeprocess, and we introduce new similarity algorithms to enhance the effectiveness of this approach. These algorithms leverage techniques inspired by humanperception to capture subtle similarities within biological molecules representations. Experimental evaluations demonstrate good performance and high accuracy compared to previously proposed approaches. This layered representationshows promise in identifying similar proteins, especially with distant homologscharacteristics. Furthermore, it also suggests the development of new methods and machine learning (ML) algorithms in bioinformatics that address theprivacy and security of biological data.
|
Page generated in 0.0414 seconds