[pt] Uma das estratégias mais populares para publicar dados estruturados na Web é
expor bases de dados relacionais (BDR) em formato RDF. Esse processo é
chamado BDR-para-RDF ou triplificação. Além disto, princípios de Linked Data
oferecem vários guias para dar suporte a este processo. Existem duas principais
abordagens para mapear bases de dados relacionais para RDF: (1) a abordagem de
mapeamento direto, onde o esquema das bases de dados é diretamente mapeado
para um esquema RDF, e (2) a abordagem de mapeamento customizado, onde o
esquema RDF pode ser significativamente diferente do esquema original da base
de dados relacional. Em ambas abordagens, existem vários desafios relacionados
tanto com a publicação quanto com o uso de dados em RDF originados de bases
de dados relacionais. Esta tese propõe a coleta de design rationale como uma
valiosa fonte de informação para minimizar os desafios do processo de
triplificação. Essencialmente, a coleta de design rationale melhora a consciência
sobre as ações feitas no mapeamento da base de dados relacional para um
conjunto de dados no formato RDF. As principais contribuições da tese são: (1)
um modelo de design rationale (DR) adequado para o processo de BDR-para-
RDF, independente da abordagem utilizada (direta ou customizada); (2) a
integração de um modelo de DR para um processo que segue a abordagem direta
de BDR-para-RDF e para um processo que segue a abordagem customizada
usando a linguagem R2RML; (3) o uso do DR coletado para melhorar
recomendações de reuso de vocabulários existentes através de algoritmos de
Ontology Matching. / [en] One of the most popular strategies to publish structured data on the Web is to
expose relational databases (RDB) in the RDF format. This process is called in
RDB-to-RDF or triplification. Furthermore, the Linked Data principles offer
useful guidelines for this process. Broadly stated, there are two main approaches
to map relational databases into RDF: (1) the direct mapping approach, where the
database schema is directly mapped to an RDF schema; and (2) the customized
mapping approach, where the RDF schema may significantly differ from the
original database schema. In both approaches, there are challenges related to the
publication and to the consumption of the published data. This thesis proposes the
capture of design rationale as a valuable source of information to minimize the
challenges in RDB-to-RDF processes. Essentially, the capture of design rationale
increases the awareness about the actions taken over the relational database to
map it as an RDF dataset. The main contributions of this thesis are: (1) a design
rationale (DR) model adequate to RDB-to-RDF processes, independently of the
approach (direct or customized) followed; (2) the integration of a DR model in an
RDB-to-RDF direct mapping process and in an RDB-to-RDF customized
mapping process using the R2RML language; (3) the use of the DR captured to
improve the recommendations for vocabularies to reuse.
Identifer | oai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:27082 |
Date | 02 August 2016 |
Creators | RITA CRISTINA GALARRAGA BERARDI |
Contributors | MARCO ANTONIO CASANOVA, MARCO ANTONIO CASANOVA |
Publisher | MAXWELL |
Source Sets | PUC Rio |
Language | English |
Detected Language | Portuguese |
Type | TEXTO |
Page generated in 0.0042 seconds