Spelling suggestions: "subject:"[een] RDB-TO-RDF"" "subject:"[enn] RDB-TO-RDF""
1 |
[en] W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION / [pt] W-RAY: UMA ABORDAGEM PARA PUBLICAÇÃO DE DADOS DA DEEP WEBHELENA SERRAO PICCININI 29 September 2014 (has links)
[pt] Deep Web é composta por dados armazenados em bases de dados, páginas dinâmicas, páginas com scripts e dados multimídia, dentre outros tipos de objetos. Os bancos de dados da Deep Web são geralmente sub-representados pelos motores de busca, devido aos desafios técnicos de localizar, acessar e indexar seus dados. A utilização de hyperlinks pelos motores de busca não é suficente para alcançar todos os dados da Deep Web, exigindo interação com interfaces de consultas complexas. Esta tese apresenta uma abordagem, denominada W-Ray, capaz de fornecer visibilidade aos dados da Deep Web. A abordagem baseia-se na descrição dos dados relevantes através de sentenças bem estruturadas, e na publicação dessas sentenças em páginas estáticas da Web. As sentenças podem ser geradas com RDFa embutido, mantendo a semântica do banco de dados. As páginas da Web assim geradas são passíveis de ser indexadas pelos motores de coleta de dados tradicionais e por motores mais sofisticados que suportam busca semântica. É apresentada também uma ferramenta que apóia a abordagem W-Ray. A abordagem foi implementada com sucesso para diferentes bancos de dados reais. / [en] The Deep Web comprises data stored in databases, dynamic pages, scripted pages and multimedia data, among other types of objects. The databases of the Deep Web are generally underrepresented by the search engines due to the technical challenges of locating, accessing and indexing them. The use of hyperlinks by search engines is not sufficient to achieve all the Deep Web data, requiring interaction with complex queries interfaces. This thesis presents an approach, called W-Ray, that provides visibility to Deep Web data. The approach relies on describing the relevant data through well-structured sentences, and on publishing the sentences as static Web pages. The sentences can be generated with embedded RDFa, keeping the semantics of the database. The Web pages thus generated are indexed by traditional Web crawlers and sophisticated crawlers that support semantic search. It is also presented a tool that supports the W-Ray approach. The approach has been successfully implemented for some real databases.
|
2 |
[en] DESIGN RATIONALE IN THE TRIPLIFICATION OF RELATIONAL DATABASES / [pt] DESIGN RATIONALE NA TRIPLIFICAÇÃO DE BANCOS DE DADOS RELACIONAISRITA CRISTINA GALARRAGA BERARDI 02 August 2016 (has links)
[pt] Uma das estratégias mais populares para publicar dados estruturados na Web é
expor bases de dados relacionais (BDR) em formato RDF. Esse processo é
chamado BDR-para-RDF ou triplificação. Além disto, princípios de Linked Data
oferecem vários guias para dar suporte a este processo. Existem duas principais
abordagens para mapear bases de dados relacionais para RDF: (1) a abordagem de
mapeamento direto, onde o esquema das bases de dados é diretamente mapeado
para um esquema RDF, e (2) a abordagem de mapeamento customizado, onde o
esquema RDF pode ser significativamente diferente do esquema original da base
de dados relacional. Em ambas abordagens, existem vários desafios relacionados
tanto com a publicação quanto com o uso de dados em RDF originados de bases
de dados relacionais. Esta tese propõe a coleta de design rationale como uma
valiosa fonte de informação para minimizar os desafios do processo de
triplificação. Essencialmente, a coleta de design rationale melhora a consciência
sobre as ações feitas no mapeamento da base de dados relacional para um
conjunto de dados no formato RDF. As principais contribuições da tese são: (1)
um modelo de design rationale (DR) adequado para o processo de BDR-para-
RDF, independente da abordagem utilizada (direta ou customizada); (2) a
integração de um modelo de DR para um processo que segue a abordagem direta
de BDR-para-RDF e para um processo que segue a abordagem customizada
usando a linguagem R2RML; (3) o uso do DR coletado para melhorar
recomendações de reuso de vocabulários existentes através de algoritmos de
Ontology Matching. / [en] One of the most popular strategies to publish structured data on the Web is to
expose relational databases (RDB) in the RDF format. This process is called in
RDB-to-RDF or triplification. Furthermore, the Linked Data principles offer
useful guidelines for this process. Broadly stated, there are two main approaches
to map relational databases into RDF: (1) the direct mapping approach, where the
database schema is directly mapped to an RDF schema; and (2) the customized
mapping approach, where the RDF schema may significantly differ from the
original database schema. In both approaches, there are challenges related to the
publication and to the consumption of the published data. This thesis proposes the
capture of design rationale as a valuable source of information to minimize the
challenges in RDB-to-RDF processes. Essentially, the capture of design rationale
increases the awareness about the actions taken over the relational database to
map it as an RDF dataset. The main contributions of this thesis are: (1) a design
rationale (DR) model adequate to RDB-to-RDF processes, independently of the
approach (direct or customized) followed; (2) the integration of a DR model in an
RDB-to-RDF direct mapping process and in an RDB-to-RDF customized
mapping process using the R2RML language; (3) the use of the DR captured to
improve the recommendations for vocabularies to reuse.
|
Page generated in 0.0267 seconds