Submitted by Irene Nascimento (irene.kessia@ufpe.br) on 2017-03-14T18:10:49Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação Hugo Santos de Oliveira - Versão Depósito Bib Central.pdf: 2529045 bytes, checksum: a83fb438eaa8daaa0b4dcba01cb0b729 (MD5) / Made available in DSpace on 2017-03-14T18:10:49Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação Hugo Santos de Oliveira - Versão Depósito Bib Central.pdf: 2529045 bytes, checksum: a83fb438eaa8daaa0b4dcba01cb0b729 (MD5)
Previous issue date: 2015-08-14 / Modelos de dados tabulares têm sido amplamente utilizados para a publicação de dados na
Web, devido a sua simplicidade de representação e facilidade de manipulação. Entretanto,
nem sempre os dados são dispostos em arquivos tabulares de maneira adequada, o que
pode causar dificuldades no momento do processamento dos dados. Dessa forma, o
consórcio W3C tem trabalhado em uma proposta de especificação padrão para
representação de dados em formatos tabulares. Neste contexto, este trabalho tem como
objetivo geral propor uma solução para o problema de validação de arquivos de Dados
Tabulares. Estes arquivos, são representados no formato CSV e descritos por metadados,
os quais são representados em JSON e definidos de acordo com a especificação proposta
pelo W3C. A principal contribuição deste trabalho foi a definição do processo de
validação de arquivos de dados tabulares e dos algoritmos necessários para a execução
desse processo, além da implementação de um protótipo que tem por objetivo realizar a
validação dos dados tabulares, conforme especificado pelo W3C. Outra importante
contribuição foi a realização de experimentos com fontes de dados disponíveis na Web,
com o objetivo de avaliar a abordagem proposta neste trabalho. / Tabular data models have been used a lot for publishing data on the Web because of its
simplicity of representation and easy manipulation. However, in some cases the data are
not disposed in tabular files appropriately, which can cause data processing problems.
Thus, the W3C proposed a standard specification for representing data in tabular format.
In this context this work has as main objective to propose a solution to the problem of
validating tabular data files, represented in CSV, files and described by metadata
represented as JSON files and described, according to the specification proposed by the
W3C. The main contribution of this work is the definition of a tabular data file validation
process and algorithms necessary for the implementation of this process as well as the
implementation of a prototype that aimed to validate tabular data as specified by the
W3C. Other important contribution is the execution of experiments with data sources
available on the Web with the objective to evaluate the approach proposed in this work.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/18413 |
Date | 14 August 2015 |
Creators | OLIVEIRA, Hugo Santos |
Contributors | http://lattes.cnpq.br/2512064355660153, LÓSCIO, Bernadette Farias |
Publisher | Universidade Federal de Pernambuco, Programa de Pos Graduacao em Ciencia da Computacao, UFPE, Brasil |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess |
Page generated in 0.0035 seconds