301 |
Modeling spatial variation of data quality in databases /Mohamed-Ghouse, Mohamed Zaffar Sadiq. January 2008 (has links)
Thesis (Ph.D.)--University of Melbourne, Dept. of Geomatics, 2009. / Typescript. Includes bibliographical references (leaves 127-134)
|
302 |
An investigation of the development and adoption of educational metadata standards for the widespread use of learning objects /Krull, Greig Emil. January 2004 (has links)
Thesis (M.Com. (Information Systems))--Rhodes University, 2005.
|
303 |
Materialized Views over Heterogeneous Structured Data Sources in a Distributed Event Stream Processing EnvironmentJanuary 2011 (has links)
abstract: Data-driven applications are becoming increasingly complex with support for processing events and data streams in a loosely-coupled distributed environment, providing integrated access to heterogeneous data sources such as relational databases and XML documents. This dissertation explores the use of materialized views over structured heterogeneous data sources to support multiple query optimization in a distributed event stream processing framework that supports such applications involving various query expressions for detecting events, monitoring conditions, handling data streams, and querying data. Materialized views store the results of the computed view so that subsequent access to the view retrieves the materialized results, avoiding the cost of recomputing the entire view from base data sources. Using a service-based metadata repository that provides metadata level access to the various language components in the system, a heuristics-based algorithm detects the common subexpressions from the queries represented in a mixed multigraph model over relational and structured XML data sources. These common subexpressions can be relational, XML or a hybrid join over the heterogeneous data sources. This research examines the challenges in the definition and materialization of views when the heterogeneous data sources are retained in their native format, instead of converting the data to a common model. LINQ serves as the materialized view definition language for creating the view definitions. An algorithm is introduced that uses LINQ to create a data structure for the persistence of these hybrid views. Any changes to base data sources used to materialize views are captured and mapped to a delta structure. The deltas are then streamed within the framework for use in the incremental update of the materialized view. Algorithms are presented that use the magic sets query optimization approach to both efficiently materialize the views and to propagate the relevant changes to the views for incremental maintenance. Using representative scenarios over structured heterogeneous data sources, an evaluation of the framework demonstrates an improvement in performance. Thus, defining the LINQ-based materialized views over heterogeneous structured data sources using the detected common subexpressions and incrementally maintaining the views by using magic sets enhances the efficiency of the distributed event stream processing environment. / Dissertation/Thesis / Ph.D. Computer Science 2011
|
304 |
Método de representação de conhecimento baseado em ontologias para apoiar sistemas de recomendação educacionais / A method to describe knowledge with ontologies to support educational recommender systemsPrimo, Tiago Thompsen January 2013 (has links)
A expansão das tecnologias de comunicação e informação apoiadas pela internet trazem benefícios crescentes à sociedade. As redes sociais geolocalizadas, televisores que fazem uso da internet e avançados telefones celulares ganham popularidade em conjunto ao aumento da disponibilidade de acesso à internet. A utilização de tais meios para o compartilhamento de informações possibilita a construção de ambientes ricos em informação e conhecimento. Incorporar tais benefícios a ambientes educacionais, propondo métodos que façam uso da riqueza de informações inerentes a tais domínios, provendo a sugestão de conteúdos educacionais é o foco do presente trabalho. Para isto, é apresentado o arcabouço teórico das áreas de Sistemas de Recomendação, Ontologias, Metadados Educacionais e Web Semântica. Revisar os conceitos e o estado da arte de tais áreas conduz a uma análise crítica das mesmas, bem como, ao conjunto de práticas para a descrição de ontologias, que atuem como núcleo de conhecimento, para aplicações educacionais voltadas a recomendação de objetos de aprendizagem. Em conjunto, é também apresentada uma alternativa para que os desenvolvedores de sistemas educacionais possam repensar a maneira como estes estão sendo desenvolvidos, abrindo possibilidades para a agregação de serviços baseados na web semântica que facilitem integrações, filtros e compartilhamentos de informações. Os resultados obtidos através do método de representação de conhecimento que foi proposto neste trabalho, prevê a descrição de objetos de aprendizagem, perfis de usuários, como indivíduos de ontologias, bem como, perfis de aplicação que possibilitam raciocínio lógico visando auxiliar a sistemas de recomendação, e também uma proposta para a migração dos atuais repositórios de conteúdos educacionais para repositórios compatíveis com triplas, também compõe o presente trabalho. / It is a fact that the expansion of the communication and information technologies supported by the Internet brought growing benefits to the society. Geo-localized social networks, televisions that make use of the Internet and smartphones became popular with the wide spread of the Internet access. Information sharing among those devices took information and knowledge sharing at a new level. Incorporate such benefits to educational environments, especially when dealing with content suggestion it is the main focus of this work. To cope with this, we present a theoretical study over the areas of recommender systems, ontologies, educational metadata and semantic web. The study of such concepts and their following state of the art lead to a critical analyses, as also, to a set of practices to describe ontologies that can act as the knowledge core of learning object recommendation. Parallel to that, it is also presented an alternative for educational systems designers to reconsider the way that they are being developed, allowing the connection of a network of services, based on semantic web techniques, to provide knowledge filtering and sharing. The results present a set of practices that allow the description of learning objects and user profiles as ontology individuals, practices to build application profiles that allow reasoning over them, as also an alternative to migrate the current learning object repositories to a triple store.
|
305 |
Um serviço de geração de metadados compatível com o padrão OAI para o sistema JEMS / An OAI-Compatible Metadata Generation Service for the JEMS SystemContessa, Diego Fraga January 2006 (has links)
A publicação de trabalhos científicos é uma das principais formas de avanço da Ciência, dando aos autores o reconhecimento de seu trabalho por parte da comunidade científica. A divulgação de trabalhos publicados é de grande interesse tanto da parte de quem os desenvolve (autores), quanto de quem pode vir a se beneficiar dos resultados (a comunidade científica em geral). Neste contexto, as bibliotecas digitais surgem como uma alternativa para simplificar o processo de publicação de artigos. Nelas encontram-se repositórios de dados que possuem informações sobre os artigos publicados bem como links para os próprios artigos, ou mesmo os arquivos propriamente ditos. Dois pontos importantes na implementação e uso de bibliotecas digitais são a interoperabilidade e a padronização dos metadados que serão utilizados pelos repositórios. Essas questões podem ser resolvidas através da OAI (Open Archives Initiative) e pelo formato Dublin Core. Um exemplo de biblioteca digital que utiliza o padrão OAI é a BDBComp (Biblioteca Digital Brasileira de Computação), que disponibiliza os metadados sobre os artigos publicados nos eventos de computação no Brasil. Por outro lado, a SBC (Sociedade Brasileira de Computação) disponibiliza aos eventos que promove (e atualmente também a alguns eventos internacionais) o sistema JEMS para o gerenciamento das submissões dos artigos. Através dele os artigos são avaliados, e é feita a seleção daqueles que serão publicados em cada evento ou periódico que utiliza o sistema. Neste trabalho é apresentado um serviço de geração de metadados compatível com o padrão OAI, desenvolvido para disponibilizar os metadados sobre os artigos publicados nas conferências ou periódicos que utilizem o JEMS. Os metadados gerados são disponibilizados para bibliotecas digitais, como a BDBComp. O serviço é de fato um provedor de dados OAI, que utiliza dados provenientes do sistema JEMS e os disponibiliza no formato Dublin Core a bibliotecas digitais através do protocolo OAI-PMH, o qual é baseado em XML. Este provedor de dados foi desenvolvido para uso com a biblioteca digital da SBC, e oferece um aumento da quantidade e da qualidade dos metadados disponibilizados sobre os artigos publicados nos eventos e periódicos gerenciados pelo JEMS. / The publication of scientific works is one of the greatest forms of Science progress, giving the authors recognition from scientific community about their work. The publication spreading is of great interest for both the authors and those that can be benefited from the results. In this context, the digital libraries appear as an alternative to simplify the paper publication process. They own data repositories that have information about published papers as well as links for the papers. Two important points in the implementation and use of digital libraries are metadata interoperability and metadata standadization. These questions can be solved by the OAI (Open Archives Initiative) and by the Dublin Core format. An example of digital library that uses the OAI standard is BDBComp (Biblioteca Digital Brasileira de Computação), which have metadata about papers published in computing science events in Brazil. On the other hand, SBC (Sociedade Brasileira de Computação) have the JEMS system for use in the management of paper submission for the events that SBC promotes (and nowadays for some international events too). Through JEMS the papers are evaluated, and a selection of the accepted papers can be done. This work presents an OAI-compatible metadata generation service developed to offer metadata about the papers published in conferences or journals that use JEMS. The generated metadata are made available to digital libraries, like BDBComp. The service is in fact an OAI data provider that uses data obtained from JEMS and offer the metadata in the Dublin Core format to digital libraries, through the OAI-PMH protocol, which is based on XML. This data provider was developed for use with the SBC’s digital library. It gives an improvement on the quantity and quality of the available metadata about the papers published by the events and journals managed by JEMS.
|
306 |
METADADOS COMO ATRIBUTOS DA INFORMAÇÃO ESTRUTURADA EM BASES DE DADOS JORNALÍSTICAS NA WEB / METADATA AS ATTRIBUTES OF STRUCTURED INFORMATION ONLINE JOURNALISTIC DATABASESOLIVEIRA, ANDRÉ ROSA DE 19 September 2016 (has links)
Submitted by Noeme Timbo (noeme.timbo@metodista.br) on 2017-01-18T20:12:58Z
No. of bitstreams: 1
Andre Rosa de Oliveira2.pdf: 2626388 bytes, checksum: 533e5380fe29f3dfbd2b7bbb60a8b068 (MD5) / Made available in DSpace on 2017-01-18T20:12:58Z (GMT). No. of bitstreams: 1
Andre Rosa de Oliveira2.pdf: 2626388 bytes, checksum: 533e5380fe29f3dfbd2b7bbb60a8b068 (MD5)
Previous issue date: 2016-09-19 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Databases fed with news produced for the Web represent an information repository with technological potential to be reused in a number of ways and by other digital platforms connected via networks. This is one of the transformations in the journalistic production process, induced by the technological evolution which demand new abililites. Among them, the need to organise, recover and reuse this material. For this reason, this work intends to show how the adoption of structures based in metadata contributes to the development of news information produced and stored in these databases. Therefore, it relies on the concept of computational thinking to encourage the intersection of knowledges between Communications, Information and Computer Science, in addition to investigate the impact of this relationships in the routines of production and creation of media products. Propelled by the importance of the memory for the journalistic production and the discussions around the Web of Data and open semantic standards, the discussions also goes on the possibility of news channels to become platforms, encouraging to have invisible relationships between themes and contexts, the intersection between journalists and Web developers. Based on an exploratory study involving five media organisations, in the identification of attributes that characterize different levels of structuration and an analytical tool proposition based on features adopted by these vehicles, it is argued that the adoption of markups, controlled vocabulary schemas, formal onthologies or other schemas are crucial for journalism adaptation facing a new and constantly changing scenery. / Bases de dados abastecidas com notícias produzidas para a Web representam um repositório de informação com potencial tecnológico de ser reutilizado de inúmeras formas e por outras plataformas digitais conectadas via redes. No processo de produção jornalística, esta é uma das transformações provocadas pela evolução tecnológica que exigem novas habilidades ‒ entre elas, a necessidade de organizar, recuperar e reutilizar esse material. Diante disso, este trabalho pretende mostrar de que forma a adoção de estruturas baseadas em metadados contribui para o desenvolvimento da informação jornalística produzida e armazenada nessas bases. Para tanto, ele se apoia no conceito de pensamento computacional para encorajar o cruzamento de conhecimentos entre a Comunicação e as Ciências da Computação e da Informação, além de investigar o impacto dessas relações nas rotinas de produção e elaboração de produtos de mídia. Impulsionado pela importância da memória para a produção jornalística e pelas discussões em torno da Web de Dados e de padrões semânticos abertos, discute ainda a possibilidade de veículos noticiosos se tornarem plataformas, estimulando a obtenção de relações invisíveis entre temas e contextos, bem como a intersecção entre jornalistas e desenvolvedores. Com base em um estudo exploratório envolvendo cinco organizações de mídia, na identificação de atributos que caracterizem diferentes níveis de estruturação e na proposição de um instrumento de análise baseado em funcionalidades adotadas por esses veículos, defende-se que a adoção de marcações, esquemas com vocabulários controlados, ontologias formais ou outras estruturas são indispensáveis para a adaptação do Jornalismo diante de um cenário em constante mudança
|
307 |
Um serviço de geração de metadados compatível com o padrão OAI para o sistema JEMS / An OAI-Compatible Metadata Generation Service for the JEMS SystemContessa, Diego Fraga January 2006 (has links)
A publicação de trabalhos científicos é uma das principais formas de avanço da Ciência, dando aos autores o reconhecimento de seu trabalho por parte da comunidade científica. A divulgação de trabalhos publicados é de grande interesse tanto da parte de quem os desenvolve (autores), quanto de quem pode vir a se beneficiar dos resultados (a comunidade científica em geral). Neste contexto, as bibliotecas digitais surgem como uma alternativa para simplificar o processo de publicação de artigos. Nelas encontram-se repositórios de dados que possuem informações sobre os artigos publicados bem como links para os próprios artigos, ou mesmo os arquivos propriamente ditos. Dois pontos importantes na implementação e uso de bibliotecas digitais são a interoperabilidade e a padronização dos metadados que serão utilizados pelos repositórios. Essas questões podem ser resolvidas através da OAI (Open Archives Initiative) e pelo formato Dublin Core. Um exemplo de biblioteca digital que utiliza o padrão OAI é a BDBComp (Biblioteca Digital Brasileira de Computação), que disponibiliza os metadados sobre os artigos publicados nos eventos de computação no Brasil. Por outro lado, a SBC (Sociedade Brasileira de Computação) disponibiliza aos eventos que promove (e atualmente também a alguns eventos internacionais) o sistema JEMS para o gerenciamento das submissões dos artigos. Através dele os artigos são avaliados, e é feita a seleção daqueles que serão publicados em cada evento ou periódico que utiliza o sistema. Neste trabalho é apresentado um serviço de geração de metadados compatível com o padrão OAI, desenvolvido para disponibilizar os metadados sobre os artigos publicados nas conferências ou periódicos que utilizem o JEMS. Os metadados gerados são disponibilizados para bibliotecas digitais, como a BDBComp. O serviço é de fato um provedor de dados OAI, que utiliza dados provenientes do sistema JEMS e os disponibiliza no formato Dublin Core a bibliotecas digitais através do protocolo OAI-PMH, o qual é baseado em XML. Este provedor de dados foi desenvolvido para uso com a biblioteca digital da SBC, e oferece um aumento da quantidade e da qualidade dos metadados disponibilizados sobre os artigos publicados nos eventos e periódicos gerenciados pelo JEMS. / The publication of scientific works is one of the greatest forms of Science progress, giving the authors recognition from scientific community about their work. The publication spreading is of great interest for both the authors and those that can be benefited from the results. In this context, the digital libraries appear as an alternative to simplify the paper publication process. They own data repositories that have information about published papers as well as links for the papers. Two important points in the implementation and use of digital libraries are metadata interoperability and metadata standadization. These questions can be solved by the OAI (Open Archives Initiative) and by the Dublin Core format. An example of digital library that uses the OAI standard is BDBComp (Biblioteca Digital Brasileira de Computação), which have metadata about papers published in computing science events in Brazil. On the other hand, SBC (Sociedade Brasileira de Computação) have the JEMS system for use in the management of paper submission for the events that SBC promotes (and nowadays for some international events too). Through JEMS the papers are evaluated, and a selection of the accepted papers can be done. This work presents an OAI-compatible metadata generation service developed to offer metadata about the papers published in conferences or journals that use JEMS. The generated metadata are made available to digital libraries, like BDBComp. The service is in fact an OAI data provider that uses data obtained from JEMS and offer the metadata in the Dublin Core format to digital libraries, through the OAI-PMH protocol, which is based on XML. This data provider was developed for use with the SBC’s digital library. It gives an improvement on the quantity and quality of the available metadata about the papers published by the events and journals managed by JEMS.
|
308 |
Proposta para criação e catalogação de objetos de aprendizagem interoperáveis / A proposal for interoperable learning objects construction and cataloguingBordignon, Alexandro January 2010 (has links)
Até pouco tempo, o computador pessoal era o único dispositivo disponível para acesso a conteúdo digital. Com a introdução da TV digital interativa no Brasil e a evolução dos aparelhos celulares, essas plataformas se tornaram alternativas de acesso em momentos onde não está presente um computador e também como opção para a população de menor poder aquisitivo, visto que são dispositivos mais baratos. Porém, o desenvolvimento de objetos de aprendizagem ainda continua sendo pensado para uma única plataforma, desperdiçando grande parte do potencial de uso. Quando raramente são previstos para mais de uma plataforma, o desenvolvimento de cada versão é realizado de forma isolada, gerando redundância de conteúdo e elevando desnecessariamente o custo de criação e manutenção. Nesse contexto, este trabalho traz uma nova abordagem visando a criação de objetos de aprendizagem interoperáveis, ou seja, desenvolvidos de forma que o mesmo conteúdo possa ser executado nas plataformas Web, TV digital e dispositivos móveis. Para isso, inicialmente foram identificados os recursos e restrições existentes em cada uma das plataformas citadas, assim como as principais recomendações de usabilidade. O resultado desse estudo gerou as seguintes recomendações: a) mecanismo de construção de conteúdo uma única vez de forma que ele se adapte para todas as plataformas; b) mecanismos de adaptação da mesma mídia visando seguir critérios de usabilidade de cada plataforma (ex: tamanho e cor do texto); c) mecanismos de reconhecimento de cada plataforma e envio da mídia adequada para cada uma. Outro aspecto complementar tratado foi em relação à catalogação de objetos de aprendizagem, uma vez que os padrões de metadados educacionais existentes não prevêem o uso de objetos de aprendizagem por diferentes plataformas. Em função dessa necessidade, realizou-se o estudo dos principais padrões de metadados educacionais, assim como os utilizados nas plataformas Web e de TV digital. Como resultado, duas extensões foram propostas aos padrões de metadados educacionais, possibilitando: a) indicar em quais plataformas é possível utilizar o objeto de aprendizagem e b) criar segmentos lógicos de um objeto de aprendizagem e, opcionalmente, agrupá-los por características em comum. Para validação, foram efetuadas algumas implementações de diferentes objetos de aprendizagem. Esses objetos de aprendizagem também foram catalogados com as extensões de metadados propostas, exemplificando seu uso. / Until recently, the personal computer was the unique device available for accessing digital content. With the introduction of interactive digital television in Brazil and the evolution of mobile phones, these platforms have become alternatives for content accessing in moments where the personal computer is not available. Additionally, it is an option for people with less purchasing capability, since they are cheaper devices. However, development of learning objects is still being designed for a single platform, wasting much of its potential usage. When rarely provided for more than one platform, the development of each version is performed in isolation, creating redundant content and unnecessarily raising the cost of construction and maintenance. In this context, this dissertation presents a new approach towards the creation of interoperable learning objects, i.e., developed in a way that the same content can be executed over the Web, digital television, and mobile devices. For that, the resources and restrictions for the above platforms were initially identified, as well the main interface usability recommendations. The result of this study generated the following recommendations: a) mechanisms to create the content just once in a way that adapts itself for each platform; b) mechanisms for media adaptation, following usability recommendations for each platform (font size and color, for example); c) mechanisms to recognize client platform and send the adequate media. Another complementary aspect that was considered is learning object cataloguing, since the existing educational metadata standards do not foresee the usage of learning objects towards different platforms. Based in this need, the study of main educational metadata standards was done, like as those used in Web and digital television. As result, two extensions were proposed to the educational metadata standards, allowing: a) the indication of in which platform it is possible to use the learning object and b) the creation of learning object logical segments and, optionally, the possibility grouping themselves by common features. For validation, some different learning objects implementations were performed. Those learning objects have also been cataloged with the proposed metadata extensions, illustrating their use.
|
309 |
MD-PROM : um mecanismo de deduplicação de metadados e rastreio da proveniência / MD-PROM : a mechanism for metadata deduplication and provenance tracingBorges, Eduardo Nunes January 2008 (has links)
Bibliotecas digitais são repositórios de objetos digitais que oferecem serviços aos seus usuários como pesquisa e publicação desses objetos. Cada objeto digital é descrito por um conjunto de metadados que especifica a forma como esse objeto pode ser recuperado. Sistemas de integração de bibliotecas digitais indexam objetos digitais adquiridos de fontes diferentes, os quais podem estar representados através de vários padrões de metadados. Estes metadados são heterogêneos tanto em conteúdo quanto em estrutura. Conseqüentemente, os sistemas de integração de bibliotecas digitais não estão aptos a fornecer respostas livres de informação redundante que integrem as várias fontes de dados. Quando um usuário realiza uma consulta sobre várias bibliotecas digitais, é interessante que sejam retornados metadados integrados das diversas fontes e a origem de cada informação recuperada, ou seja, a biblioteca digital que publicou aquela informação (metadado). O uso de proveniência de dados nas consultas a metadados em sistemas de integração de bibliotecas digitais, de modo a rastrear a origem das informações recuperadas, permite que usuários avaliem a qualidade das bibliotecas digitais. Este trabalho apresenta o MD-PROM (Metadata Deduplication and PROvenance tracing Mechanism), um mecanismo de deduplicação de metadados e rastreio da proveniência. Este mecanismo identifica metadados de objetos digitais duplicados em bibliotecas digitais distintas, integra os metadados duplicados e recupera informações de proveniência dos metadados integrados. A identificação de duplicatas é realizada através do casamento automático de esquemas dos metadados e da aplicação de funções de similaridade sobre os principais metadados que descrevem os objetos digitais. São propostas a função de similaridade de nomes próprios IniSim, o algoritmo de casamento de autores NameMatch e o algoritmo de casamento de objetos digitais Digital Object Match que identifica múltiplas representações dos metadados. Além dos algoritmos de similaridade, o MD-PROM especifica uma estrutura baseada em árvore para representar a proveniência de dados que identifica a origem dos metadados, bem como os valores dos quais os metadados foram derivados. Também é proposto um algoritmo de integração de metadados e rastreio da proveniência denominado MetadataProv. A principal contribuição do trabalho é melhorar a qualidade da pesquisa do usuário de bibliotecas digitais. O MD-PROMfornece uma resposta única, livre de redundância e sem perda de informação relevante para consultas a metadados de objetos digitais oriundos de bibliotecas digitais distintas. Além disso, são recuperadas informações de proveniência que permitem ao usuário verificar a veracidade e confiabilidade dos metadados retornados pelas consultas em sistemas de integração de bibliotecas digitais. São apresentados também os resultados de diversos experimentos que avaliam a qualidade da deduplicação de objetos digitais comparando a técnica proposta com outras abordagens estudadas. / Digital libraries are repositories of digital objects that provide services to their users such as search and publication of these objects. Each digital object is described by a set of metadata that specifies how this object can be retrieved. Integrated digital library systems index digital objects acquired from different sources, which can be represented through several metadata patterns. These metadata are heterogeneous both in content and in structure. Consequently, the integrated digital library systems are not able to provide answers free from redundant information that integrate the several data sources. When a user performs a query on various digital libraries, it is interesting to return integrated metadata from several sources and the origin of each information retrieved, that is, the digital library which published that information (metadata). Using data provenance in metadata queries on integrated digital library systems, so as to trace the origin of the information retrieved, allows users to analyze the quality of digital libraries. This work presents MD-PROM (Metadata Deduplication and PROvenance tracing Me- chanism), a mechanism for metadata deduplication and provenance tracing. This mechanism identifies duplicated digital objects metadata in different digital libraries, integrates duplicated metadata and retrieves provenance information of the integrated metadata. The identification of duplicates is performed through automatic metadata schema matching and through similarity functions applied over main metadata that describe the digital objects. The surname similarity function IniSim, the authors matching algorithm NameMatch and digital objects matching algorithm Digital Object Match, which identifies multiple representations of metadata, have been proposed. Besides the similarity algorithms, MD-PROM specifies a tree-based structure to represent the data provenance that identifies the origin of metadata as well as the values from which the metadata were derived. An algorithm for the integration of metadata and provenance tracing, called MetadataProv, is also proposed. The main contribution of this work is to improve the quality of the searches posed by the users of digital libraries. MD-PROM provides a single answer, free from redundancy and loss of relevant information related to queries on digital objects metadata from different digital libraries. In addition, provenance information is retrieved allowing the user to verify the accuracy and the reliability of the metadata returned by queries on integrated digital library systems. There are also reports on several experiments, which evaluate the quality of the deduplication of digital objects comparing the proposed technique with other approaches.
|
310 |
Extração de metadados utilizando uma ontologia de domínio / Metadata extraction using a domain ontologyOliveira, Luis Henrique Gonçalves de January 2009 (has links)
O objetivo da Web Semântica é prover a descrição semântica dos recursos através de metadados processáveis por máquinas. Essa camada semântica estende a Web já existente agregando facilidades para a execução de pesquisas, filtragem, resumo ou intercâmbio de conhecimento de maior complexidade. Dentro deste contexto, as bibliotecas digitais são as aplicações que estão iniciando o processo de agregar anotações semânticas às informações disponíveis na Web. Uma biblioteca digital pode ser definida como uma coleção de recursos digitais selecionados segundo critérios determinados, com alguma organização lógica e de modo acessível para recuperação distribuída em rede. Para facilitar o processo de recuperação são utilizados metadados para descrever o conteúdo armazenado. Porém, a geração manual de metadados é uma tarefa complexa e que demanda tempo, além de sujeita a falhas. Portanto a extração automática ou semi-automática desses metadados seria de grande ajuda para os autores, subtraindo uma tarefa do processo de publicação de documentos. A pesquisa realizada nesta dissertação visou abordar esse problema, desenvolvendo um extrator de metadados que popula uma ontologia de documentos e classifica o documento segundo uma hierarquia pré-definida. A ontologia de documentos OntoDoc foi criada para armazenar e disponibilizar os metadados extraídos, assim como a classificação obtida para o documento. A implementação realizada focou-se em artigos científicos de Ciência da Computação e utilizou a classificação das áreas da ACM na tarefa de classificação dos documentos. Um conjunto de exemplos retirados da Biblioteca Digital da ACM foi gerado para a realização do treinamento e de experimentos sobre a implementação. As principais contribuições desta pesquisa são o modelo de extração de metadados e classificação de documentos de forma integrada e a descrição dos documentos através de metadados armazenados em um ontologia, a OntoDoc. / The main purpose of the Semantic Web is to provide machine processable metadata that describes the semantics of resources to facilitate the search, filter, condense, or negotiate knowledge for their human users. In this context, digital libraries are applications where the semantic annotation process of information available in the Web is beginning. Digital library can be defined as a collection of digital resources selected by some criteria, with some organization and available through distributed network retrieval. To facilitate the retrieval process, metadata are applied to describe stored content. However, manual metadata generation is a complex task, time-consuming and error-prone. Thus, automatic or semiautomatic metadata generation would be great help to the authors, subtracting this task from the document publishing process. The research in this work approached this problem through the developing of a metadata extractor that populates a document ontology and classify the document according to a predefined hierarchy. The document ontology OntoDoc was created to store and to make available all the extracted metadata, as well as the obtained document classification. The implementation aimed on Computer Science papers and used the ACM Computing Classification system in the document classification task. A sample set extracted from the ACM Digital Libray was generated for implementation training and validation. The main contributions of this work are the integrated metadata extraction and classification model and the description of documents through a metadata stored in an ontology.
|
Page generated in 0.0636 seconds