Spelling suggestions: "subject:"ehe semantic web"" "subject:"hhe semantic web""
261 |
A framework for event classification in Tweets based on hybrid semantic enrichment / Um framework para classificação de eventos em tweets baseado em enriquecimento semântico híbridoRomero, Simone Aparecida Pinto January 2017 (has links)
As plataformas de Mídias Sociais se tornaram um meio essencial para a disponibilização de informações. Dentre elas, o Twitter tem se destacado, devido ao grande volume de mensagens que são compartilhadas todos os dias, principalmente mencionando eventos ao redor do mundo. Tais mensagens são uma importante fonte de informação e podem ser utilizadas em diversas aplicações. Contudo, a classificação de texto em tweets é uma tarefa não trivial. Além disso, não há um consenso quanto à quais tarefas devem ser executadas para Identificação e Classificação de Eventos em tweets, uma vez que as abordagens existentes trabalham com tipos específicos de eventos e determinadas suposições, que dificultam a reprodução e a comparação dessas abordagens em eventos de natureza distinta. Neste trabalho, nós elaboramos um framework para a classificação de eventos de natureza distinta. O framework possui os seguintes elementos chave: a) enriquecimento externo a partir da exploração de páginas web relacionadas, como uma forma de complementar a extração de features conceituais do conteúdo dos tweets; b) enriquecimento semântico utilizando recursos da Linked Open Data cloud para acrescentar features semânticas relacionadas; e c) técnica de poda para selecionar as features semânticas mais discriminativas Nós avaliamos o framework proposto através de um vasto conjunto de experimentos, que incluem: a) sete eventos alvos de natureza distinta; b) diferentes combinações das features conceituais propostas (i.e. entidades, vocabulário, e a combinação de ambos); c) estratégias distintas para a extração de features (i.e. a partir do conteúdo dos tweets e das páginas web); d) diferentes métodos para a seleção das features semânticas mais relevantes de acordo com o domínio (i.e. poda, seleção de features, e a combinação de ambos); e) dois algoritmos de classificação. Nós também comparamos o desempenho do framework em relação a outro método utilização para o enriquecimento contextual, o qual tem como base word embeddings. Os resultados mostraram as vantagens da utilização do framework proposto e que a nossa solução é factível e generalizável, dando suporte a classificação de diferentes tipos de eventos. / Social Media platforms have become key as a means of spreading information, opinions or awareness about real-world events. Twitter stands out due to the huge volume of messages about all sorts of topics posted every day. Such messages are an important source of useful information about events, presenting many useful applications (e.g. the detection of breaking news, real-time awareness, updates about events). However, text classification on Twitter is by no means a trivial task that can be handled by conventional Natural Language Processing techniques. In addition, there is no consensus about the definition of which kind of tasks are executed in the Event Identification and Classification in tweets, since existing approaches often focus on specific types of events, based on specific assumptions, which makes it difficult to reproduce and compare these approaches in events of distinct natures. In this work, we aim at building a unifying framework that is suitable for the classification of events of distinct natures. The framework has as key elements: a) external enrichment using related web pages for extending the conceptual features contained within the tweets; b) semantic enrichment using the Linked Open Data cloud to add related semantic features; and c) a pruning technique that selects the semantic features with discriminative potential We evaluated our proposed framework using a broad experimental setting, that includes: a) seven target events of different natures; b) different combinations of the conceptual features proposed (i.e. entities, vocabulary and their combination); c) distinct feature extraction strategies (i.e. from tweet text and web related documents); d) different methods for selecting the discriminative semantic features (i.e. pruning, feature selection, and their combination); and e) two classification algorithms. We also compared the proposed framework against another kind of contextual enrichment based on word embeddings. The results showed the advantages of using the proposed framework, and that our solution is a feasible and generalizable method to support the classification of distinct event types.
|
262 |
Representação semântica de perfil dinâmico de usuários em comunidades de prática / Semantic representation of dynamic user profiles in communities of practicePereira, Matheus January 2017 (has links)
Em comunidades de prática, a aprendizagem ocorre por meio da interação e colaboração constante de seus participantes, o caráter social destes ambientes é fundamental para a construção do conhecimento. Por este motivo, esta dissertação busca compreender a forma como os usuários interagem em comunidades de prática e propõe a estruturação destas informações em torno de um perfil dinâmico de usuário. A aplicação de perfis de usuário neste contexto permite entender o indivíduo, seus interesses e necessidades. A partir da representação dos participantes de comunidades de prática é possível desenvolver sistemas de aprendizagem inteligente, sistemas de recomendação, elementos de gamificação e sistemas de acesso e recuperação de informação personalizados. Estes mecanismos procuram estimular o engajamento dos participantes e promover a aprendizagem colaborativa. A representação das informações neste trabalho será apoiada pelo uso de tecnologias da web semântica e de ontologias para a formalização das relações em comunidades de prática. O desenvolvimento de softwares educacionais baseados na web semântica amplia a capacidade de implementação de novos mecanismos de aprendizagem, contribuindo para a análise das interações e a inferências sobre as informações dos usuários. O uso de ontologias permite a formalização das informações e torna possível a elaboração de uma rede de conhecimento que pode ser processada e consumida por agentes de software, contribuindo para a interoperabilidade do sistema. / In communities of practice, learning is built through constant interaction and collaboration of their participants, the social aspect of these environments is crucial for the knowledge construction. For this reason, this work intends to understand how users interact in communities of practice and proposes a dynamic user profile to structure this information. An user profile applied in this context allows us to understand the person, his interests and needs. The representation of participants in communities of practice allow us to develop intelligent learning systems, recommender systems, gamification elements and systems for personalized access and personalized information retrieval. Those mechanisms intend to stimulate participant engagement to promote collaborative learning. In this work, semantic web technologies and ontologies are used to represent this informations. The development of educational software based on the semantic web expands the capacity to implement new learning mechanisms, contributing to the analysis of the interactions and the inferences about user informations. The use of ontologies allows the formalization of information and enables the elaboration of a knowledge network that can be processed and consumed by software agents, contributing to the system interoperability.
|
263 |
OntoFeed um leitor de Feeds com extensão ontológica. / Ontofeed: a feed reader with ontological extension.Marcelo Gomes Rodrigues 23 August 2011 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O problema que justifica o presente estudo refere-se à falta de semântica nos mecanismos de busca na Web. Para este problema, o consórcio W3 vem desenvolvendo tecnologias que visam construir uma Web Semântica. Entre estas tecnologias, estão as ontologias de domínio. Neste sentido, o objetivo geral desta dissertação é discutir as possibilidades de se imprimir semântica às buscas nos agregadores de notícia da Web. O objetivo específico é apresentar uma aplicação que usa uma classificação semi-automática de notícias, reunindo, para tanto, as tecnologias de busca da área de recuperação de informação com as ontologias de domínio. O sistema proposto é uma aplicação para a Web capaz de buscar notícias sobre um domínio específico em portais de informação. Ela utiliza a API do Google Maps V1 para a localização georreferenciada da notícia, sempre que esta informação estiver disponível. Para mostrar a viabilidade da proposta, foi desenvolvido um exemplo apoiado em uma ontologia para o domínio de chuvas e suas consequências. Os resultados obtidos por este novo Feed de base ontológica são alocados em um banco de dados e disponibilizados para consulta via Web. A expectativa é que o Feed proposto seja mais relevante em seus resultados do que um Feed comum. Os resultados obtidos com a união de tecnologias patrocinadas pelo consórcio W3 (XML, RSS e ontologia) e ferramentas de busca em página Web foram satisfatórios para o propósito pretendido. As ontologias mostram-se como ferramentas de usos múltiplos, e seu valor de análise em buscas na Web pode ser ampliado com aplicações computacionais adequadas para cada caso. Como no exemplo apresentado nesta dissertação, à palavra chuva agregaram-se outros conceitos, que estavam presentes nos desdobramentos ocasionados por ela. Isto realçou a ligação do evento chuva com as consequências que ela provoca - ação que só foi possível executar através de um recorte do conhecimento formal envolvido. / The problem addressed in this work refers to the lack of semantics in Web search engine. As solution, the W3 consortium has been developing technologies that aim to build a Semantic Web, including the domain ontology. Considering this issue, the work main goal is to discuss the possibilities of placing semantics context in the searches in Web feed applications. The specific goal is to propose a Web application that uses a semi-automatic classification of news, by joining information retrieval technologies and domain ontology. The software is able to get news about a given domain from Web information portals. It uses the Google Map API VI for gather the new geo-referenced location, whenever this information is available. To show the proposal feasibility, an example was developed supported by an ontology in the domain of rainfall and its consequences. The results of this new ontology-based feed are allocated in a database e make available for query via the Web. It is expected that the proposed feed offers more relevant results than the current feeds. In addition, the union of technologies sponsored by the W3C and traditional search methods on Web pages were satisfactory for the intended purposes. Ontology is showed as multi-use tool and its value in Web search can be extended for appropriate computer applications. In the example presented, other concepts were added to the word rainfall, which is present in the deployments caused by it. This highlighted the connection of the event rainfall with its consequences, action that was only possible to run through a cutout of the formal knowledge involved.
|
264 |
As tecnologias da Web Semântica no domínio bibliográfico / The semantic web technologies in the bibliographic domainSilva, Renata Eleuterio da [UNESP] January 2013 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:44Z (GMT). No. of bitstreams: 0
Previous issue date: 2013Bitstream added on 2014-06-13T19:54:59Z : No. of bitstreams: 1
silva_re_me_mar.pdf: 1232145 bytes, checksum: 0769231b6107aa5227dea1ca687c1457 (MD5) / A proposta de uma Web Semântica surgiu como uma alternativa que possibilitaria a interpretação das informações por máquinas, permitindo assim maior qualidade nas buscas e resultados mais relevantes aos usuários. A Web Semântica pode ser utilizada atualmente apenas em domínios restritos, como em sites de comércio eletrônico, devido à dificuldade de representar ontologicamente toda a Web. Objetiva-se verificar como os conceitos, tecnologias, arquiteturas de metadados utilizados pela Web Semântica podem contribuir à construção, modelagem e arquitetura de metadados de catálogos bibliográficos, tomando por base os conceitos definidos no modelo conceitual desenvolvido para a representação do universo bibliográfico denominado Functional Requirements for Bibliographic Records (FRBR), além de explanar sobre a utilização do modelo conceitual como recurso ontológico. A proposta se pauta no estudo de arquiteturas de metadados semânticas, de modo a identificar suas características, funções e estruturas, além de estudar o modelo BIBFRAME (Bibliographic Framework), que se configura como a iniciativa mais recente acerca da implementação de tecnologias da Web à área da Biblioteconomia e Ciência da Informação. Esta pesquisa caracteriza-se por seu caráter teórico-exploratório e foi desenvolvida mediante análise e revisão de literatura sobre seus temas. Os resultados apresentam as principais arquiteturas de metadados utilizadas no contexto da Web Semântica e uma abordagem sobre ontologias, interoperabilidade em sistemas de informação, modelagem de catálogos online, além da apresentação do modelo BIBFRAME, com base em sua importância para a catalogação. / The proposal of a Semantic Web has emerged as an alternative that would allow the interpretation of information by machines, allowing higher quality in the searches and more relevant results to users. Currently, the Semantic Web can only be used in restricted domains, such as e-commerce sites, due to the difficulty of representing the entire Web ontologically. The objective is to see how the concepts, technologies, architectures, and metadata used by the Semantic Web can contribute to build, model and metadata architecture of bibliographic catalogs, based on the concepts defined in the conceptual model developed for the representation of the bibliographic universe called Functional Requirements for Bibliographic Records (FRBR), and explain about the use of the conceptual model and ontological resource. The proposal is guided in the study of semantic metadata architectures, in order to identify its characteristics, functions and structures, in addition to study the model BIBFRAME (Bibliographic Framework), which constitutes the most recent initiative on implementing Web technologies to the Library and Information Science field. This research is characterized by its theoretical and exploratory character was developed through analysis and review of literature on their subjects. The results show the main architectures used in the metadata context of the Semantic Web and an approach to ontology, interoperability in information systems, modeling catalogs online, besides the presentation of the model BIBFRAME, based on their importance to the Cataloging.
|
265 |
A construção do conhecimento científico: a web semântica como objeto de estudoPinheiro, Cintia Braga Ferreira [UNESP] 25 February 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:45Z (GMT). No. of bitstreams: 0
Previous issue date: 2008-02-25Bitstream added on 2014-06-13T20:55:14Z : No. of bitstreams: 1
pinheiro_cbf_me_mar.pdf: 696036 bytes, checksum: 79fa46f5ff08bc2d1492ea8ee9f00c86 (MD5) / Universidade Estadual Paulista (UNESP) / A Sociologia da Ciência ou os Estudos Sociais da Ciência têm procurado analisar a estrutura das disciplinas científicas em relação às suas práticas sociais, procurando oferecer novas perspectivas sobre a construção do saber e o desenvolvimento científico e tecnológico. Um conceito importante para o desenvolvimento deste trabalho é o de comunidade científica caracterizada pela prática de uma especialidade, por uma formação teórica comum, pela circulação abundante de informação no interior do grupo. Este estudo tem por objetivo caracterizar a pesquisa brasileira em Web Semântica, considerado um tema na fronteira de pesquisa de duas matrizes disciplinares: a Ciência da Computação e a Ciência da Informação. Optou-se por um estudo cienciométrico, tendo como fonte para coleta dos dados o Curriculum Lattes de pesquisadores doutores e nas dissertações e teses defendidas sobre Web Semântica e suas tecnologias. A integração entre comunidades científicas formadas em matrizes disciplinares diferentes encontra um ambiente favorável nos espaços de fronteira que demarcam as matrizes disciplinares. Comprova-se isso ao observar-se a comunidade pesquisadora sobre Web Semântica no Brasil, composta por pesquisadores de diversas matrizes como a Lingüística, a Ciência da Informação e a Ciência da Computação. / Science is a critical and dynamic social activity whose objective is the knowledge production on different aspects of the nature. An important concept for the development of this work is of scholarly community characterized by the practical one of a specialty, for a common theoretical formation, the abundant circulation of information in the interior of the group. This study it has for objective to characterize the Brazilian research in Semantic Web, considered a subject in the border of research of two matrices discipline matrices the Computer Science and the Information Science. It was opted to a scientometrics study, having as source of the data the Curriculum Lattes of doctors. The integration between scholarly communities formed in matrices of different disciplines finds a favorable environment in the scientific boundaries that demarcate the discipline matrices Observing that researching community on Semantic Web in Brazil, composed for researchers of diverse matrices as Linguistics, Information Science and Computer Science.
|
266 |
Semantic energyMurray, Malcolm Charles January 2012 (has links)
Information technology plays an increasingly important part in representing, managing, and driving the field of sustainable energy. However, current paradigms for representing much of this information can be fragmented, singular, and extremely domain focused. Linkage with wider concepts, for example between energy supply and demand data, can be minimal. This dissertation investigates ways in which such data linkages can be expanded upon, applying the latest concepts of Semantic Web technology to the area. This dissertation examines the role of the Semantic Web in representing information relevant to sustainable energy, with a particular focus on energy policy, energy supply, and the demands of the built environment. An approach for representing such information is outlined in the dissertation, which introduces new ontologies for representing energy policy and building information data and methodologies for modelling such data. Existing ontologies for representing energy supply are discussed, as are common connections between these areas and a server platform for knowledge storage and presentation. Additionally, some focus is directed towards the usability and accessibility of such data and the implementation of proof of concept applications targeted at specific areas within sustainable energy are presented. Using the outlined approach, energy information can be interlinked to allow multilevel data navigation from international policy data, through energy infrastructure, to individual energy demands, and ultimately to extremely detailed building component levels of granularity. Such data can be interlinked into wider linked data initiatives, increasing usefulness and expanding the scope for increased analysis. The implications of the outlined approach are discussed and evaluated with regard to various identified use cases requiring different levels of data granularity, in addition to impact on the wider domain of information management. This dissertation demonstrates, at a proof of concept level, that Semantic Web technology can be of significant benefit across the domain of sustainable energy.
|
267 |
Integração de dados e processos disponíveis em portais web baseada em ontologias de domínio / Web portal data and processes integration based on domain ontologiesMello, Marília Terra de January 2008 (has links)
A integração e a troca de informação na Web é uma necessidade reconhecida no mundo atual nos mais diversos domínios de aplicação. A Web constitui hoje o principal meio de acesso a informações, disponibilizando várias formas de acesso a esse conteúdo. No entanto, disponibilizar essa informação de forma integrada para o usuário ainda é um desafio. O Serviço Web Semântico é uma tecnologia de Inteligência Artificial promissora a qual pode contribuir significativamente com o processo de integração tanto de dados como de processos disponíveis em portais Web. O objetivo do presente trabalho é realizar a integração das diferentes funcionalidades oferecidas por portais disponibilizados na Web, fazendo uso de ontologias de domínio através de Serviços Web Semânticos. Para alcançar o objetivo proposto, um sistema de busca e integração, denominado W-KIS, foi projetado e desenvolvido, fornecendo uma visão unificada e transparente ao usuário de toda informação disponível em um determinado número de portais Web, contextualizados a um domínio de aplicação específico. Dois domínios de aplicação foram explorados neste trabalho através de dois estudos de caso: a Biomedicina e a Geologia, cada um fornecendo sua própria ontologia de domínio. Serviços Web Semânticos foram desenvolvidos para encapsular portais Web em ambos os domínios, permitindo ao sistema realizar a integração em cada domínio, separadamente. A aplicação proposta foi validada através da avaliação de sua atuação em ambos os domínios, além de testes com usuários finais e comparações com outras abordagens para integração na Web e motores de busca tradicionais. Através da utilização de Serviços Web Semânticos, W-KIS é capaz de localizar e executar os serviços de forma automática, além de lidar com a heterogeneidade semântica entre as fontes de informação por meio das ontologias de domínio. Desta forma, o sistema fornece apenas informação contextualizada ao interesse do usuário. / Integration and exchange of information across the Internet is a universally recognized need, in a wide variety of domains. Nowadays, the Web is the main source of information, providing many ways to access this content. However, making this information available to the user in an integrated way is still a challenge. New promising application fields such as Semantic Web Services can improve the integration process of data and processes available in Web portals. The goal of the present research is to accomplish the integration of the different functionalities offered by portals available in the Web, making use of domain ontologies through Semantic Web Services. In order to achieve the proposed goal, a search and integration system, named W-KIS, was designed and developed. The system provides the user with a unified and transparent view of the whole information available in a number of Web portals, related to a specific application domain. Two application domains were explored in this work through two case studies: the Biomedicine and the Geology, each one providing its own domain ontology. Semantic Web Services were designed to encapsulate Web portals in both domains, allowing the system to accomplish the integration in each domain, separately. The application proposed in this project was validated through the evaluation of its behavior in both domains, besides other tests with final users and comparisons with other approaches for integration in the Web, and traditional search engines. Making use of Semantic Web Services, W-KIS is able to find and execute the services in an automatic way, besides dealing with the semantic heterogeneity in the information sources by means of domain ontologies. This way, the system provides the user with information contextualized to its interest.
|
268 |
A Quadruple-Based Text Analysis System for History and Philosophy of ScienceJanuary 2014 (has links)
abstract: Computational tools in the digital humanities often either work on the macro-scale, enabling researchers to analyze huge amounts of data, or on the micro-scale, supporting scholars in the interpretation and analysis of individual documents. The proposed research system that was developed in the context of this dissertation ("Quadriga System") works to bridge these two extremes by offering tools to support close reading and interpretation of texts, while at the same time providing a means for collaboration and data collection that could lead to analyses based on big datasets. In the field of history of science, researchers usually use unstructured data such as texts or images. To computationally analyze such data, it first has to be transformed into a machine-understandable format. The Quadriga System is based on the idea to represent texts as graphs of contextualized triples (or quadruples). Those graphs (or networks) can then be mathematically analyzed and visualized. This dissertation describes two projects that use the Quadriga System for the analysis and exploration of texts and the creation of social networks. Furthermore, a model for digital humanities education is proposed that brings together students from the humanities and computer science in order to develop user-oriented, innovative tools, methods, and infrastructures. / Dissertation/Thesis / Doctoral Dissertation Biology 2014
|
269 |
Distributed SPARQL over Big RDF Data - A Comparative Analysis using Presto and MapReduceJanuary 2014 (has links)
abstract: The processing of large volumes of RDF data require an efficient storage and query processing engine that can scale well with the volume of data. The initial attempts to address this issue focused on optimizing native RDF stores as well as conventional relational databases management systems. But as the volume of RDF data grew to exponential proportions, the limitations of these systems became apparent and researchers began to focus on using big data analysis tools, most notably Hadoop, to process RDF data. Various studies and benchmarks that evaluate these tools for RDF data processing have been published. In the past two and half years, however, heavy users of big data systems, like Facebook, noted limitations with the query performance of these big data systems and began to develop new distributed query engines for big data that do not rely on map-reduce. Facebook's Presto is one such example.
This thesis deals with evaluating the performance of Presto in processing big RDF data against Apache Hive. A comparative analysis was also conducted against 4store, a native RDF store. To evaluate the performance Presto for big RDF data processing, a map-reduce program and a compiler, based on Flex and Bison, were implemented. The map-reduce program loads RDF data into HDFS while the compiler translates SPARQL queries into a subset of SQL that Presto (and Hive) can understand. The evaluation was done on four and eight node Linux clusters installed on Microsoft Windows Azure platform with RDF datasets of size 10, 20, and 30 million triples. The results of the experiment show that Presto has a much higher performance than Hive can be used to process big RDF data. The thesis also proposes an architecture based on Presto, Presto-RDF, that can be used to process big RDF data. / Dissertation/Thesis / Masters Thesis Computing Studies 2014
|
270 |
O tutorial do ciberespaço : engendramentos de uma técnica de ensino contemporâneaReis, Luzo Vinicius Pedroso 16 October 2012 (has links)
Submitted by Valquíria Barbieri (kikibarbi@hotmail.com) on 2017-11-07T20:58:42Z
No. of bitstreams: 1
DISS_2012_Luzo Vinicius Pedroso Reis.pdf: 29664723 bytes, checksum: 82045e3b6a8556861ffadbeadc17eba7 (MD5) / Approved for entry into archive by Jordan (jordanbiblio@gmail.com) on 2017-12-15T14:44:30Z (GMT) No. of bitstreams: 1
DISS_2012_Luzo Vinicius Pedroso Reis.pdf: 29664723 bytes, checksum: 82045e3b6a8556861ffadbeadc17eba7 (MD5) / Made available in DSpace on 2017-12-15T14:44:30Z (GMT). No. of bitstreams: 1
DISS_2012_Luzo Vinicius Pedroso Reis.pdf: 29664723 bytes, checksum: 82045e3b6a8556861ffadbeadc17eba7 (MD5)
Previous issue date: 2012-10-16 / Este trabalho analisa como os tutoriais que circulam no ciberespaço engendram novos
espaços-tempo de aprendizagem e com isso contribuem para a produção do mundo
contemporâneo, com suas características de velocidade e movimento. Para isso, entendemos o
tutorial como uma técnica, como uma dimensão da constituição humana. Assim como a
escola tradicional produz um determinado tipo de sociedade (a sociedade disciplinar), as
atuais técnicas contemporâneas da educação a distância e, de modo mais radical, os tutoriais
participam da produção da sociedade de controle aberto e contínuo. Por trás desses modos de
ensinar, estão objetos técnicos que operam em sua relação com os sujeitos ora o confinamento
e a disciplina (escola tradicional), ora o movimento controlado (tutoriais), especialmente hoje
com a chamada web semântica. Nesse sentido, partimos da observação do funcionamento de
máquinas e sujeitos para entender o atual agenciamento homem-técnica. Um agenciamento
em que se destaca o movimento, os procedimentos de filtragem e busca por informações. / This work analyzes how the tutorials in cyberspace engender new learning spaces and times
and contribute to the production of the contemporary world, with their velocity and
movement. In this sense, we understand a tutorial as a technique, as a human dimension. As
traditional school produces a certain kind of society (The disciplinary society), the current
techniques of distance education (e-learning) and on a radical way, tutorials participate in the
production of the society of open and continuous control. Underneath these tuition procedures
there are technical objects that operate, in relation to subjects either confinement and
discipline (traditional school), or controlled movement (tutorials from cyberspace), specially
now with semantic web. We start from the observation of the operation of the machines and
subjects to understand the actual human-technique agency. An agency that highlights the
characteristics of movement, the filtering procedures and the search for information.
|
Page generated in 0.0727 seconds