• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 60
  • 3
  • Tagged with
  • 63
  • 37
  • 24
  • 19
  • 17
  • 15
  • 14
  • 13
  • 13
  • 10
  • 10
  • 10
  • 9
  • 9
  • 9
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Um processo auto-documentável de geração de ontologias de domínio para dados semi-estruturados

Santi, Sergio Medeiros January 2002 (has links)
Dados são disponibilizados através dos mais distintos meios e com os mais variados níveis de estruturação. Em um nível baixo de estruturação tem-se arquivos binários e no outro extremo tem-se bancos de dados com uma estrutura extremamente rígida. Entre estes dois extremos estão os dados semi-estruturados que possuem variados graus de estruturação com os quais não estão rigidamente comprometidos. Na categoria dos dados semiestruturados tem-se exemplos como o HTML, o XML e o SGML. O uso de informações contidas nas mais diversas fontes de dados que por sua vez possuem os mais diversos níveis de estruturação só será efetivo se esta informação puder ser manejada de uma forma integrada e através de algum tipo de esquema. O objetivo desta dissertação é fornecer um processo para construção de uma ontologia de domínio que haja como esquema representativo de diferentes conjuntos de informação. Estes conjuntos de informações podem variar de dados semi-estruturados a dados estruturados e devem referir-se a um mesmo domínio do conhecimento. Esta proposta permite que qualquer modelo que possa ser transformado no modelo comum de integração possa ser utilizado com entrada para o processo de integração. A ontologia de domínio resultante do processo de integração é um modelo semântico que representa o consenso obtido através da integração de diversas fontes de forma ascendente (bottom-up), binária, incremental, semi-automática e auto-documentável. Diz-se que o processo é ascendente porque integra o modelo que representa a fonte de interesse sobre a ontologia, é binário porque trabalha com dois esquemas a cada integração o que facilita o processo de documentação das integrações realizadas, é incremental porque cada novo esquema de interesse é integrado sobre a ontologia vigente naquele momento, é semiautomático porque considera a intervenção do usuário durante o processo e finalmente é autodocumentável porque durante o processo, toda integração de pares de conceitos semanticamente equivalentes é registrada. O fato de auto-documentar-se é a principal característica do processo proposto e seu principal diferencial com relação a outras propostas de integração. O processo de mapeamento utiliza, dos esquemas de entrada, toda a informação presente ou que possa ser inferida. Informações como se o conceito é léxico ou não, se é raiz e os símbolos que permitem deduzir cardinalidades são consideradas. No processo de integração são consideradas práticas consagradas de integração de esquemas de BDs, na identificação de relacionamentos entre objetos dos esquemas, para geração do esquema integrado e para resolução de conflitos. As principais contribuições desta dissertação são (i) a proposta de um metamodelo capaz de manter o resultado dos mapeamentos e das integrações realizadas e (ii) a especificação de um processo auto-documentável que de sustentação a auditoria do processo de integração.
12

Consultando XML por meio de modelos conceituais : extensão e formalização de CXPath

Feijó, Diego de Vargas January 2005 (has links)
Com o objetivo de realizar consultas em diferentes fontes XML,é necessário que se escreva uma consulta específica para cada fonte XML. Uma solução mais adequada é fazer uma única consulta sobre um esquema conceitual e então traduzi-la automaticamente para consultas XML para cada fonte XML específica. CXPath é uma linguagem de consulta que foi proposta para consultar dados em nıvel conceitual. Este trabalho tem como objetivos formalizar a linguagem existente, estendê-la para permitir consultas que utilizem o conceito de herança e estender o mecanismo de tradução de consultas. A formalização da linguagem é feita por meio de um conjunto de regras que definem formalmente um critério para validar uma consulta escrita nessa linguagem sobre um esquema conceitual. Essa formalização permite estender a linguagem para que ela passe a tratar os relacionamentos de herança e especialização. Outra contribuição dessa formalização é que ela apresenta o primeiro passo rumo à verificação formal de que a avaliação da consulta global traz os mesmos resultados obtidos pela avaliação da consulta resultante do processo de mapeamento de consultas proposto. A extensão do mecanismo de tradução de consultas é necessária para traduzir relacionamentos representados no modelo conceitual para junções nas fontes de dados XML. Tal aspecto é fundamental para permitir a construção de modelos conceituais com relacionamentos semânticos e que não dependam de relacionamentos físicos existentes nos documentos fontes, mas apenas de junções tal como é feito em bases de dados relacionais.
13

Consultando XML por meio de modelos conceituais : extensão e formalização de CXPath

Feijó, Diego de Vargas January 2005 (has links)
Com o objetivo de realizar consultas em diferentes fontes XML,é necessário que se escreva uma consulta específica para cada fonte XML. Uma solução mais adequada é fazer uma única consulta sobre um esquema conceitual e então traduzi-la automaticamente para consultas XML para cada fonte XML específica. CXPath é uma linguagem de consulta que foi proposta para consultar dados em nıvel conceitual. Este trabalho tem como objetivos formalizar a linguagem existente, estendê-la para permitir consultas que utilizem o conceito de herança e estender o mecanismo de tradução de consultas. A formalização da linguagem é feita por meio de um conjunto de regras que definem formalmente um critério para validar uma consulta escrita nessa linguagem sobre um esquema conceitual. Essa formalização permite estender a linguagem para que ela passe a tratar os relacionamentos de herança e especialização. Outra contribuição dessa formalização é que ela apresenta o primeiro passo rumo à verificação formal de que a avaliação da consulta global traz os mesmos resultados obtidos pela avaliação da consulta resultante do processo de mapeamento de consultas proposto. A extensão do mecanismo de tradução de consultas é necessária para traduzir relacionamentos representados no modelo conceitual para junções nas fontes de dados XML. Tal aspecto é fundamental para permitir a construção de modelos conceituais com relacionamentos semânticos e que não dependam de relacionamentos físicos existentes nos documentos fontes, mas apenas de junções tal como é feito em bases de dados relacionais.
14

Um processo auto-documentável de geração de ontologias de domínio para dados semi-estruturados

Santi, Sergio Medeiros January 2002 (has links)
Dados são disponibilizados através dos mais distintos meios e com os mais variados níveis de estruturação. Em um nível baixo de estruturação tem-se arquivos binários e no outro extremo tem-se bancos de dados com uma estrutura extremamente rígida. Entre estes dois extremos estão os dados semi-estruturados que possuem variados graus de estruturação com os quais não estão rigidamente comprometidos. Na categoria dos dados semiestruturados tem-se exemplos como o HTML, o XML e o SGML. O uso de informações contidas nas mais diversas fontes de dados que por sua vez possuem os mais diversos níveis de estruturação só será efetivo se esta informação puder ser manejada de uma forma integrada e através de algum tipo de esquema. O objetivo desta dissertação é fornecer um processo para construção de uma ontologia de domínio que haja como esquema representativo de diferentes conjuntos de informação. Estes conjuntos de informações podem variar de dados semi-estruturados a dados estruturados e devem referir-se a um mesmo domínio do conhecimento. Esta proposta permite que qualquer modelo que possa ser transformado no modelo comum de integração possa ser utilizado com entrada para o processo de integração. A ontologia de domínio resultante do processo de integração é um modelo semântico que representa o consenso obtido através da integração de diversas fontes de forma ascendente (bottom-up), binária, incremental, semi-automática e auto-documentável. Diz-se que o processo é ascendente porque integra o modelo que representa a fonte de interesse sobre a ontologia, é binário porque trabalha com dois esquemas a cada integração o que facilita o processo de documentação das integrações realizadas, é incremental porque cada novo esquema de interesse é integrado sobre a ontologia vigente naquele momento, é semiautomático porque considera a intervenção do usuário durante o processo e finalmente é autodocumentável porque durante o processo, toda integração de pares de conceitos semanticamente equivalentes é registrada. O fato de auto-documentar-se é a principal característica do processo proposto e seu principal diferencial com relação a outras propostas de integração. O processo de mapeamento utiliza, dos esquemas de entrada, toda a informação presente ou que possa ser inferida. Informações como se o conceito é léxico ou não, se é raiz e os símbolos que permitem deduzir cardinalidades são consideradas. No processo de integração são consideradas práticas consagradas de integração de esquemas de BDs, na identificação de relacionamentos entre objetos dos esquemas, para geração do esquema integrado e para resolução de conflitos. As principais contribuições desta dissertação são (i) a proposta de um metamodelo capaz de manter o resultado dos mapeamentos e das integrações realizadas e (ii) a especificação de um processo auto-documentável que de sustentação a auditoria do processo de integração.
15

Desenvolvimento de lipídios estruturados obtidos a partir de gordura do leite, óleo de girassol e ésteres de fitosteróis para aplicação em spreads / Development of structured lipids obtained from milk fat, sunflower oil, and phytosterol esters for application in a tablespread

Ract, Juliana Neves Rodrigues 03 May 2006 (has links)
Durante anos, a manteiga foi muito apreciada pelo consumidor, mas por conter grande quantidade de ácidos graxos saturados e colesterol, seu consumo tem diminuído. Recentemente, a descoberta dos malefícios causados pelos ácidos graxos trans presentes nas margarinas produzidas por hidrogenação parcial aumentou o interesse por métodos alternativos de modificação de lipídios. Assim, o objetivo deste trabalho foi desenvolver um lipídio estruturado à base de gordura do leite que apresentasse maiores teores de ácidos graxos insaturados que a manteiga original e, consequentemente, melhor espalhabilidade, além de conter fitosteróis, constituindo a base de um alimento funcional com capacidade de reduzir os níveis de colesterol no sangue. Foram realizadas misturas da gordura do leite (GL) com óleo de girassol (OG) e ésteres de fitosteróis (EF) e foi efetuada interesterificação química e enzimática. As misturas e os lipídios estruturados obtidos foram analisados quanto a composição em ácidos graxos, consistência, conteúdo de gordura sólida (CGS), cinética de cristalização e estrutura cristalina, entre outras propriedades físico-químicas. Foram obtidos produtos contendo cerca de 60% de ácidos graxos insaturados pela adição de até 40% de OG e 25% de EF à gordura do leite, que originalmente possuía cerca de 33% de ácidos graxos insaturados. A interesterificação química melhorou a plasticidade das misturas, enquanto que a modificação enzimática não modificou de maneira expressiva sua consistência. A adição de pequenas quantidades de OG à GL provocou grande diminuição de sua consistência, enquanto que a diminuição do CGS ocorreu em proporções semelhantes às esperadas por interpolação linear. A edição de vídeos que permitam a observação da formação da estrutura cristalina de gorduras mostrou ser uma ferramenta de grande utilidade no estudo da cristalização de óleos e gorduras. A emulsão preparada com a mistura contendo 25,0% de EF, 7,5% de OG e 67,5% de GL apresentou diminuição expressiva na consistência quando comparada à manteiga, representando um efeito benéfico. / For many years, butter has been held in the highest esteem by consumer but its world consumption has steadily declined due to its high contents of saturated fatty acids and cholesterol. More recently, trans fatty acids, which are commonly resent in hydrogenated argarines, have been found to cause detrimental effects when consumed in high amounts. This observation has increased the interest in alternative methods of lipid modification. Therefore, the objective of this work was to develop a milkfat based structured lipid, presenting higher contents of unsaturated fatty acids than original butter and consequently better spreadability, besides containing phytosterols and serving as a base of a functional food with a cholesterol lowering health claim. Blends containing milkfat (MF), sunflower oil (SO) and phytosterol esters (PE) were prepared and then chemically and enzimatically interesterified. The fatty acid composition, consistency, solid fat content (SFC), crystallization kinetics and crystal structure, among other physical and chemical properties were analyzed. The blends presented about 60% of unsaturated fatty acids with the addition of up to 40% of SO and 25% of PE to MF, which originally presented close to 33% of unsaturated fatty acids. Chemical interesterification improved the plasticity of the blends, while the enzymatic reaction did not substantially alter it. The addition of small amounts of SO and PE to MF caused a great decrease in its consistency, while SFC decreased almost proportionally to the addition of these components. The edition of videos made possible the observation of crystal structure formation and it represented a tool of great importance in the fats and oils crystallization research. The emulsion prepared with the blend containing 25.0% of PE, 7.5% of SO, and 67.5% of MF presented a substantial improvement in consistency when compared to butter commercially available.
16

Proposta de uma ferramenta de anotação semântica para publicação de dados estruturados na Web

Calegari, Newton Juniano 02 April 2016 (has links)
Submitted by Filipe dos Santos (fsantos@pucsp.br) on 2016-09-02T14:31:38Z No. of bitstreams: 1 Newton Juniano Calegari.pdf: 2853517 bytes, checksum: e1eda2a1325986c6284a5054d724a19f (MD5) / Made available in DSpace on 2016-09-02T14:31:38Z (GMT). No. of bitstreams: 1 Newton Juniano Calegari.pdf: 2853517 bytes, checksum: e1eda2a1325986c6284a5054d724a19f (MD5) Previous issue date: 2016-04-02 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Pontifícia Universidade Católica de São Paulo / The tool proposed in this research aims at bringing together the Semantic Web technologies and content publishers, this way enabling the latter to contribute to creating structured data and metadata about texts and information they may make available on the Web. The general goal is to investigate the technical feasibility of developing a semantic annotation tool that enables content publishers to contribute to the Semantic Web ecosystem. Based on (BERNERS-LEE et al., 2001; ALESSO; SMITH, 2006; RODRÍGUEZ-ROCHA et al., 2015; GUIZZARDI, 2005; ISOTANI; BITTENCOURT, 2015), the Semantic Web is presented according to its technological stack. Considering the importance of the ontologies and vocabularies used to create Semantic Web applications, the essential subjects of the conceptual modelling and the ontology language used on the Web are presented. In order to provide the necessary concepts to use semantic annotations, this dissertation presents both the way annotations are used (manual, semi-automatic, and automatic) as well as the way these annotations are integrated with resources available on the Web. The state-of-the-art chapter describes recent projects and related work on the use of Semantic Web within Web-content publishing context. The methodology adopted by this research is based on (SANTAELLA; VIEIRA, 2008; GIL, 2002), in compliance with the exploratory approach for research. This research presents the proposal and the architecture of the semantic annotation tool, which uses shared vocabulary in order to create structured data based on textual content. In conclusion, this dissertation addresses the possibilities of future work, both in terms of the implementation of the tool in a real use case as well as in new scientific research / A proposta apresentada nesta pesquisa busca aproximar as tecnologias de Web Semântica dos usuários publicadores de conteúdo na Web, permitindo que estes contribuam com a geração de dados estruturados e metadados sobre textos e informações que venham disponibilizar na Web. O objetivo geral deste trabalho é investigar a viabilidade técnica de desenvolvimento de uma ferramenta de anotação semântica que permita aos usuários publicadores de conteúdo contribuírem para o ecossistema de Web Semântica. Com suporte de (BERNERS-LEE et al., 2001; ALESSO; SMITH, 2006; RODRÍGUEZ-ROCHA et al., 2015; GUIZZARDI, 2005; ISOTANI; BITTENCOURT, 2015) apresenta-se o tópico de Web Semântica de acordo com a pilha tecnológica que mostra o conjunto de tecnologias proposto para a sua realização. Considerando a importância de ontologias e vocabulários para a construção de aplicações de Web Semântica, são apresentados então os tópicos fundamentais de modelagem conceitual e a linguagem de ontologias para Web. Para fornecer a base necessária para a utilização de anotações semânticas são apresentados, além da definição, os modos de uso de anotações (manual, semi-automático e automático) e as formas de integrar essas anotações com recursos disponíveis nas tecnologias da Web Semântica. O estado da arte contempla trabalhos e projetos recentes sobre o uso de Web Semântica no contexto de publicação de conteúdo na Web. A metodologia é baseada na proposta apresentada por SANTAELLA; VIEIRA (2008), seguindo uma abordagem exploratória para a condução da pesquisa. É apresentada a proposta e os componentes de uma ferramenta de anotação semântica que utiliza vocabulários compartilhados para geração de dados estruturados a partir de conteúdo textual. Concluindo o trabalho, são apresentadas as possibilidades futuras, tanto da implementação da ferramenta em um cenário real, atestando sua viabilidade técnica, quanto novos trabalhos encaminhados a partir desta pesquisa
17

Desenvolvimento de lipídios estruturados obtidos a partir de gordura do leite, óleo de girassol e ésteres de fitosteróis para aplicação em spreads / Development of structured lipids obtained from milk fat, sunflower oil, and phytosterol esters for application in a tablespread

Juliana Neves Rodrigues Ract 03 May 2006 (has links)
Durante anos, a manteiga foi muito apreciada pelo consumidor, mas por conter grande quantidade de ácidos graxos saturados e colesterol, seu consumo tem diminuído. Recentemente, a descoberta dos malefícios causados pelos ácidos graxos trans presentes nas margarinas produzidas por hidrogenação parcial aumentou o interesse por métodos alternativos de modificação de lipídios. Assim, o objetivo deste trabalho foi desenvolver um lipídio estruturado à base de gordura do leite que apresentasse maiores teores de ácidos graxos insaturados que a manteiga original e, consequentemente, melhor espalhabilidade, além de conter fitosteróis, constituindo a base de um alimento funcional com capacidade de reduzir os níveis de colesterol no sangue. Foram realizadas misturas da gordura do leite (GL) com óleo de girassol (OG) e ésteres de fitosteróis (EF) e foi efetuada interesterificação química e enzimática. As misturas e os lipídios estruturados obtidos foram analisados quanto a composição em ácidos graxos, consistência, conteúdo de gordura sólida (CGS), cinética de cristalização e estrutura cristalina, entre outras propriedades físico-químicas. Foram obtidos produtos contendo cerca de 60% de ácidos graxos insaturados pela adição de até 40% de OG e 25% de EF à gordura do leite, que originalmente possuía cerca de 33% de ácidos graxos insaturados. A interesterificação química melhorou a plasticidade das misturas, enquanto que a modificação enzimática não modificou de maneira expressiva sua consistência. A adição de pequenas quantidades de OG à GL provocou grande diminuição de sua consistência, enquanto que a diminuição do CGS ocorreu em proporções semelhantes às esperadas por interpolação linear. A edição de vídeos que permitam a observação da formação da estrutura cristalina de gorduras mostrou ser uma ferramenta de grande utilidade no estudo da cristalização de óleos e gorduras. A emulsão preparada com a mistura contendo 25,0% de EF, 7,5% de OG e 67,5% de GL apresentou diminuição expressiva na consistência quando comparada à manteiga, representando um efeito benéfico. / For many years, butter has been held in the highest esteem by consumer but its world consumption has steadily declined due to its high contents of saturated fatty acids and cholesterol. More recently, trans fatty acids, which are commonly resent in hydrogenated argarines, have been found to cause detrimental effects when consumed in high amounts. This observation has increased the interest in alternative methods of lipid modification. Therefore, the objective of this work was to develop a milkfat based structured lipid, presenting higher contents of unsaturated fatty acids than original butter and consequently better spreadability, besides containing phytosterols and serving as a base of a functional food with a cholesterol lowering health claim. Blends containing milkfat (MF), sunflower oil (SO) and phytosterol esters (PE) were prepared and then chemically and enzimatically interesterified. The fatty acid composition, consistency, solid fat content (SFC), crystallization kinetics and crystal structure, among other physical and chemical properties were analyzed. The blends presented about 60% of unsaturated fatty acids with the addition of up to 40% of SO and 25% of PE to MF, which originally presented close to 33% of unsaturated fatty acids. Chemical interesterification improved the plasticity of the blends, while the enzymatic reaction did not substantially alter it. The addition of small amounts of SO and PE to MF caused a great decrease in its consistency, while SFC decreased almost proportionally to the addition of these components. The edition of videos made possible the observation of crystal structure formation and it represented a tool of great importance in the fats and oils crystallization research. The emulsion prepared with the blend containing 25.0% of PE, 7.5% of SO, and 67.5% of MF presented a substantial improvement in consistency when compared to butter commercially available.
18

Investigação de ablação a laser no regime de femtossegundo em materiais homogêneos e estruturados / Investigation of the femtosecond laser ablation on homogeneous and structured materials

Nicolodelli, Gustavo 31 March 2011 (has links)
Embora a ablação a laser venha sendo bastante utilizada em materiais em geral, pouco é entendido sobre o comportamento deste processo perto de uma interface separando dois materiais distintos. Neste contexto, o principal objetivo deste trabalho foi realizar um estudo macroscópico e microscópico dos processos que envolvem a ablação a laser em regime de femtossegundos em materiais homogêneos e estruturados. No caso de materiais estruturados, o estudo focou-se em uma situação de interface, na qual ocorrem mudanças nas propriedades de ablação. Baseado nos resultados, nós pretendemos obter subsídios científicos para entender as aplicações da ablação em regime de pulsos ultracurtos para estruturas estratificadas, tais como de dentes, ossos, interface resina-dente, dente-metal, e outras. Diferentes técnicas experimentais foram idealizadas para determinar a progressão da ablação dentro do material e obter dados extraídos da superfície. Utilizando luz espalhada de uma fonte externa, o processo de ablação foi temporalmente monitorado, permitindo determinar a velocidade de ablação em materiais transparentes, assim como perfis típicos de ablação nestes materiais. Em um segundo experimento, nosso estudo permitiu quantificar a variação da geometria de ablação perto de uma interface separando dois materiais distintos. Nossos dados foram suficientes para prever a ocorrência de uma descontinuidade no perfil da ablação entre dois meios: resina A e resina B, mostrando uma repentina descontinuidade do diâmetro da cavidade ablacionada. Adicionalmente, foi realizada uma análise dos aspectos morfológicos de diferentes tecidos biológicos irradiados e nosso estudo mostrou a eficiência da ablação utilizando laser de femtossegundos no processamento de tecidos duros e a possibilidade de utilizar esses sistemas sem causar danos térmicos e mecânicos nos tecidos remanescentes. Finalmente nós aplicamos a microperfuração a laser para produzir micro-poros na superfície de tecidos biológicos (fígados), melhorando a penetração do medicamento ALA e a aumentando a profundidade de tratamento. / Although laser ablation has been long used in general materials, little is known regarding the behavior of theses process near an interface separating two distinct materials. In this context, the main aim of this work was to perform a microscopic and macroscopic study of the processes that include femtosecond laser ablation in homogeneous and/or structured materials. In the case of structured materials, the study focused on an interface situation, in which sudden changes occurred in the properties. Based on the results, we aimed to obtain scientific subsidies to understand the application of ultrashort pulses to stratified structures, such as teeth, bones, resin-teeth or metal-teeth interface, and others. Distinct experimental techniques were used to determinate the ablation progression into the materials and to obtain data extracted from their surface. By using the scattered light from an external source, the ablation process was monitored temporally, allowing to determine the velocity of ablation in transparent materials, besides determining the typical profiles of ablated cavities in these materials. In a second experiment, our study allowed quantifying the overall variation in the ablation geometry that takes place on the interface of two different materials. Our data were sufficient to predict the occurrence of a discontinuity in the ablation profile on the interface between two media: resin A and resin B, showing a sudden discontinuity of the ablated cavity diameter. In addition, an analysis of the morphological aspects of different biological tissues irradiated by femtosecond laser pulses was performed and a comparative study showed the ablation efficiency of the femtosecond lasers in hard tissues processing and the possibility of using these systems with no thermal and mechanic damage. Finally, we applied a laser micromachining producing micro-pores on the tissue surface, improving the ALA penetration and increasing the treatment depth.
19

Integração materializada na web : um estudo de caso

Guandeline, Eidy Leandro Tanaka January 2002 (has links)
A World Wide Web em poucos anos de existência se tornou uma importante e essencial fonte de informação e a localização e recuperação de informações na Internet passou a ser um grande problema a ser resolvido. Isto porque a falta de padronização e estrutura adequada para representação dos dados, que é resultado da liberdade de criação e manipulação dos documentos, compromete a eficácia dos modelos de recuperação de informação tradicionais. Muitos modelos foram então desenvolvidos para melhorar o desempenho dos sistemas de recuperação de informação. Com o passar dos anos surge assim uma nova área de pesquisa a extração de dados da web que, ao contrário dos sistemas de recuperação, extrai informações dos documentos relevantes e não documentos relevantes de conjunto de documentos. Tais estudos viabilizaram a integração de informações de documentos distribuídos e heterogêneos, que foram baseados nos mesmos modelos aplicados a banco de dados distribuídos. Neste trabalho é apresentado um estudo que tem como objetivo materializar informações contidas em documentos HTML de modo que se possa melhorar o desempenho das consultas em relação ao tempo de execução quanto à qualidade dos resultados obtidos. Para isso são estudados o ambiente web e as características dos dados contidos neste ambiente, como por exemplo, a distribuição e a heterogeneidade, aspectos relacionados à maneira pela qual as informações estão disponibilizadas e como estas podem ser recuperadas e extraídas através de regras sintáticas. Finalizando o estudo são apresentados vários tipos de classificação para os modelos de integração de dados e é monstrado em detalhes um estudo de caso, que tem como objetivo demonstrar a aplicação das técnicas apresentadas ao longo desta pesquisa.
20

Geração de regras de extração de dados em páginas HTML

Caldas, Paracelso de Oliveira January 2003 (has links)
Existem vários trabalhos na área de extração de dados semi-estruturados, usando diferentes técnicas. As soluções de extração disponibilizadas pelos trabalhos existentes são direcionadas para atenderem a dados de certos domínios, considerando-se domínio o conjunto de elementos pertencentes à mesma área de interesse. Dada a complexidade e a grande quantidade dos dados semi-estruturados, principalmente dos disponíveis na World Wide Web (WWW), é que existem ainda muitos domínios a serem explorados. A maior parte das informações disponíveis em sites da Web está em páginas HTML. Muitas dessas páginas contêm dados de certos domínios (por exemplo, remédios). Em alguns casos, sites de organizações diferentes apresentam dados referentes a um mesmo domínio (por exemplo, farmácias diferentes oferecem remédios). O conhecimento de um determinado domínio, expresso em um modelo conceitual, serve para definir a estrutura de um documento. Nesta pesquisa, são consideradas exclusivamente tabelas de páginas HTML. A razão de se trabalhar somente com tabelas está baseada no fato de que parte dos dados de páginas HTML encontra-se nelas, e, como conseqüência, elimina-se o processamento dos outros dados, concentrando-se os esforços para que sejam processadas automaticamente. A pesquisa aborda o tratamento exclusivo de tabelas de páginas HTML na geração das regras de extração, na utilização das regras e do modelo conceitual para o reconhecimento de dados em páginas semelhantes. Para essa técnica, foi implementado o protótipo de uma ferramenta visual denominado Gerador de Regras de Extração e Modelo Conceitual (GREMO). GREMO foi desenvolvido em linguagem de programação visual Delphi 6.0. O processo de extração ocorre em quatro etapas: identificação e análise das tabelas de informações úteis em páginas HTML; identificação de conceitos para os elementos dos modelos conceituais; geração dos modelos conceituais correspondentes à página, ou utilização de modelo conceitual existente no repositório que satisfaça a página em questão; construção das regras de extração, extração dos dados da página, geração de arquivo XML correspondente aos dados extraídos e, finalmente, realimentação do repositório. A pesquisa apresenta as técnicas para geração e extração de dados semi-estruturados, as representações de domínio exclusivo de tabelas de páginas HTML por meio de modelo conceitual, as formas de geração e uso das regras de extração e de modelo conceitual.

Page generated in 0.0817 seconds