Submitted by Marcio Filho (marcio.kleber@ufba.br) on 2016-05-31T16:37:27Z
No. of bitstreams: 1
Dissertação Fabio Dos Santos Lima-corrigida-final.pdf: 2297835 bytes, checksum: 2aade3f62d20fd717c9065135a1c1493 (MD5) / Approved for entry into archive by Alda Lima da Silva (sivalda@ufba.br) on 2016-06-03T23:23:38Z (GMT) No. of bitstreams: 1
Dissertação Fabio Dos Santos Lima-corrigida-final.pdf: 2297835 bytes, checksum: 2aade3f62d20fd717c9065135a1c1493 (MD5) / Made available in DSpace on 2016-06-03T23:23:38Z (GMT). No. of bitstreams: 1
Dissertação Fabio Dos Santos Lima-corrigida-final.pdf: 2297835 bytes, checksum: 2aade3f62d20fd717c9065135a1c1493 (MD5) / A produção e disponibilização de informações não estruturadas na Web aumentam diariamente. Essa abundância de informações desestruturadas representa um grande desafio para a aquisição de conhecimento que seja processado por seres humanos e também por máquinas. Nesse sentido, ao longo dos anos diversas abordagens têm sido propostas para a extração automática de informações a partir de textos escritos em linguagem natural. Contudo, ainda existem poucos estudos que investigam a extração de informações a partir de textos escritos em português. Diante disso, o objetivo deste trabalho é propor e avaliar uma abordagem não supervisionada para o povoamento de ontologias utilizando a Web como grande fonte de informações, no contexto da língua portuguesa. Além disso, apresenta: (i) uma breve discussão sobre medidas de pontuação baseadas na PMI (Pontuação de Informação Mútua); (ii) novas medidas de pontuação com base na PMI e no cálculo de Desvio Padrão; e (iii) uma avaliação das medidas discutidas no contexto de textos em português do Brasil extraídos da web. Os resultados obtidos com os experimentos realizados foram encorajadores e demonstraram que a abordagem proposta obteve uma taxa de precisão média de 70% na extração de instâncias de classes ontológicas.
Identifer | oai:union.ndltd.org:IBICT/oai:192.168.11:11:ri/19378 |
Date | 05 November 2015 |
Creators | Lima, Fabio dos Santos |
Contributors | Salvador, Laís do Nascimento, Durão, Frederico Araujo, Bulcão Neto, Renato de Freitas |
Publisher | Instituto de Matemática. Departamento de Ciência da Computação, Mestrado Multiinstitucional em Ciência da Computação, UFBA, Brasil |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFBA, instname:Universidade Federal da Bahia, instacron:UFBA |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0023 seconds