Return to search

Um método para povoamento de ontologias: extração de textos da web no idioma português

Submitted by Marcio Filho (marcio.kleber@ufba.br) on 2016-05-31T16:37:27Z
No. of bitstreams: 1
Dissertação Fabio Dos Santos Lima-corrigida-final.pdf: 2297835 bytes, checksum: 2aade3f62d20fd717c9065135a1c1493 (MD5) / Approved for entry into archive by Alda Lima da Silva (sivalda@ufba.br) on 2016-06-03T23:23:38Z (GMT) No. of bitstreams: 1
Dissertação Fabio Dos Santos Lima-corrigida-final.pdf: 2297835 bytes, checksum: 2aade3f62d20fd717c9065135a1c1493 (MD5) / Made available in DSpace on 2016-06-03T23:23:38Z (GMT). No. of bitstreams: 1
Dissertação Fabio Dos Santos Lima-corrigida-final.pdf: 2297835 bytes, checksum: 2aade3f62d20fd717c9065135a1c1493 (MD5) / A produção e disponibilização de informações não estruturadas na Web aumentam diariamente. Essa abundância de informações desestruturadas representa um grande desafio para a aquisição de conhecimento que seja processado por seres humanos e também por máquinas. Nesse sentido, ao longo dos anos diversas abordagens têm sido propostas para a extração automática de informações a partir de textos escritos em linguagem natural. Contudo, ainda existem poucos estudos que investigam a extração de informações a partir de textos escritos em português. Diante disso, o objetivo deste trabalho é propor e avaliar uma abordagem não supervisionada para o povoamento de ontologias utilizando a Web como grande fonte de informações, no contexto da língua portuguesa. Além disso, apresenta: (i) uma breve discussão sobre medidas de pontuação baseadas na PMI (Pontuação de Informação Mútua); (ii) novas medidas de pontuação com base na PMI e no cálculo de Desvio Padrão; e (iii) uma avaliação das medidas discutidas no contexto de textos em português do Brasil extraídos da web. Os resultados obtidos com os experimentos realizados foram encorajadores e demonstraram que a abordagem proposta obteve uma taxa de precisão média de 70% na extração de instâncias de classes ontológicas.

Identiferoai:union.ndltd.org:IBICT/oai:192.168.11:11:ri/19378
Date05 November 2015
CreatorsLima, Fabio dos Santos
ContributorsSalvador, Laís do Nascimento, Durão, Frederico Araujo, Bulcão Neto, Renato de Freitas
PublisherInstituto de Matemática. Departamento de Ciência da Computação, Mestrado Multiinstitucional em Ciência da Computação, UFBA, Brasil
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFBA, instname:Universidade Federal da Bahia, instacron:UFBA
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0026 seconds