Return to search

Extração e mineração de informação independente de domínios da web na língua portuguesa / Extraction and mining domain independent information from web in portuguese

Submitted by Cássia Santos (cassia.bcufg@gmail.com) on 2015-10-21T14:08:06Z
No. of bitstreams: 2
Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-10-22T13:08:50Z (GMT) No. of bitstreams: 2
Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2015-10-22T13:08:50Z (GMT). No. of bitstreams: 2
Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Previous issue date: 2015-05-08 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Many people are constantly connected on the Web. They are looking for all kinds of
things. The Web is a huge source of information. So, they can find almost everything
they want. However, Web information is disorganized and have no formal structure. This
hampers machine processing and consequently makes information access more difficult.
Bringing structure to the Web can be one of the key points for facilitating user searching
and navigation. A recent technique, Open Information Extraction, has been successfully
applied to extract structured information from the Web. This technique has been mostly
applied in pages written in English. This work is specifically focused on information
extraction for Portuguese. Techniques used here can be also used to other languages too. / Muitas pessoas estão constantemente conectadas na Web. Elas estão procurando por todo
tipo de coisa. A Web é uma enorme fonte de informação. Assim, as pessoas podem
encontrar praticamente tudo que elas precisam. Entretanto, as informações da Web são
desorganizadas e não possuem uma estrutura formal. Isso dificulta o processamento das
máquinas e consequentemente torna o acesso à informaçã mais difícil. Trazer estrutura
para a Web pode ser um dos pontos chave para facilitar a busca e navegaçã dos usuários.
Uma técnica recente, Extração de Informação Aberta, foi aplicada com sucesso para
extrair informação da Web. Essa técnica foi aplicada principalmente em páginas em
Inglês. Este trabalho é focado especificamente na extração de informação em Português.
As técnicas usadas aqui também podem ser utilizadas para outras linguagens.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.bc.ufg.br:tede/4723
Date08 May 2015
CreatorsPires, Julio Cesar Batista
ContributorsCarvalho, Cedric Luiz de, Carvalho, Cedric Luiz de, Ambrósio, Ana Paula Laboissière, Vieira, Renata
PublisherUniversidade Federal de Goiás, Programa de Pós-graduação em Ciência da Computação (INF), UFG, Brasil, Instituto de Informática - INF (RG)
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFG, instname:Universidade Federal de Goiás, instacron:UFG
Rightshttp://creativecommons.org/licenses/by-nc-nd/4.0/, info:eu-repo/semantics/openAccess
Relation-3303550325223384799, 600, 600, 600, 600, -7712266734633644768, 3671711205811204509, 2075167498588264571

Page generated in 0.0025 seconds