Return to search

Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos

Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-11-29T15:11:00Z
No. of bitstreams: 1
Dissertação - Diego de A. Barros.pdf: 760197 bytes, checksum: 4306ea5472fd227d9ecd45e370ab7885 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-11-29T15:11:15Z (GMT) No. of bitstreams: 1
Dissertação - Diego de A. Barros.pdf: 760197 bytes, checksum: 4306ea5472fd227d9ecd45e370ab7885 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-11-29T15:11:33Z (GMT) No. of bitstreams: 1
Dissertação - Diego de A. Barros.pdf: 760197 bytes, checksum: 4306ea5472fd227d9ecd45e370ab7885 (MD5) / Made available in DSpace on 2016-11-29T15:11:33Z (GMT). No. of bitstreams: 1
Dissertação - Diego de A. Barros.pdf: 760197 bytes, checksum: 4306ea5472fd227d9ecd45e370ab7885 (MD5)
Previous issue date: 2016-07-12 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A very important issue for the analysis of comments posted by users in social networks is
the identification of the entities that are the target of these comments. However, correctly
identifying the entities mentioned in texts produced by users is a challenging task, since
the same entity can be mentioned in several different ways, depending on the user and on
how the mention is being made. In addition, these comments are characterized by text
with low-quality writing, misspellings, grammatical errors, etc. In this work, we present a
case study on the problem of identification and disambiguation of mentions to entities in
user-generated content, focused on the domain of games. The choice of this domain is due
to the economic and cultural importance of this type of content and also because most of
the work in recent literature related to this problems focuses on the context of electronics
(televisions, smartphones, etc.). As a strategy for carrying out this case study, we have
developed a tool called GameSpotter, which uses methods of named entity recognition
- NER and named entity disambiguation - NED to identify and disambiguate mentions
to games in comments posted on a real Web forum. Therefore, we have developed two
alternative NER methods and one NED method focused on the domain of games. Our
experimental results showed that our NER and NED methods are effective, achieving an
average precision of 0.93 and 0.83 in the recognition and disambiguation mentions of
games, respectively. / Um problema bastante relevante para a análise de comentários postados por usuários em
redes sociais é a identificação das entidades que são o alvo destes comentários. No
entanto, identificar corretamente as entidades mencionadas em textos produzidos pelos
usuários é uma tarefa desafiadora, visto que uma mesma entidade pode ser mencionada
de várias maneiras diferentes, dependendo do usuário e de como a menção está sendo
feita. Além disso, esses comentários são caracterizados por texto com baixa qualidade
de escrita, erros ortográficos, gramaticais, etc. Neste trabalho, apresentamos um estudo
de caso sobre o problema de identificação e desambiguação de menções a entidades em
conteúdo gerado por usuários, voltado para o domínio de jogos. A escolha deste domínio
deve-se à importância econômica e cultural deste tipo de conteúdo e também ao fato de a
maioria dos trabalhos na literatura relacionada recente abordar este problema no contexto
de produtos eletrônicos (televisores, smartphones, etc.). Como estratégia para a realização
deste estudo de caso, desenvolvemos uma ferramenta chamada GameSpotter, que
utiliza métodos de reconhecimento de entidades nomeadas (named entity recognition -
NER) e de desambiguação de entidades nomeadas (named entity disambiguation - NED)
para identificar e desambiguar as menções a jogos nos comentários postados em um fórum
real daWeb. Para tanto, desenvolvemos dois métodos alternativos NER e um método
de NED voltados ao domínio de jogos. Nossos resultados experimentais mostraram que
nossos métodos de NER e NED são efetivos, tendo alcançado em média uma precisão de
0,93 e 0,83 em relação ao reconhecimento e desambiguação de menções a jogos, respectivamente.

Identiferoai:union.ndltd.org:IBICT/oai:http://localhost:tede/5291
Date12 July 2016
CreatorsBarros, Diego de Azevedo
ContributorsSilva, Altigran Soares da
PublisherUniversidade Federal do Amazonas, Programa de Pós-graduação em Informática, UFAM, Brasil, Instituto de Computação
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFAM, instname:Universidade Federal do Amazonas, instacron:UFAM
Rightsinfo:eu-repo/semantics/openAccess
Relation-312656415484870643, 600, 500, 4163267508810754609

Page generated in 0.0026 seconds