O grande número de opiniões geradas por usuários online fez o antigo \boca a boca" migrar para o mundo virtual. Além de numerosas, muitas opiniões úteis estão misturadas com um grande número de opiniões fraudulentas, incompletas ou repetitivas. No entanto, como encontrar os fatores que influenciam no número de votos recebidos por uma opinião e encontrar opiniões consideradas úteis? A literatura na área de mineração de opiniões possui diversos estudos e técnicas que são capazes de analisar a influência de propriedades encontradas no texto das opiniões. Este trabalho apresenta a adaptação para o português de uma metodologia de avaliação de utilidade de opiniões com o objetivo de identificar quais características exercem maior influência na quantidade de votos de utilidade: básicas (ex. nota atribuída a produtos/serviços, data da publicação), textuais (ex. tamanho das palavras, parágrafos) e semântica (ex. o significado das palavras do texto). A avaliação foi realizada em uma base de dados extraída do site TripAdvisor com opiniões sobre hotéis escritas em português. Resultados mostram que os usuários dão mais atenção a opiniões recentes com notas mais altas para localização do hotel e com notas mais baixas para qualidade do sono, atendimento e limpeza. Textos com opiniões positivas, palavras curtas, poucos adjetivos e advérbios aumentam as chances de receber mais votos. / The large number of opinions generated by online users made the former “word of mouth” find its way to virtual world. In addition to be numerous, many of the useful reviews are mixed with a large number of fraudulent, incomplete or duplicate reviews. However, how to find the features that influence on the number of votes received by an opinion and find useful reviews? The literature on opinion mining has several studies and techniques that are able to analyze of properties found in the text of reviews. This paper presents the application of a methodology for evaluation of usefulness of opinions with the aim of identifying which characteristics have more influence on the amount of votes: basic utility (e.g. ratings about the product and/or service, date of publication), textual (e.g.size of words, paragraphs) and semantics (e.g., the meaning of the words of the text). The evaluation was performed in a database extracted from TripAdvisor with opinionsabout hotels written in Portuguese. Results show that users give more attention to recent opinions with higher scores for value and location of the hotel and with lowest scores for sleep quality and service and cleanliness. Texts with positive opinions, small words, few adjectives and adverbs increase the chances of receiving more votes.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.utfpr.edu.br:1/1616 |
Date | 27 August 2015 |
Creators | Martins, Augusto Cesar Souza |
Contributors | Tacla, Cesar Augusto, Tacla, Cesar Augusto, Kaestner, Celso Antonio Alves, Paraiso, Emerson, Bastos, Laudelino Cordeiro |
Publisher | Universidade Tecnológica Federal do Paraná, Curitiba, Programa de Pós-Graduação em Computação Aplicada, UTFPR, Brasil |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UTFPR, instname:Universidade Tecnológica Federal do Paraná, instacron:UTFPR |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0026 seconds