Feature-level sentiment analysis applied to brazilian portuguese reviews

Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-05-19T12:00:48Z
No. of bitstreams: 1
468945 - Txto Completo.pdf: 990591 bytes, checksum: 7d04b4b3b2f91050851802c6d65349f1 (MD5) / Made available in DSpace on 2015-05-19T12:00:48Z (GMT). No. of bitstreams: 1
468945 - Txto Completo.pdf: 990591 bytes, checksum: 7d04b4b3b2f91050851802c6d65349f1 (MD5)
Previous issue date: 2015-03-23 / Funda??o de Amparo ? Pesquisa do Estado do Rio Grande do Sul - FAPERGS / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior - CAPES / Sentiment Analysis is the field of study that analyzes people?s opinions in texts. In the last decade, humans have come to share their opinions in social media on the Web (e.g., forum discussions and posts in social network sites). Opinions are important because whenever we need to take a decision, we want to know others? points of view. The interest of industry and academia in this field of study is partly due to its potential applications, such as: marketing, public relations and political campaign. Research in this field often considers English data, while data from other languages are less explored. It is possible realize data analysis in different levels, in this work we choose a finer-grain analysis, at aspect-level. Ontologies can represent aspects, that are ?part-of? an object or property of ?part-of? an object, we proposed a method for feature-level sentiment analysis using ontologies applied to Brazilian Portuguese reviews. In order to obtain a complete analysis, we recognized features explicit and implicit using ontologies. Relatively less work has been done about implicit feature identification. Finally, determine whether the sentiment in relation to the aspects is positive or negative using sentiment lexicons and linguistic rules. Our method is comprised of four steps: preprocessing, feature identification, polarity identification and summarizing. For evaluate this work, we apply our proposal method to a dataset of accommodation sector. According to our experiments, in general the best results were obtained when using TreeTagger, synsets with polarities from Onto.PT and linguistic rule (adjective position) for negative polarity identification and (baseline) for positive polarity identificatio / An?lise de sentimento ? o campo de estudo que analisa a opini?o de pessoas em textos. Na ?ltima d?cada, humanos t?m compartilhado suas opini?es em m?dias sociais na Web (por exemplo, f?runs de discuss?o e posts em sites de redes sociais). Opini?es s?o importantes porque sempre que necessitamos tomar uma decis?o, queremos saber o ponto de vista de outras pessoas. O interesse da ind?stria e da academia neste campo de estudo se deve a aplica??es potenciais, tais como: compra/venda, rela??es p?blicas e campanhas pol?ticas. Pesquisas neste campo muitas vezes consideram dados em ingl?s, enquanto dados em outros idiomas s?o pouco explorados. ? poss?vel realizar a an?lise dos dados em diferentes n?veis, neste trabalho optamos pela an?lise no n?vel de aspecto, na qual a granularidade ? mais fina. Como ontologias podem ser utilizadas para representar aspectos, que s?o ?parte-de? um objeto ou propriedade de ?parte-de? um objeto, propomos um m?todo para an?lise de sentimento aplicado a coment?rios em portugu?s brasileiro, sob o n?vel de aspecto usando ontologias. A fim de obter uma an?lise completa, reconhecemos aspectos expl?citos e impl?citos usando ontologias. Relativamente poucos trabalhos t?m sido feitos sobre identifica??o de aspectos impl?citos. Finalmente determinamos se o sentimento em rela??o aos aspectos ? positivo ou negativo usando l?xicos de sentimento e regras lingu?sticas. Nosso m?todo ? composto de quatro etapas: pr?-processamento, identifica??o de aspecto, identifica??o de polaridade e sumariza??o. Para avaliar este trabalho, aplicamos o m?todo proposto nos coment?rios do setor hoteleiro. De acordo com nosso experimento, o melhor resultado obtido foi quando utilizamos o TreeTagger, o synset com polaridade do Onto.PT e a regra lingu?stica (posi??o do adjetivo) na identifica??o da polaridade negativa e (baseline) na identifica??o da polaridade positiva

Identiferoai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/6031
Date23 March 2015
CreatorsFreitas, Larissa Astrogildo de
ContributorsVieira, Renata
PublisherPontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, Brasil, Faculdade de Inform?tica
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rightsinfo:eu-repo/semantics/openAccess
Relation1974996533081274470, 600, 600, 600, 600, 600, -3008542510401149144, 3671711205811204509, -3614735573891122254, 2075167498588264571

Page generated in 0.0021 seconds