Return to search

Um processo para classificação de sentimentos no twitter utilizando termos factuais e retweets

Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-05-13T17:35:12Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertacao - Gleibson Oliveira.pdf: 1128535 bytes, checksum: 58357adabe3c7e05194c892a9e5f46fd (MD5) / Made available in DSpace on 2016-05-13T17:35:12Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertacao - Gleibson Oliveira.pdf: 1128535 bytes, checksum: 58357adabe3c7e05194c892a9e5f46fd (MD5)
Previous issue date: 2014-07-01 / CNPQ / A internet hoje pode ser considerada uma das maiores bases de informações do mundo, acessível para qualquer pessoa. Com sua popularização e o crescimento da necessidade de produção de conteúdo, popularizam-se também os blogs e principalmente as redes sociais, onde milhões de usuários trocam informações e opinam sobre os mais diferentes assuntos. Opiniões, por sua vez, são de grande valia no processo decisório, seja de empresas ou de pessoas físicas. Entretanto, o crescimento vertiginoso dessas informações na internet torna o trabalho de obter uma opinião geral acerca de um determinado assunto uma tarefa complicada, sobretudo se for realizada de forma manual. Uma solução automatizada apresenta-se como a melhor saída. Cresce, então, uma área bastante utilizada para construção de sistemas que tratam opinião de forma automatizada, a Análise de Sentimento (AS), também nomeada de Mineração de Opinião. Seu objetivo é classificar textos, sentenças ou blocos de texto como positivos ou negativos acerca da opinião a respeito de algum objeto, seja este um produto, serviço ou até mesmo uma pessoa. Muitos trabalhos foram propostos na área de Análise de Sentimentos, provendo avaliações da opinião global ou detalhada (para cada característica) a respeito do objeto analisado. Entretanto, a grande maioria dos trabalhos obtém a opinião de uma característica do objeto através da análise do adjetivo associado a mesma. O trabalho aqui proposto busca expandir essa análise para as demais palavras, incluindo substantivos e palavras de outras classes gramaticais que possam indicar opinião acerca do objeto. O processo proposto utiliza como fonte de opiniões o debate político polarizado, onde os usuários, potenciais eleitores, se posicionam em um dos lados da disputa. Os dados foram coletados do micro blog Twitter [TWITTER, 2006] até o horário de início das votações. O processo tem como objetivo incluir termos pouco abordados na literatura como representadas das opiniões dos usuários, evitando assim a eliminação sumária de parte do corpus analisado. / Nowadays, the internet can be considered one of the largest databases of information in the world, accessible to anyone. With its popularity and growth of the need to produce content, also become popular, blogs and especially social networks, where millions of users exchange information and think of the most different subjects. Opinions, in turn, are of great value in the decision making process, whether companies or individuals. However, the rapid growth of such information on the Internet makes work to get a general opinion about a given subject a complicated task, particularly if performed manually. An automated solution is presented as a best option. Grows, then a quite area used to build systems that handle automated opinion, the Sentiment Analysis (SA), also named Mining Opinion. Your goal is to classify texts, sentences or blocks of text as positive or negative opinion about any object, be it a product, service or even a person. Many works have been proposed in the area of sentiment analysis, providing assessments of global or detailed view (for each feature) about the analyzed object. However, the vast majority of researchs get the opinion of a characteristic of the object by analyzing the adjective associated with it. The work proposed here seeks to expand this analysis to other words, including nouns and other grammatical classes of words that may indicate opinion about the object. The proposed process uses polarized political debate as a source of opinions, where users, potential voters, are positioned on one side of the race. Data were collected from the micro blog Twitter [TWITTER, 2006] until the start time of voting. The process aims to include terms used poorly in the literature as represented the views of users, thus avoiding the summary disposal of the analyzed corpus.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/16926
Date01 July 2014
CreatorsOLIVEIRA, Gleibson Rodrigo Silva de
ContributorsBARROS, Flávia de Almeida
PublisherUniversidade Federal de Pernambuco, Programa de Pos Graduacao em Ciencia da Computacao, UFPE, Brasil
Source SetsIBICT Brazilian ETDs
LanguageBreton
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
RightsAttribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0033 seconds