Return to search

[pt] CLASSIFICAÇÃO DE SENTIMENTO PARA NOTÍCIAS SOBRE A PETROBRAS NO MERCADO FINANCEIRO / [en] SENTIMENT ANALYSIS FOR FINANCIAL NEWS ABOUT PETROBRAS COMPANY

[pt] Hoje em dia, encontramos uma grande quantidade de informações na internet,
em particular, notícias sobre o mercado financeiro. Diversas pesquisas
mostram que notícias sobre o mercado financeiro possuem uma grande relação com variáveis de mercado como volume de transações, volatilidade e preço
das ações. Nesse trabalho, investigamos o problema de Análise de Sentimentos
de notícias jornalísticas do mercado financeiro. Nosso objetivo é classificar
notícias como favoráveis ou não a Petrobras. Utilizamos técnicas de Processamento
de Linguagem Natural para melhorar a acurácia do modelo clássico de
saco-de-palavras. Filtramos frases sobre a Petrobras e inserimos novos atributos
linguísticos, tanto sintáticos como estilísticos. Para a classifição do sentimento
é utilizado o algoritmo de aprendizado Support Vector Machine, sendo
aplicados ainda quatro seletores de atributos e um comitê dos melhores modelos.
Apresentamos aqui o Petronews, um corpus com notícias em português
sobre a Petrobras, anotado manualmente com a informação de sentimento.
Esse corpus é composto de mil e cinquenta notícias online de 02/06/2006 a
29/01/2010. Nossos experimentos mostram uma melhora de 5.29 por cento
com relação ao modelo saco-de-palavras, atingindo uma acurácia de 87.14 por cento. / [en] A huge amount of information is available online, in particular regarding
financial news. Current research indicate that stock news have a strong
correlation to market variables such as trade volumes, volatility, stock prices
and firm earnings. Here, we investigate a Sentiment Analysis problem for
financial news. Our goal is to classify financial news as favorable or unfavorable
to Petrobras, an oil and gas company with stocks in the Stock Exchange
market. We explore Natural Language Processing techniques in a way to
improve the sentiment classification accuracy of a classical bag of words
approach. We filter on topic phrases for each Petrobras related news and build
syntactic and stylistic input features. For sentiment classification, Support
Vector Machines algorithm is used. Moreover we apply four feature selection
methods and build a committee of SVM models. Additionally, we introduce
Petronews, a Portuguese financial news annotated corpus about Petrobras.
It is composed by a collection of one thousand and fifty online financial news
from 06/02/2006 to 01/29/2010. Our experiments indicate that our method
is 5.29 per cent better than a standard bag-of-words approach, reaching 87.14 per cent
accuracy rate for this domain.

Identiferoai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:18823
Date21 December 2011
CreatorsPAULA DE CASTRO SONNENFELD VILELA
ContributorsRUY LUIZ MILIDIU
PublisherMAXWELL
Source SetsPUC Rio
LanguagePortuguese
Detected LanguagePortuguese
TypeTEXTO

Page generated in 0.002 seconds