1 |
Analise de sentimento em documentos financeiros com múltiplas entidadesFerreira, Javier Zambreno 25 February 2014 (has links)
Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-06-17T16:03:10Z
No. of bitstreams: 1
Dissertação- Javier zambrano Ferreira.pdf: 1147973 bytes, checksum: 97e9e41bf4b5d99b09151b69f9c99dfe (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-17T20:27:39Z (GMT) No. of bitstreams: 1
Dissertação- Javier zambrano Ferreira.pdf: 1147973 bytes, checksum: 97e9e41bf4b5d99b09151b69f9c99dfe (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-17T20:29:11Z (GMT) No. of bitstreams: 1
Dissertação- Javier zambrano Ferreira.pdf: 1147973 bytes, checksum: 97e9e41bf4b5d99b09151b69f9c99dfe (MD5) / Made available in DSpace on 2015-06-17T20:29:11Z (GMT). No. of bitstreams: 1
Dissertação- Javier zambrano Ferreira.pdf: 1147973 bytes, checksum: 97e9e41bf4b5d99b09151b69f9c99dfe (MD5)
Previous issue date: 2014-02-25 / Não Informada / Given the amount of information available on the internet, it becomes unfeasible the
manual content analysis to identify information of interest. Among such analyses, one of particular interest is the polarity analysis, that is, the classi cation of a text document in positive, negative, and neutral, according to a certain topic. This task is particularly useful in the nance domain, where news about a company can a ect the performance of its stocks. Although most of the methods about this domain consider that documents have only one polarity, in fact most of the documents cite many entities and these entities are often the target of the polarity analysis. Thus, in this work, we intend to study strategies for polarity detection in nancial documents with multiple entities. In particular, we study methods based on the learning of multiple models, one for each observed entity, using SVM classi ers. We evaluate models based on the partition of documents according to the entities they cite and on the segmentation of documents into fragments according to the entities they cite. To segment documents we use several heuristics based on shallow and
deep natural language proecssing. We found that entity-speci c models created by
simply partitioning the document collection largely outperformed strategies based on single models. / Dado o volume de infoma ção disponivel na Internet torna-se inviavel a analise manual do conteudo disponvel para identi car diversas informações de interesse. Entre v arias analises de interesse, uma de destaque e a an alise de polaridade da opinião, ou seja, a classificação de um documento textual em positivo, negativo ou neutro, em rela cão a um certo topico. Esta tarefa e particularmente util no dom nio fi nanceiro, onde not cias sobre uma empresa podem afetar o seu desempenho em mercados de a cões. Embora a maioria dos m etodos nesse dom nio considere que os documentos possuem uma unica polaridade, observamos que a maioria deles e constitudo de multiplas entidades e o alvo da analise de polaridade e, em geral, as entidades que estes documentos referenciam. O objetivo deste trabalho e, portanto, estudar estrategias para a detecção de polaridade em documentos financeiros com multiplas entidades. Para tanto, estudamos m etodos baseados na cria c~ao de multiplos modelos de aprendizado com um conjunto pr e-de nido de entidades, usando o classi cador SVM. N os avaliamos tanto modelos baseados em conjuntos de documentos especcos por entidade quanto modelos baseados em segmentação de documentos usando diversas heursticas de processamento de linguagem natural. Os resultados mostraram que h a um ganho em fragmentar os textos para an alise de polaridade com r otulos de classi ca cão por entidades.
|
2 |
Deciding Polarity of Opinions over Multi-Aspect Customer ReviewsKayaalp, Naime F. January 2014 (has links)
No description available.
|
3 |
Detecção de opiniões e análise de polaridade em documentos financeiros com múltiplas entidades.Silva, Josiane Rodrigues da 05 March 2015 (has links)
Submitted by Kamila Costa (kamilavasconceloscosta@gmail.com) on 2015-06-11T19:07:15Z
No. of bitstreams: 1
Dissertação-Josiane R da Silva.pdf: 885828 bytes, checksum: c1b7c04345db68585285d33349f9677f (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-15T18:03:40Z (GMT) No. of bitstreams: 1
Dissertação-Josiane R da Silva.pdf: 885828 bytes, checksum: c1b7c04345db68585285d33349f9677f (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-15T18:06:18Z (GMT) No. of bitstreams: 1
Dissertação-Josiane R da Silva.pdf: 885828 bytes, checksum: c1b7c04345db68585285d33349f9677f (MD5) / Made available in DSpace on 2015-06-15T18:06:18Z (GMT). No. of bitstreams: 1
Dissertação-Josiane R da Silva.pdf: 885828 bytes, checksum: c1b7c04345db68585285d33349f9677f (MD5)
Previous issue date: 2015-03-05 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Polarity analysis aims at classifying the author’s opinion into positive, negative, or neutral.
However, given the sheer volume of information available on the web, manually carrying
out such task is unfeasible. In particular, in the financial domain this type of analysis is
useful for companies in making decisions related to the financial market which is particularly
prone to changes according to shifting of opinions. Most studies in literature
deal with this problem by considering that documents have a global polarity. However, in
general, documents cite several entities with possibly different polarities. This suggests
that the classification should be performed in an entity level. Besides this problem, we
also noted that many financial documents do not always emit opinion. Thus, a first task
of interest in this research field is to identify documents on which opinions are expressed,
that is, the subjective ones. Therefore, in this paper we propose a supervised polarity
classification method based on multiple models to deal with financial documents with
multiple entities. In particular, we study text segmentation strategies that use heuristics
such as string matching and anaphora resolution and we propose a hierarchical classification
method based on subjectivity detection. Our results showed that the multiple-models
approach significantly outperformed the global-model baseline. The segmentation of the
documents restricted to sentences that mention entities and the adoption of a hierarchical
strategy also achieved gains, although modest. / Análise de polaridade consiste em classificar a opinião do autor em positiva, negativa e
neutra. No entanto, dado o grande volume de informações disponíveis na Web, esta análise
manual torna-se inviável. Em particular, no domínio financeiro este tipo de análise é
útil para empresas na tomada de decisões relacionadas ao mercado financeiro que parece
ser particularmente propenso a mudanças de acordo com opiniões. Os trabalhos disponíveis
na literatura propõem abordagens globais para esta tarefa, ou seja, consideram que
o texto tem apenas uma polaridade. No entanto, verifica-se que os documentos, em sua
grande maioria, citam várias entidades e as polaridades para estas entidades, em geral,
são diferentes. Isto sugere que a classificação de polaridade deve ser feita em nível de
entidade. Contudo, a maioria das abordagens tradicionais não concentram-se na tarefa de
classificar polaridade por entidade. Além disso, observamos que muitos dos documentos
no domínio financeiro nem sempre emitem opinião. Assim, uma primeira tarefa de
interesse nesse domínio é identificar os documentos em que opiniões são expressas, isto
é, documentos subjetivos. Portanto, neste trabalho propomos um método supervisionado
para classificação de polaridade baseado em múltiplos modelos com o intuito de classificar
documentos financeiros com múltiplas entidades. Em particular, estudamos estratégias
de segmentação em texto que usam heurísticas de casamento de string e resolução
de anáfora e propomos um método de classificação hierárquica baseada em detecção de
subjetividade. Nossos resultados mostraram que uma abordagem baseada em múltiplos
modelos é capaz de obter ganhos significativos sobre uma abordagem baseada em modelo
global na tarefa de classificação de polaridade com múltiplas entidades. A segmentação
do documento em sentenças que mencionam as entidades e a adoção de uma estratégia
hierárquica também obtiveram ganhos, embora modestos.
|
Page generated in 0.0551 seconds