Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2015 / Made available in DSpace on 2016-02-09T03:11:46Z (GMT). No. of bitstreams: 1
337378.pdf: 4389643 bytes, checksum: 1701260659b2ae4b7afa3bf45370be3c (MD5)
Previous issue date: 2015 / O uso de informações externas às organizações, presentes nas redes sociais, pode auxiliar no processo de compra de um produto por parte de um cliente a partir da leitura de revisões ou de blogs especializados. A classificação de texto, mais precisamente, a análise de sentimento, auxilia na definição da imagem de um produto ou na identificação do sentimento de uma sentença como positiva ou negativa. Neste trabalho propõe-se um modelo que combina ontologia de domínio com técnicas de processamento de linguagem natural para a identificação do sentimento agregado a uma determinada sentença, buscando apresentar uma explicação para tal polarização. Utiliza-se ainda o raciocínio baseado em casos para que seja possível aprender com os raciocínios (polarizações) passados, visando reutilizá-los em novas classificações. Também foram elaboradas etapas para o tratamento de negação, para a adequação do léxico de sentimento para um domínio e para a adaptação da classificação de termos ambíguos baseados em classificações passadas. Foram desenvolvidos testes em dois domínios distintos, câmeras digitais e filmes, para justificar a evolução do modelo até se chegar à proposta final. Pôde-se observar que a acurácia obtida pelo modelo é superior à obtida por abordagens estatísticas tradicionais. Esses resultados demonstram que o modelo da tese contribui para a área de análise de sentimento, tanto no nível da acurácia quanto pela possibilidade de apresentar o caminho percorrido para chegar a determinada classificação.<br> / Abstract : The use of information outside organizations available in social networks such as reviews or specialized blogs can assist customers in their decisions. The text classification, more precisely sentiment analysis, assists in defining the image of a product or identifying the sense of a sentence as positive or negative. This work intends to combine domain ontology with natural language processing techniques to identify the sentiment behind judgments aiming to provide an explanation for such polarization. Also, it intends to use the Case-Based Reasoning strategy in order to learn from past reasonings (polarizations) so they can be used in new polarizations. Some steps have been developed for treatment of negation, adequacy of sentiment lexicon for a domain and adaptation of ambiguous terms classification based on past ratings. Tests were developed in two distinct areas, digital cameras and movies, to justify the model evolution until its final proposal. It was observed that the accuracy obtained by the proposed model overcomes standard statisticals approaches. These results demonstrate that the thesis model contributes to the sentiment analysis area, both as a solution that provides high levels of accuracy, as well as the possibility to present the track to achieve a particular classification.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufsc.br:123456789/158856 |
Date | January 2015 |
Creators | Ceci, Flávio |
Contributors | Universidade Federal de Santa Catarina, Gonçalves, Alexandre Leopoldo, Pacheco, Roberto Carlos dos Santos |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | 211 p.| il., tabs., grafs. |
Source | reponame:Repositório Institucional da UFSC, instname:Universidade Federal de Santa Catarina, instacron:UFSC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds