11 |
RELATOS VERBAIS DE CONSUMIDORES EM AVALIAÇÕES ON-LINE: PROSPECÇÃO COMPUTACIONAL E INTERPRETAÇÕES COM BASE NO BEHAVIORAL PERSPECTIVE MODEL (BPM)Brito, Parcilene Fernandes de 29 June 2018 (has links)
Submitted by admin tede (tede@pucgoias.edu.br) on 2018-09-27T18:13:44Z
No. of bitstreams: 1
ParcileneFernandesdeBrito.pdf: 2444083 bytes, checksum: eea4e1b897bdd9e57504c34888b57c01 (MD5) / Made available in DSpace on 2018-09-27T18:13:44Z (GMT). No. of bitstreams: 1
ParcileneFernandesdeBrito.pdf: 2444083 bytes, checksum: eea4e1b897bdd9e57504c34888b57c01 (MD5)
Previous issue date: 2018-06-29 / The vast amount of information available on the Internet have enabled numerous
multidisciplinar investigations aimed to understand nuances of human consumption
behavior, especially to identify people's opinions about products and services. From
Behavioral Perspective Model (BPM), consumer behavior analysis can be conducted
focusing on antecedent variables (behavioral setting and consumer learning history)
and consequences (reinforcement and punishment, utilitarian and informative) to the
occurrence of behavior. The present thesis investigated consumption behavior in the
context of tourism, with BPM as theoretical support for interpretations of verbal data
extracted from comments available on the TripAdvisor®, a website about tourism.
Verbal responses of tourism consumers, engaged in the process of online avaluation
of components of tourism products (specifically, Accommodations [ACO], Restaurants
[RES] and Attractions [ATR]), were analyzed. Research participants were the unknown
individuals who, between the beginning of February and the end of March 2017,
emitted 6.438.497 comments distributed among the 100 most evaluated Brazilian
touristic destinations at TribAdvisor®. In two studies (Study 1 [E1] and Study 2 [E2]),
the thesis research aimed at: a) extraction and analysis of tourist´s verbal information
(commentaries) throught a Sentiment Analysis (SA) computational technique;
extraction the number of touristic product component (ACO, RES e ATR) evaluative
indications emitted by tourism consumers with different statuses as TripColaborators;
extraction of the number of votes (Likes) to the comments; b) describe the polarized
evaluative response attributed to the 100 evaluated touristic destinations and interpret
such responding considering BPM concepts. E1 resulted in the successful
development of the SentimentALL tool, focusing on the AS module, and the generation
the primary variables explored in E2 (n = 197). In E2, data generated in E1 and derived
measures were explored (described in rankings and correlation analyzes) and
interpreted using the BPM conceptual framework. With a fundamental exploratory
caracter, the interpretative effort suggested profitable research lines and utility of the
computational and psychological knowledges integration. / A grande quantidade de informações disponíveis na internet tem viabilizado
numerosas investigações de caráter multidisciplinar com o objetivo de entender
nuances do comportamento de consumo humano, especialmente identificar as
opiniões das pessoas sobre produtos e serviços. A partir do Behavioral Perspective
Model (BPM), análises do comportamento do consumidor podem ser realizadas
considerando variáveis antecedentes (cenário do comportamento e história de
aprendizagem do consumidor) e consequências (reforços e punições, utilitários e
informativos) à ocorrência do comportamento. A presente tese investigou o
comportamento de consumo no contexto do turismo, com o BPM como suporte teórico
para interpretações de dados verbais extraídos de comentários disponíveis no
TripAdvisor®, website do setor. Para tanto, analisaram-se as respostas verbais de
turistas-consumidores no processo de “opinar on-line” sobre componentes de
produtos turísticos (especificamente, acomodações – ACO, restaurantes – RES e
atrações – ATR). Os participantes da pesquisa foram os indivíduos (desconhecidos)
que, entre o início de fevereiro e o final de março de 2017, emitiram, no TripAdvisor®,
6.438.497 comentários distribuídos entre os 100 destinos turísticos brasileiros mais
avaliados. Descrita em dois estudos (Estudo 1 [E1] e Estudo 2 [E2]), a pesquisa de
tese se propôs a: a) extração e análise de informações verbais (comentários) dos
turistas com base na técnica computacional Análise de Sentimentos (AS); extração do
número de indicações avaliativas dos componentes do produto turístico (ACO, RES e
ATR) emitidas por turistas-consumidores com diferentes status como
TripColaboradores; extração do número de votos úteis (Likes) nos comentários; b)
descrever o responder avaliativo polarizado atribuído aos 100 destinos turísticos
avaliados e analisar interpretativamente tal responder a partir do BPM. O E1 resultou
no desenvolvimento da ferramenta SentimentALL, com foco no módulo de AS, e na
geração das variáveis primárias exploradas no E2 (n = 197). No E2, dados gerados
no E1 e medidas derivadas foram explorados (descritos em rankings e análises de
correlação) e interpretados com recurso ao referencial conceitual do BPM. De caráter
fundamentalmente exploratório, o esforço interpretativo sugeriu linhas profícuas de
pesquisa e a utilidade da integração entre conhecimentos computacionais e
psicológicos.
|
12 |
Tecnologias de linguagem aplicadas à percepção social : detecção de emoções em redes sociais sobre a seca em São PauloRodriguez, Nathália Ferrete January 2016 (has links)
Orientadora: Profª. Dra. Margarethe Born Steinberger-Elias / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, 2016. / Redes sociais têm se tornado um meio comum para as pessoas se expressarem, especialmente emoções e sentimentos sobre assuntos diversos. A análise destes dados através da Inteligência Artificial e de PLN (Processamento de Linguagem Natural) possibilita a extração automática de conhecimento neste imenso volume de informação, inclusive do sentimento social sobre assuntos diversos. O conhecimento extraído pode ser utilizado para entender e antecipar expectativas a respeito de fatos, pessoas, produtos e serviços. Esta pesquisa interdisciplinar envolvendo Linguística, Computação e Ciências Sociais tem como objetivo principal a detecção automática de emoções sobre as mensagens e entidades mencionadas nos textos do Facebook e do Twitter no domínio da seca ocorrida no estado de São Paulo durante os anos de 2013, 2014 e 2015. O método de detecção automática de emoções proposto utiliza conceitos de PLN, além de métodos estatísticos para descoberta de padrões. Ele não se restringe ao domínio da seca, podendo ser estudado para aplicação em outros domínios. Para definição e aplicação do método foram utilizadas diversas ferramentas computacionais. / Social networks have become a common way for people to express themselves, especially emotions and feelings about various subjects. The analysis of these data by Artificial Intelligence and NLP (Natural Language Processing) allows automatic extraction of knowledge in this huge volume of information, including social sentiment on various subjects. The extracted knowledge can be used to understand and anticipate expectations of facts, people, goods and services. This interdisciplinary research involving Linguistics, Computing and Social Sciences aims automatic emotion detection of the messages and entities mentioned in Facebook and Twitter texts in the field of drought in the state of São Paulo during the years 2013, 2014 and 2015. The automatic emotion detecting method uses PLN concepts, as well as statistical methods for discovering patterns. It is not restricted to the field of dry and can be studied for application in other areas. For definition and application of the method were used various computational tools.
|
13 |
Análise de sentimento e desambiguação no contexto da tv socialLima, Ana Carolina Espírito Santo 14 December 2012 (has links)
Made available in DSpace on 2016-03-15T19:37:43Z (GMT). No. of bitstreams: 1
Ana Carolina Espirito Santo Lima.pdf: 2485278 bytes, checksum: 9843b9f756f82c023af6a2ee291f2b1d (MD5)
Previous issue date: 2012-12-14 / Fundação de Amparo a Pesquisa do Estado de São Paulo / Social media have become a way of expressing collective interests. People are motivated by the sharing of information and the feedback from friends and colleagues. Among the many social media tools available, the Twitter microblog is gaining popularity as a platform for in-stantaneous communication. Millions of messages are generated daily, from over 100 million users, about the most varied subjects. As it is a rapid communication platform, this microblog spurred a phenomenon called television storytellers, where surfers comment on what they watch on TV while the programs are being transmitted. The Social TV emerged from this integration between social media and television. The amount of data generated on the TV shows is a rich material for data analysis. Broadcasters may use such information to improve their programs and increase interaction with their audience. Among the main challenges in social media data analysis there is sentiment analysis (to determine the polarity of a text, for instance, positive or negative), and sense disambiguation (to determine the right context of polysemic words). This dissertation aims to use machine learning techniques to create a tool to support Social TV, contributing specifically to the automation of sentiment analysis and disambiguation of Twitter messages. / As mídias sociais são uma forma de expressão dos interesses coletivos, as pessoas gostam de compartilhar informações e sentem-se valorizadas por causa disso. Entre as mídias sociais o microblog Twitter vem ganhando popularidade como uma plataforma para comunicação ins-tantânea. São milhões de mensagens geradas todos os dias, por cerca de 100 milhões de usuá-rios, carregadas dos mais diversos assuntos. Por ser uma plataforma de comunicação rápida esse microblog estimulou um fenômeno denominado narradores televisivos, em que os inter-nautas comentam sobre o que assistem na TV no momento em que é transmitido. Dessa inte-gração entre as mídias sociais e a televisão emergiu a TV Social. A quantidade de dados gera-dos sobre os programas de TV formam um rico material para análise de dados. Emissoras podem usar tais informações para aperfeiçoar seus programas e aumentar a interação com seu público. Dentre os principais desafios da análise de dados de mídias sociais encontram-se a análise de sentimento (determinação de polaridade em um texto, por exemplo, positivo ou negativo) e a desambiguação de sentido (determinação do contexto correto de palavras polis-sêmicas). Essa dissertação tem como objetivo usar técnicas de aprendizagem de máquina para a criação de uma ferramenta de apoio à TV Social com contribuições na automatização dos processos de análise de sentimento e desambiguação de sentido de mensagens postadas no Twitter.
|
14 |
Um modelo para predição de bolsa de valores baseado em mineração de opiniãoLima, Milson Louseiro 06 May 2016 (has links)
Made available in DSpace on 2016-08-17T14:52:40Z (GMT). No. of bitstreams: 1
Dissertacao_MilsonLouseiroLima.pdf: 4206975 bytes, checksum: 68293f1f1c80ce84d0573111677ff097 (MD5)
Previous issue date: 2016-05-06 / FUNDAÇÃO DE AMPARO À PESQUISA E AO DESENVOLVIMENTO CIENTIFICO E TECNOLÓGICO DO MARANHÃO / Predicting the behavior of stocks in the stock market is a challenging task, a lot of times related to unknown factors or influenced by very distinct natures of variables, which can range from high-profile news to the collective sentiment, expressed in publications on social networks. Such market volatility may represent considerable financial losses for investors. In order to forestall such variations other mechanisms to predict the behavior of assets in the stock market have been proposed, based on pre-existing indicator data. Such mechanisms only analyze statistical data, not considering the collective human sentiment. This work aims to develop a model to predict the stock market, based on analysis of sentiment and it will make use of techniques of artificial intelligence as natural language processing (PLN) and Support Vector Machines (SVM) to predict the active behavior. However, it should be emphasized that this model is intended to be an aid tool in the decision-making process that involves buying and selling shares on the stock market. / Predizer o comportamento das ações na bolsa de valores é uma tarefa desafiadora, muita vezes relacionada a fatores desconhecidos ou influenciados por variáveis de naturezas bem distintas, que podem ir desde notícias de grande repercussão até o sentimento coletivo, expresso em publicações de redes sociais. Tal volatilidade do mercado pode representar perdas financeiras consideráveis para os investidores. No intuito de se antecipar a tais variações já foram propostos outros mecanismos para predizer o comportamento de ativos na bolsa de valores, baseados em dados de indicadores pré-existentes. Tais mecanismos analisam apenas dados estatísticos, não considerando o sentimento humano coletivo. Este trabalho tem como finalidade desenvolver um modelo para predição da bolsa de valores, baseado na mineração de opinião e, para isso, fará uso de técnicas de Inteligência artificial como processamento de linguagem natural(PLN) e Máquinas de Vetor de Suporte(SVM) para predizer o comportamento do ativo. No entanto, convém ressaltar que o referido modelo tem como finalidade ser uma ferramenta de auxílio no processo de tomada de decisão que envolve a compra e venda de ações na bolsa de valores.
|
15 |
Filtragem baseada em conteúdo auxiliada por métodos de indexação colaborativa / Content-based filtering aided by collaborative indexing methodsRafael Martins D\'Addio 10 June 2015 (has links)
Sistemas de recomendação surgiram da necessidade de selecionar e apresentar conteúdo relevante a usuários de acordo com suas preferências. Dentre os diversos métodos existentes, aqueles baseados em conteúdo faz em uso exclusivo da informação inerente aos itens. Estas informações podem ser criadas a partir de técnicas de indexação automática e manual. Enquanto que as abordagens automáticas necessitam de maiores recursos computacionais e são limitadas á tarefa específica que desempenham, os métodos manuais são caros e propensos a erros. Por outro lado, com a expansão da Web e a possibilidade de usuários comuns criarem novos conteúdos e anotações sobre diferentes itens e produtos, uma alternativa é obter esses metadados criados colaborativamente pelos próprios usuários. Entretanto, essas informações, em especial revisões e comentários, podem conter ruídos, além de estarem em uma forma desestruturada. Deste modo, este trabalho1 tem como objetivo desenvolver métodos de construção de representações de itens baseados em descrições colaborativas para um sistema de recomendação. Objetiva-se analisar o impacto que diferentes técnicas de extração de características, aliadas à análise de sentimento, causam na precisão da geração de sugestões, avaliando-se os resultados em dois cenários de recomendação: predição de notas e geração de ranques. Dentre as técnicas analisadas, observa-se que a melhor apresenta um ganho no poder descritivo dos itens, ocasionando uma melhora no sistema de recomendação. / Recommender systems arose from the need to select and present relevant content to users according to their preferences. Among several existent methods, those based on content make exclusive use of information inherent to the items. This information can be created through automatic and manual indexing techniques. While automa-tic approaches require greater computing resources and are limited to the specific task they perform, manual methods are expensive and prone to errors. On the other hand, with the expansion of theWeb and the possibility of common users to create new content and descriptions about different items and products, an alternative is to get these metadata created collaboratively by the users. However, this information, especially reviews and comments, may contain noise, be- sides being in a unstructured fashion. Thus, this study aims to develop methods for the construction of items representations based on collaborative descriptions for a recommender system. This study aims to analyze the impact that different feature extraction techniques, combined with sentiment analysis, caused in the accuracy of the generated suggestions, evaluating the results in both recommendations cenarios: rating prediction and ranking generation. Among the analyzed techniques, it is observed that the best is able to describe items in a more effcient manner, resulting in an improvement in the recommendation system.
|
16 |
Os efeitos das revisões críticas online sobre o mercado cinematográfico americano / The effects of online critical reviews over the American movie marketSouza, Thais Luiza Donega e 26 June 2017 (has links)
O mercado cinematográfico pode ser caracterizado como uma indústria de entretenimento com a produção de bens de informação que são também bens de experiência, cuja qualidade só é conhecida após o consumo. Deste modo, a revisão crítica se torna importante para induzir seu consumo, fornecendo previamente algum grau de informação sobre a qualidade do bem. Segue-se o trabalho de Reinstein e Snyder (2005) para determinar se as revisões críticas conduzidas por consumidores e por críticos profissionais online afetam o tempo de exibição de filmes no mercado americano de cinema, medido em quantidades de semanas, conforme modelos de duração/sobrevivência na literatura. Para esta finalidade foi gerado, a partir de sites de cinemas americanos (Box Office Mojo e Rotten Tomatoes), um banco de dados extremamente rico com informações semanais de todos os filmes disponíveis no cinema americano de 2004 a 2015. Especificamente, investigou-se os efeitos das revisões críticas de críticos profissionais de primeira linha (Tops) e de consumidores, conforme a média das notas atribuídas na semana de lançamento de cada filme. No que se refere à avaliação dos consumidores foi aplicada a computação afetiva, que reconhece o sentimento e a emoção em suas resenhas online para captar o efeito boca a boca potencializado pelas mídias sociais e fornecendo, portanto, uma análise mais profunda do boca a boca online. O estudo controla por possíveis problemas de endogeneidade decorrente de simultaneidade, usando as críticas somente antes e durante a semana de lançamento dos filmes. Os resultados sugerem que os críticos profissionais exercem grande influência no tempo de duração dos filmes em cartaz, bem como a positividade dos consumidores em relação ao filme. No entanto, o efeito dos críticos profissionais é em média 3 vezes maior do que dos consumidores. Adicionalmente, pode-se observar que algumas emoções afetam a expectativa de vida dos filmes a depender do gênero do mesmo / The movie market may be considered as entertainment industry, which produces experience goods that is also information goods, whose quality is only known only after consumption. Thus, critical reviews becomes important to induce consumption, since it provides some level of information about product quality. We follow Reinstein and Snyder (2005) works in order to determine if experts and consumers online critical reviews affect the survival time of movies at the American movie market, measured by number of weeks, according to survival analysis models in the literature. For this purpose, an extremely rich database with weekly information on all the films available in American cinema from 2004 to 2015 was generated from American movie sites (Box Office Mojo and Rotten Tomatoes). Specifically, we investigate the effects of critical reviews from top professionals and from consumers, according to the average ratings assigned in each movie\'s release week. As far as consumer assessment was concerned, affective computing was applied, which recognizes the sentiment (sentiment analysis) and emotion (emotion mining) in their online reviews to capture the word-of-mouth effect boosted by social media. The study controls for possible problems of endogeneity due to simultaneity, using the criticisms before and during the week of release of the films. The results suggest that the professional critics exert a great influence on the duration of the films in exhibition, as well as the positivity of the consumers in relation to the film. Thus, the effect of professionals are 5 times greater, generally, than the effect of the consumer critics. Additionally, it can be observed that some emotions affect movie life expectancy depending on the its genre
|
17 |
A semântica da emoção: um estudo contrastivo a partir da FrameNet e da roda das emoçõesFoschiera, Silvia Matturro Panzardi 31 July 2012 (has links)
Submitted by Fabricia Fialho Reginato (fabriciar) on 2015-07-04T00:45:28Z
No. of bitstreams: 1
SilviaFoschiera.pdf: 3755161 bytes, checksum: 0f631548f2054c557658d1a50094a5ac (MD5) / Made available in DSpace on 2015-07-04T00:45:28Z (GMT). No. of bitstreams: 1
SilviaFoschiera.pdf: 3755161 bytes, checksum: 0f631548f2054c557658d1a50094a5ac (MD5)
Previous issue date: 2012-07-31 / Nenhuma / O objetivo principal desta investigação é verificar em que aspectos a Semântica de Frames (FILLMORE, 1982; 1985) e o modelo denominado Roda das Emoções (SCHERER, 2005) contribuem na relação entre a linguagem e o fenômeno da emoção, considerando os idiomas português e espanhol. A Semântica de Frames, perspectiva teórica vinculada à Linguística Cognitiva, fundamenta a análise semântica e sintática por meio de um estudo exploratório do maquinário da FrameNet (FILLMORE et al., 2003). Com base nesse arcabouço teórico, realizamos um levantamento dos frames e elementos de frame de verbos e adjetivos que descrevem a emoção, associando categorias semânticas e sintáticas. Verificamos, também, a possibilidade de mapear o holder e o tópico de opinião considerando o corpus de sentenças do Twitter. A segunda perspectiva teórica está relacionada à Psicologia Cognitiva, por meio do modelo denominado Roda das Emoções. Considerando os traços semânticos sugeridos nessa ferramenta, observa-se o quanto, levando em conta aplicações computacionais, ela vem enriquecer um estudo de Análise de Sentimento. A Roda das Emoções serve para identificar a polaridade das opiniões constantes por meio dos adjetivos nas sentenças da amostra. Os resultados evidenciam que as duas perspectivas se revelam produtivas para aplicações computacionais em Análise de Sentimento. / The main objective of this research is to ascertain which aspects of Frame Semantics (Fillmore, 1982; 1985) and the model called Wheel of Emotions (Scherer, 2005) contribute to the relationship between language and the phenomenon of emotion, in regards to the Portuguese and Spanish languages. Frame Semantics -a theoretical construct linked to cognitive linguistics- underlies the syntactic and semantic analysis by means of an exploratory study of the FrameNet database (Fillmore et al., 2003). Based on this theoretical framework, we conducted a survey of the frames and frame elements that describe emotions, attaching semantic and syntactic categories to them. We also contemplated the possibility of mapping the holder and the subject of opinion in the corpus of sentences from Twitter. The second theoretical perspective is related to cognitive psychology through the Wheel of Emotions. Considering the semantic aspects offered by this tool, it is observed to what extent –including computer applications- it enriches the study of Sentiment Analysis. The Wheel of Emotions helps to identify the polarity of opinions contained in the sample sentences. The results show that the two perspectives prove productive for computer applications in Sentiment Analysis.
|
18 |
Os efeitos das revisões críticas online sobre o mercado cinematográfico americano / The effects of online critical reviews over the American movie marketThais Luiza Donega e Souza 26 June 2017 (has links)
O mercado cinematográfico pode ser caracterizado como uma indústria de entretenimento com a produção de bens de informação que são também bens de experiência, cuja qualidade só é conhecida após o consumo. Deste modo, a revisão crítica se torna importante para induzir seu consumo, fornecendo previamente algum grau de informação sobre a qualidade do bem. Segue-se o trabalho de Reinstein e Snyder (2005) para determinar se as revisões críticas conduzidas por consumidores e por críticos profissionais online afetam o tempo de exibição de filmes no mercado americano de cinema, medido em quantidades de semanas, conforme modelos de duração/sobrevivência na literatura. Para esta finalidade foi gerado, a partir de sites de cinemas americanos (Box Office Mojo e Rotten Tomatoes), um banco de dados extremamente rico com informações semanais de todos os filmes disponíveis no cinema americano de 2004 a 2015. Especificamente, investigou-se os efeitos das revisões críticas de críticos profissionais de primeira linha (Tops) e de consumidores, conforme a média das notas atribuídas na semana de lançamento de cada filme. No que se refere à avaliação dos consumidores foi aplicada a computação afetiva, que reconhece o sentimento e a emoção em suas resenhas online para captar o efeito boca a boca potencializado pelas mídias sociais e fornecendo, portanto, uma análise mais profunda do boca a boca online. O estudo controla por possíveis problemas de endogeneidade decorrente de simultaneidade, usando as críticas somente antes e durante a semana de lançamento dos filmes. Os resultados sugerem que os críticos profissionais exercem grande influência no tempo de duração dos filmes em cartaz, bem como a positividade dos consumidores em relação ao filme. No entanto, o efeito dos críticos profissionais é em média 3 vezes maior do que dos consumidores. Adicionalmente, pode-se observar que algumas emoções afetam a expectativa de vida dos filmes a depender do gênero do mesmo / The movie market may be considered as entertainment industry, which produces experience goods that is also information goods, whose quality is only known only after consumption. Thus, critical reviews becomes important to induce consumption, since it provides some level of information about product quality. We follow Reinstein and Snyder (2005) works in order to determine if experts and consumers online critical reviews affect the survival time of movies at the American movie market, measured by number of weeks, according to survival analysis models in the literature. For this purpose, an extremely rich database with weekly information on all the films available in American cinema from 2004 to 2015 was generated from American movie sites (Box Office Mojo and Rotten Tomatoes). Specifically, we investigate the effects of critical reviews from top professionals and from consumers, according to the average ratings assigned in each movie\'s release week. As far as consumer assessment was concerned, affective computing was applied, which recognizes the sentiment (sentiment analysis) and emotion (emotion mining) in their online reviews to capture the word-of-mouth effect boosted by social media. The study controls for possible problems of endogeneity due to simultaneity, using the criticisms before and during the week of release of the films. The results suggest that the professional critics exert a great influence on the duration of the films in exhibition, as well as the positivity of the consumers in relation to the film. Thus, the effect of professionals are 5 times greater, generally, than the effect of the consumer critics. Additionally, it can be observed that some emotions affect movie life expectancy depending on the its genre
|
19 |
Máquinas de classificação para detectar polaridade de mensagens de texto em redes sociais / Sentiment analysis on social networks using ensemblesVon Lochter, Johannes 18 November 2015 (has links)
Submitted by Milena Rubi (milenarubi@ufscar.br) on 2016-10-17T13:16:57Z
No. of bitstreams: 1
LOCHTER_Johannes_2015.pdf: 611113 bytes, checksum: 55a3009a4bb5c0fe9f30edf98fe0bc77 (MD5) / Approved for entry into archive by Milena Rubi (milenarubi@ufscar.br) on 2016-10-17T13:17:13Z (GMT) No. of bitstreams: 1
LOCHTER_Johannes_2015.pdf: 611113 bytes, checksum: 55a3009a4bb5c0fe9f30edf98fe0bc77 (MD5) / Approved for entry into archive by Milena Rubi (milenarubi@ufscar.br) on 2016-10-17T13:17:24Z (GMT) No. of bitstreams: 1
LOCHTER_Johannes_2015.pdf: 611113 bytes, checksum: 55a3009a4bb5c0fe9f30edf98fe0bc77 (MD5) / Made available in DSpace on 2016-10-17T13:17:36Z (GMT). No. of bitstreams: 1
LOCHTER_Johannes_2015.pdf: 611113 bytes, checksum: 55a3009a4bb5c0fe9f30edf98fe0bc77 (MD5)
Previous issue date: 2015-11-18 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / The popularity of social networks have attracted attention of companies. The growing amount of connected users and messages posted per day make these environments fruitful to detect needs, tendencies, opinions, and other interesting information that can feed marketing and sales departments. However, the most social networks impose size limit to messages, which lead users to compact them by using abbreviations, slangs, and symbols. Recent works in literature have reported advances in minimizing the impact created by noisy messages in text categorization tasks by means of semantic dictionaries and ontology models. They are used to normalize and expand short and messy text messages before using them with a machine learning approach. In this way, we have proposed an ensemble of machine learning methods and natural language processing techniques to find the best way to combine text processing approaches with classification methods to automatically detect opinion in short english text messages. Our experiments were diligently designed to ensure statistically sound results, which indicate that the proposed system has achieved a performance higher than the individual established classifiers. / A popularidade das redes sociais tem atraído a atenção das empresas. O crescimento do número de usuários e das mensagens enviadas por dia transforma esse ambiente em uma rica fonte de informações para descoberta de necessidades, tendências, opiniões e outras informações que podem auxiliar departamentos de vendas e marketing. Contudo,a maioria das redes sociais impõe limite no tamanho das mensagens, o que leva os usuários a usarem abreviações e gírias para compactarem o texto. Trabalhos na literatura demonstraram avanço na minimização do impacto de mensagens ruidosas nas tarefas de categorização textual através da utilização de dicionários semânticos e modelos ontológicos. Com a aplicação destes, as amostras são normalizadas e expandidas antes de serem apresentadas aos métodos preditivos. Assim, nesta dissertação é proposto um comitê de máquinas de classificação utilizando técnicas de processamento de linguagem natural para detectar opiniões automaticamente em mensagens curtas de texto em inglês. Os resulta-dos apresentados foram validados estatisticamente e indicaram que o sistema proposto obteve capacidade preditiva superior aos métodos preditivos isolados.
|
Page generated in 0.0187 seconds