Spelling suggestions: "subject:"classificação dde sentimentos"" "subject:"classificação dde sentiment""
1 |
PairClassif - Um Método para Classificação de Sentimentos Baseado em ParesSILVA, Nelson Gutemberg Rocha da 28 January 2013 (has links)
Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-09T13:49:25Z
No. of bitstreams: 2
dissertacao_nelson.pdf: 1959923 bytes, checksum: ebe6bba80aefc9ee445580dddc4e9fd1 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T13:49:25Z (GMT). No. of bitstreams: 2
dissertacao_nelson.pdf: 1959923 bytes, checksum: ebe6bba80aefc9ee445580dddc4e9fd1 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-01-28 / Na última década, a Internet tem crescido de forma surpreendente, tornando-se uma das maiores bases de informações do mundo. Com o surgimento e o rápido cresci-mento de Blogs, Fóruns e Redes Sociais, milhões de usuários tornam públicas suas opi-niões sobre os mais diversos assuntos.
Esse tipo de informação é de grande auxílio para pessoas e empresas na hora de tomar uma decisão. Contudo, toda essa informação está dispersa na Web, em formato livre, tornando impraticável a análise manual dessas opiniões com o objetivo de se obter o “sentimento geral” acerca de um produto ou serviço. Automatizar essa tarefa é a me-lhor alternativa. Porém, interpretar textos em formato livre não é uma tarefa trivial para o computador, devido às irregularidades e à ambiguidade inerentes às línguas naturais.
Nesse contexto, estão surgindo sistemas que tratam as opiniões de forma auto-mática utilizando-se dos conceitos da área de Análise de Sentimentos (AS), também conhecido por Mineração de Opinião. A AS se preocupa em classificar opiniões expres-sas em textos, com respeito a um determinado produto ou serviço, como positivas ou negativas.
Muitos trabalhos foram propostos na área de Análise Sentimentos, porém, a maioria destes provê uma avaliação global para o sentimento expresso no texto. O Tra-balho aqui proposto busca realizar uma análise mais refinada, que é conhecida como Classificação em Nível de Característica. Nesse nível busca-se classificar a polaridade das opiniões sobre cada característica do objeto sendo monitorado.
O processo proposto classifica pares (característica, palavra opinativa), uma vez que alguns adjetivos mudam de polaridade a depender do substantivo que eles qua-lificam (e.g., “cerveja quente”, “pizza quente”). Utilizamos aqui técnicas baseadas em Estatística e Linguística, com apoio da ferramenta SentiWordNet [ESULI & SEBASTI-ANI, 2006]. Resultados experimentais mostraram que o processo tem alta eficácia, su-perando outros métodos existentes.
|
2 |
Uma abordagem não supervisionada para classificação de opinião usando o recurso léxico SentiWordNetCAVALCANTI, Diana Cabral 31 January 2011 (has links)
Made available in DSpace on 2014-06-12T15:49:49Z (GMT). No. of bitstreams: 2
arquivo1261_1.pdf: 2414749 bytes, checksum: c01ef58dbd0f4ac1de0693518c0b51f4 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2011 / Mineração de Opinião, também chamada de Análise de Sentimento, explora o estudo computacional de opiniões, sentimentos e emoções expressadas em fontes como textos não estruturados. Com a crescente popularidade e disponibilidade de recursos para se veicular opiniões na Web, os internautas passaram a ser não só um mero consumidor de um produto já pronto, mas também um gerador de conteúdo na Web. A classificação de sentimento tem o desafio de automatizar a análise de opiniões na Web, a fim de colaborar na forma como as pessoas podem, fazem e usam ativamente as tecnologias de informação para buscar e compreender as opiniões dos outros. Diversas pesquisas têm explorado métodos supervisionados e não supervisionados para classificação de sentimento que abrangem técnicas de processamento de linguagem natural, recuperação da informação e recursos léxicos. Este trabalho propõe o uso do recurso Léxico SentiWordNet, com um método não supervisionado, que realiza a seleção de termos unigrama nas classes gramaticais adjetivo, advérbio, substantivo e verbo, para classificar a polaridade, se negativa, positiva ou neutra, de termos e documentos. A fim de avaliar o desempenho do método, experimentos foram realizados em duas bases de dados, que abrangem comentários extraídos do Amazon.com e citações em artigos científicos. Os resultados obtidos experimentalmente mostraram que o SentiWordNet atingiu uma média de 76% para o total de termos distintos extraídos, a maior taxa de acerto global foi 58% para a base de documentos do Amazon.com e 18.83% para a base de artigos científicos
|
3 |
Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais online.FARIAS, Evelyn de Souza. 15 May 2018 (has links)
Submitted by Kilvya Braga (kilvyabraga@hotmail.com) on 2018-05-15T12:03:49Z
No. of bitstreams: 1
EVELYN DE SOUZA FARIAS - DISSERTAÇÃO (PPGCC) 2016.pdf: 2171903 bytes, checksum: c6d0f3ccb5ecf6ba4f906222cd163982 (MD5) / Made available in DSpace on 2018-05-15T12:03:49Z (GMT). No. of bitstreams: 1
EVELYN DE SOUZA FARIAS - DISSERTAÇÃO (PPGCC) 2016.pdf: 2171903 bytes, checksum: c6d0f3ccb5ecf6ba4f906222cd163982 (MD5)
Previous issue date: 2016 / CNPq / A análise e mineração de opinião em dados de texto extraídos de redes sociais online tem ganhado bastante força nos últimos anos, tornando-se uma área muito pesquisada e difundida em todo o mundo. Entretanto, esses processos são dependentes do idioma dos dados escritos, sendo o inglês o mais estudado e, consequentemente, o idioma que abrange uma maior quantidade de técnicas e soluções. Nesse contexto, a obtenção de resultados globais nessas áreas de pesquisa torna-se bastante custosa em tempo, sendo assim, com o avanço dos tradutores automáticos de texto e a tradução de dados para o inglês ser utilizada por alguns autores, julgamos necessário analisar o impacto dessas traduções no processo de classificação de sentimento. Os experimentos realizados em nosso trabalho mostraram resultados satisfatórios em métricas de avaliação e comparados aos resultados obtidos em trabalhos de outros autores em experimentos semelhantes de tradução de dados de texto e classificação de polaridade de sentimento. Os sistemas de tradução automática utilizados em nosso trabalho apresentaram uma tendência de traduções equiparadamente eficientes, mostrando que esses sistemas evoluíram bastante nos últimos anos. Quanto à classificação de dados de texto traduzidos automaticamente podemos dizer que, a partir dos resultados obtidos, a tradução automática de texto pode apresentar bons resultados para alguns casos. Porém, há a necessidade de experimentação com volumes de dados de treino mais abrangentes nas duas línguas estudadas neste documento. / The sentiment analysis and opinion mining in text data extracted from online social media services has gained enough strength in recent years, making it an area very researched and disseminated worldwide. However, these processes are language dependent and the english language is the most studied one, covering a larger amount of techniques and solutions in the field. In this context, obtaining overall results in these research areas becomes quite time consuming, so with the advancement of automatic text translators and that data automatic translated to english is used by some authors, it is necessary to analyze the impact these automatic translations cost in a text classification process. The experiments performed in our study showed satisfactory results in evaluation metrics and compared to the results obtained in works by other authors in similar experiments using automatic translations of text data and sentiment polarity classification. The machine translation systems used in our study showed a trend of equally efficient translations, showing that these systems have evolved considerably in recent years. As for the automatically translated text data classification we can say that from the results obtained, automatic text translation can present good results in some scenarios and case studies. However, there is a need for experimentation with more comprehensive training data volumes in the two languages studied in this document.
|
4 |
Modelos de tópicos na classificação automática de resenhas de usuários. / Topic models in user review automatic classification.Mauá, Denis Deratani 14 August 2009 (has links)
Existe um grande número de resenhas de usuário na internet contendo valiosas informações sobre serviços, produtos, política e tendências. A compreensão automática dessas opiniões é não somente cientificamente interessante, mas potencialmente lucrativa. A tarefa de classificação de sentimentos visa a extração automática das opiniões expressas em documentos de texto. Diferentemente da tarefa mais tradicional de categorização de textos, na qual documentos são classificados em assuntos como esportes, economia e turismo, a classificação de sentimentos consiste em anotar documentos com os sentimentos expressos no texto. Se comparados aos classificadores tradicionais, os classificadores de sentimentos possuem um desempenho insatisfatório. Uma das possíveis causas do baixo desempenho é a ausência de representações adequadas que permitam a discriminação das opiniões expressas de uma forma concisa e própria para o processamento de máquina. Modelos de tópicos são modelos estatísticos que buscam extrair informações semânticas ocultas na grande quantidade de dados presente em coleções de texto. Eles representam um documento como uma mistura de tópicos, onde cada tópico é uma distribuição de probabilidades sobre palavras. Cada distribuição representa um conceito semântico implícito nos dados. Modelos de tópicos, as palavras são substituídas por tópicos que representam seu significado de forma sucinta. De fato, os modelos de tópicos realizam uma redução de dimensionalidade nos dados que pode levar a um aumento do desempenho das técnicas de categorização de texto e recuperação de informação. Na classificação de sentimentos, eles podem fornecer a representação necessária através da extração de tópicos que representem os sentimentos expressos no texto. Este trabalho dedica-se ao estudo da aplicação de modelos de tópicos na representação e classificação de sentimentos de resenhas de usuário. Em particular, o modelo Latent Dirichlet Allocation (LDA) e quatro extensões (duas delas desenvolvidas pelo autor) são avaliados na tarefa de classificação de sentimentos baseada em múltiplos aspectos. As extensões ao modelo LDA permitem uma investigação dos efeitos da incorporação de informações adicionais como contexto, avaliações de aspecto e avaliações de múltiplos aspectos no modelo original. / There is a large number of user reviews on the internet with valuable information on services, products, politics and trends. There is both scientific and economic interest in the automatic understanding of such data. Sentiment classification is concerned with automatic extraction of opinions expressed in user reviews. Unlike standard text categorization tasks that deal with the classification of documents into subjects such as sports, economics and tourism, sentiment classification attempts to tag documents with respect to the feelings they express. Compared to the accuracy of standard methods, sentiment classifiers have shown poor performance. One possible cause of such a poor performance is the lack of adequate representations that lead to opinion discrimination in a concise and machine-readable form. Topic Models are statistical models concerned with the extraction of semantic information hidden in the large number of data available in text collections. They represent a document as a mixture of topics, probability distributions over words that represent a semantic concept. According to Topic Model representation, words can be substituted by topics able to represent concisely its meaning. Indeed, Topic Models perform a data dimensionality reduction that can improve the performance of text classification and information retrieval techniques. In sentiment classification, they can provide the necessary representation by extracting topics that represent the general feelings expressed in text. This work presents a study of the use of Topic Models for representing and classifying user reviews with respect to their feelings. In particular, the Latent Dirichlet Allocation (LDA) model and four extensions (two of them developed by the author) are evaluated on the task of aspect-based sentiment classification. The extensions to the LDA model enables us to investigate the effects of the incorporation of additional information such as context, aspect rating and multiple aspect rating into the original model.
|
5 |
Modelos de tópicos na classificação automática de resenhas de usuários. / Topic models in user review automatic classification.Denis Deratani Mauá 14 August 2009 (has links)
Existe um grande número de resenhas de usuário na internet contendo valiosas informações sobre serviços, produtos, política e tendências. A compreensão automática dessas opiniões é não somente cientificamente interessante, mas potencialmente lucrativa. A tarefa de classificação de sentimentos visa a extração automática das opiniões expressas em documentos de texto. Diferentemente da tarefa mais tradicional de categorização de textos, na qual documentos são classificados em assuntos como esportes, economia e turismo, a classificação de sentimentos consiste em anotar documentos com os sentimentos expressos no texto. Se comparados aos classificadores tradicionais, os classificadores de sentimentos possuem um desempenho insatisfatório. Uma das possíveis causas do baixo desempenho é a ausência de representações adequadas que permitam a discriminação das opiniões expressas de uma forma concisa e própria para o processamento de máquina. Modelos de tópicos são modelos estatísticos que buscam extrair informações semânticas ocultas na grande quantidade de dados presente em coleções de texto. Eles representam um documento como uma mistura de tópicos, onde cada tópico é uma distribuição de probabilidades sobre palavras. Cada distribuição representa um conceito semântico implícito nos dados. Modelos de tópicos, as palavras são substituídas por tópicos que representam seu significado de forma sucinta. De fato, os modelos de tópicos realizam uma redução de dimensionalidade nos dados que pode levar a um aumento do desempenho das técnicas de categorização de texto e recuperação de informação. Na classificação de sentimentos, eles podem fornecer a representação necessária através da extração de tópicos que representem os sentimentos expressos no texto. Este trabalho dedica-se ao estudo da aplicação de modelos de tópicos na representação e classificação de sentimentos de resenhas de usuário. Em particular, o modelo Latent Dirichlet Allocation (LDA) e quatro extensões (duas delas desenvolvidas pelo autor) são avaliados na tarefa de classificação de sentimentos baseada em múltiplos aspectos. As extensões ao modelo LDA permitem uma investigação dos efeitos da incorporação de informações adicionais como contexto, avaliações de aspecto e avaliações de múltiplos aspectos no modelo original. / There is a large number of user reviews on the internet with valuable information on services, products, politics and trends. There is both scientific and economic interest in the automatic understanding of such data. Sentiment classification is concerned with automatic extraction of opinions expressed in user reviews. Unlike standard text categorization tasks that deal with the classification of documents into subjects such as sports, economics and tourism, sentiment classification attempts to tag documents with respect to the feelings they express. Compared to the accuracy of standard methods, sentiment classifiers have shown poor performance. One possible cause of such a poor performance is the lack of adequate representations that lead to opinion discrimination in a concise and machine-readable form. Topic Models are statistical models concerned with the extraction of semantic information hidden in the large number of data available in text collections. They represent a document as a mixture of topics, probability distributions over words that represent a semantic concept. According to Topic Model representation, words can be substituted by topics able to represent concisely its meaning. Indeed, Topic Models perform a data dimensionality reduction that can improve the performance of text classification and information retrieval techniques. In sentiment classification, they can provide the necessary representation by extracting topics that represent the general feelings expressed in text. This work presents a study of the use of Topic Models for representing and classifying user reviews with respect to their feelings. In particular, the Latent Dirichlet Allocation (LDA) model and four extensions (two of them developed by the author) are evaluated on the task of aspect-based sentiment classification. The extensions to the LDA model enables us to investigate the effects of the incorporation of additional information such as context, aspect rating and multiple aspect rating into the original model.
|
Page generated in 0.1418 seconds