Return to search

Relevância da tradução de textos de português para inglês no processo de classificação binária de sentimento de postagens rápidas em redes sociais online.

Submitted by Kilvya Braga (kilvyabraga@hotmail.com) on 2018-05-15T12:03:49Z
No. of bitstreams: 1
EVELYN DE SOUZA FARIAS - DISSERTAÇÃO (PPGCC) 2016.pdf: 2171903 bytes, checksum: c6d0f3ccb5ecf6ba4f906222cd163982 (MD5) / Made available in DSpace on 2018-05-15T12:03:49Z (GMT). No. of bitstreams: 1
EVELYN DE SOUZA FARIAS - DISSERTAÇÃO (PPGCC) 2016.pdf: 2171903 bytes, checksum: c6d0f3ccb5ecf6ba4f906222cd163982 (MD5)
Previous issue date: 2016 / CNPq / A análise e mineração de opinião em dados de texto extraídos de redes sociais online tem ganhado bastante força nos últimos anos, tornando-se uma área muito pesquisada e difundida em todo o mundo. Entretanto, esses processos são dependentes do idioma dos dados escritos, sendo o inglês o mais estudado e, consequentemente, o idioma que abrange uma maior quantidade de técnicas e soluções. Nesse contexto, a obtenção de resultados globais nessas áreas de pesquisa torna-se bastante custosa em tempo, sendo assim, com o avanço dos tradutores automáticos de texto e a tradução de dados para o inglês ser utilizada por alguns autores, julgamos necessário analisar o impacto dessas traduções no processo de classificação de sentimento. Os experimentos realizados em nosso trabalho mostraram resultados satisfatórios em métricas de avaliação e comparados aos resultados obtidos em trabalhos de outros autores em experimentos semelhantes de tradução de dados de texto e classificação de polaridade de sentimento. Os sistemas de tradução automática utilizados em nosso trabalho apresentaram uma tendência de traduções equiparadamente eficientes, mostrando que esses sistemas evoluíram bastante nos últimos anos. Quanto à classificação de dados de texto traduzidos automaticamente podemos dizer que, a partir dos resultados obtidos, a tradução automática de texto pode apresentar bons resultados para alguns casos. Porém, há a necessidade de experimentação com volumes de dados de treino mais abrangentes nas duas línguas estudadas neste documento. / The sentiment analysis and opinion mining in text data extracted from online social media services has gained enough strength in recent years, making it an area very researched and disseminated worldwide. However, these processes are language dependent and the english language is the most studied one, covering a larger amount of techniques and solutions in the field. In this context, obtaining overall results in these research areas becomes quite time consuming, so with the advancement of automatic text translators and that data automatic translated to english is used by some authors, it is necessary to analyze the impact these automatic translations cost in a text classification process. The experiments performed in our study showed satisfactory results in evaluation metrics and compared to the results obtained in works by other authors in similar experiments using automatic translations of text data and sentiment polarity classification. The machine translation systems used in our study showed a trend of equally efficient translations, showing that these systems have evolved considerably in recent years. As for the automatically translated text data classification we can say that from the results obtained, automatic text translation can present good results in some scenarios and case studies. However, there is a need for experimentation with more comprehensive training data volumes in the two languages studied in this document.

Identiferoai:union.ndltd.org:IBICT/oai:localhost:riufcg/674
Date15 May 2018
CreatorsFARIAS, Evelyn de Souza.
ContributorsGOMES, Reinaldo., COSTA, Anderson.
PublisherUniversidade Federal de Campina Grande, PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO, UFCG, Brasil, Centro de Engenharia Elétrica e Informática - CEEI
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Biblioteca de Teses e Dissertações da UFCG, instname:Universidade Federal de Campina Grande, instacron:UFCG
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0022 seconds