Spelling suggestions: "subject:"extracting target entities"" "subject:"detracting target entities""
1 |
Recognition and Linking of Product Mentions in User-generated ContentsVieira, Henry Silva, +55-92-98165-9404 25 September 2018 (has links)
Submitted by Henry Silva Vieira (henry@icomp.ufam.edu.br) on 2018-10-15T15:55:24Z
No. of bitstreams: 3
tese-henry-vieira.pdf: 1191114 bytes, checksum: b10400a0fae82d5f844e9bb1c5ec4519 (MD5)
folha-de-aprovacao.pdf: 315239 bytes, checksum: b497a7ed9186152c12bd92a9cc4c206e (MD5)
ata-de-defesa.pdf: 482952 bytes, checksum: 62340b99b961e7b1d17cdbf1ae2621a2 (MD5) / Approved for entry into archive by Secretaria PPGI (secretariappgi@icomp.ufam.edu.br) on 2018-10-15T18:52:47Z (GMT) No. of bitstreams: 3
tese-henry-vieira.pdf: 1191114 bytes, checksum: b10400a0fae82d5f844e9bb1c5ec4519 (MD5)
folha-de-aprovacao.pdf: 315239 bytes, checksum: b497a7ed9186152c12bd92a9cc4c206e (MD5)
ata-de-defesa.pdf: 482952 bytes, checksum: 62340b99b961e7b1d17cdbf1ae2621a2 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2018-10-16T17:41:31Z (GMT) No. of bitstreams: 3
tese-henry-vieira.pdf: 1191114 bytes, checksum: b10400a0fae82d5f844e9bb1c5ec4519 (MD5)
folha-de-aprovacao.pdf: 315239 bytes, checksum: b497a7ed9186152c12bd92a9cc4c206e (MD5)
ata-de-defesa.pdf: 482952 bytes, checksum: 62340b99b961e7b1d17cdbf1ae2621a2 (MD5) / Made available in DSpace on 2018-10-16T17:41:31Z (GMT). No. of bitstreams: 3
tese-henry-vieira.pdf: 1191114 bytes, checksum: b10400a0fae82d5f844e9bb1c5ec4519 (MD5)
folha-de-aprovacao.pdf: 315239 bytes, checksum: b497a7ed9186152c12bd92a9cc4c206e (MD5)
ata-de-defesa.pdf: 482952 bytes, checksum: 62340b99b961e7b1d17cdbf1ae2621a2 (MD5)
Previous issue date: 2018-09-25 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / FAPEAM - Fundação de Amparo à Pesquisa do Estado do Amazonas / A mídia social online tornou-se uma parte essencial de nossa vida diária. Por meio dessas mídias, os usuários trocam informações que geram usando diversos mecanismos de comunicação. Nesse contexto, mais e mais usuários transmitem e confiam em informações publicadas por outros usuários sobre uma grande variedade de tópicos, incluindo opiniões e informações sobre produtos. A extração e o processamento automáticos de informações geradas pelo usuário nas mídias sociais podem fornecer informações e conhecimento relevantes para uma variedade de aplicativos interessantes. Em particular, uma das técnicas de análise de conteúdo mais aplicadas às mídias sociais é a de mineração de opinião. Uma das tarefas básicas associadas à mineração de opinião é extrair e categorizar as entidades de destino, ou seja, identificar as menções de entidade no texto e vincular essas menções de entidade a entidades do mundo real sobre as quais as opiniões são feitas. Em nosso trabalho, nos concentramos em entidades-alvo de um tipo específico e atualmente relevante: produtos eletrônicos de consumo. Tais produtos são o principal assunto de opiniões postadas pelos usuários em várias postagens em fóruns de discussão e sites de varejo na Web. Neste trabalho, estamos interessados em usar o conteúdo textual não estruturado gerado por usuários de mídia social para permitir continuamente enriquecer o conhecimento sobre produtos representados em catálogos de produtos. Portanto, a tarefa que abordamos aqui é como reconhecer e vincular menções a produtos em conteúdo textual gerado pelo usuário para o produto, de um catálogo, ao qual eles se referem. Afirmamos que duas sub-tarefas básicas surgem: primeiro, a extração de entidades alvo mencionada em conteúdo textual não-estruturado; segundo, a desambiguação de entidades extraídas, isto é, ligação menções extraídas à sua contraparte do mundo real. Neste trabalho, desenvolvemos métodos para abordar essas duas subtarefas. Esta tese detalha essas tarefas, discute nossas ideias para os métodos que desenvolvemos e apresenta nossas contribuições e resultados para esse objetivo. / Online social media has grown into an essential part of our daily life. Through these media, users exchange information that they generate by using many different communication mechanisms. In this context, more and more users pass on and trust information published by other users on a large variety of topics, including opinion and information about products. Automatically extracting and processing user-generated information in social media can provide relevant information and knowledge to a variety of interesting applications. In particular, one of the content analysis techniques most often applied to social media is that of opinion mining. One of the basic tasks associated with opinion mining is extracting and categorizing target entities, i.e., identifying entity mentions in text, and linking these entity mentions to unique real world entities about which the opinions are made. In our work, we focus on target entities of a specific, and currently relevant, type: consumer electronic products. Such products are the main subject of opinions posted by users on a number of posts in discussion forums and retail sites over the Web. In this work, we are interested in using the unstructured textual content generated by social media users to continuously allow enriching the knowledge about products represented in product catalogs. Therefore, the task we address here is how to recognize and link mentions to products in user generated textual content to the product, from a catalog, they refer to. We claim that two basic sub-tasks arise: first, extraction of target entities mentions from unstructured textual content; second, disambiguation of extracted entities, i.e., linking extracted mentions to their real world counterpart. In this work, we developed methods to address these two sub-tasks. This thesis details these tasks, discusses our ideas for the methods we developed, and presents our contributions and results towards this goal. / Não tive dificuldades, tudo funcionou corretamente.
|
Page generated in 0.1278 seconds