Ingeniero Civil Industrial / El objetivo general de esta memoria de título es diseñar e implementar un sistema de User Interest Modeling, que sea capaz de identificar tópicos de interés de usuarios chilenos en Twitter. Este trabajo se desarrolla dentro del marco del proyecto OpinionZoom, que es un proyecto de I+D aplicada concursado por InnovaChile de CORFO y dirigido por el Web Intelligence Centre de la Universidad de Chile. El proyecto busca generar un sistema avanzado de análisis de datos extraídos desde redes sociales para obtener información relevante para las instituciones y empresas en relación a sus productos y servicios.
La información obtenida a partir de los usuarios en las redes sociales puede tener muchos usos. Uno de éstos es caracterizar a los usuarios e identificar sus tópicos de interés. Contar con esta información puede ayudar a las organizaciones a conocer mejor a sus clientes, lo que les permitiría tomar mejores decisiones. Los métodos más utilizados para identificar tópicos de interés en Twitter usan el contenido generado por el usuario a caracterizar, sin embargo este enfoque conlleva un problema: la gran mayoría de los usuarios no tweetea o lo hace muy poco. Esto significa que los métodos que utilizan este enfoque no podrán identificar los tópicos de muchos usuarios y varios tendrán resultados deficientes, por lo que se necesita un enfoque distinto.
La hipótesis de investigación de este trabajo dice que es posible obtener tópicos de interés de usuarios chilenos de Twitter a partir de sus conexiones en la red social y sin utilizar el contenido generado por ellos, es decir sin utilizar sus tweets.
El sistema desarrollado se basa en la metodología propuesta por Bhattacharya et al., pero enfocado en el Español para caracterizar de mejor forma a los usuarios chilenos. Este sistema utiliza la información de las listas de Twitter, para inferir los tópicos de influencia de usuarios populares de la red social, para luego inferir transitivamente los tópicos de interés de los usuarios que los siguen. Está compuesto de 4 módulos principales: el primero se encarga de extraer los datos de Twitter; el segundo procesa el texto de las listas e identifica los tópicos que las caracterizan; el tercero identifica los tópicos de influencia de los usuarios populares de Twitter; finalmente, el último módulo identifica los tópicos de interés agregando la información de los tópicos de influencia.
Se utilizó el sistema para identificar tópicos de interés de algunos usuarios de Twitter y se validó la hipótesis de investigación, ya que el 97% de los usuarios evaluados se consideró representado por los tópicos identificados. Con esto, se tiene un sistema capaz de identificar tópicos de interés en español de la gran mayoría de usuarios de Twitter, con alta precisión y mejores resultados que la situación actual.
Identifer | oai:union.ndltd.org:UCHILE/oai:repositorio.uchile.cl:2250/144085 |
Date | January 2016 |
Creators | Camino Alcalde, Sebastián Leonardo |
Contributors | Velásquez Silva, Juan, Vildoso Castillo, Felipe, Cabezas Bullemore, Alberto, Ruiz Moreno, Rocío |
Publisher | Universidad de Chile |
Source Sets | Universidad de Chile |
Language | Spanish |
Detected Language | Spanish |
Type | Tesis |
Rights | Attribution-NonCommercial-NoDerivs 3.0 Chile, http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ |
Page generated in 0.002 seconds