Ingeniero Civil Industrial / El objetivo general de esta memoria de titulo es diseñar e integrar un módulo para detectar y categorizar opiniones de reclamos en un sistema de análisis web utilizando herramientas de Ma- chine Learning. Este trabajo se desarrolla dentro del marco del proyecto OpinionZoom, que es un proyecto de investigación y desarrollo concursado por InnovaChile de CORFO y dirigido por el Web Intelligence Centre (WIC) de la Universidad de Chile. Este proyecto busca aumentar el co- nocimiento que tienen las organizaciones sobre individuos pertenecientes a la industria que sirven, utilizando los datos públicos de los usuarios chilenos de Twitter.
En esta etapa de OpinionZoom surge la oportunidad de utilizar el contenido que los usuarios envían a las cuentas de Twitter de las empresas en referencia a los reclamos, cuyo interés nace de las entrevistas y requerimientos de los comienzos de este proyecto, en conjunto con el poco provecho que extraen las empresas de esta red social.
Esta memoria de título pretende comprobar la hipótesis de investigación de utilizar algoritmos de Data Mining y Machine Learning que permitan identificar opiniones de reclamos en Twitter y clasificarlas en categorías predefinidas. Lo que se divide en dos etapas, la primera consiste en identificar opiniones de reclamos en Twitter, algo que no ha sido investigado hasta el momento, y como segunda etapa categorizar el contenido de estos mensajes en función de los productos y servicios de las empresas. Para la validación de esta hipótesis se decidió por utilizar el segmento de mayor relevancia en términos de reclamos en la red social Twitter: Telecomunicaciones.
El potencial de lo desarrollado en este trabajo es entregar información útil a la empresas sobre los reclamos, a nivel agregado, que sus clientes y usuarios expresan en la red social de Twitter, de modo de que puedan tomar mejores decisiones.
Se utilizó un set de datos que abarcó toda la historia de cuatro cuentas de Twitter, cuya elección se basó en la relevancia en el ámbito de los reclamos en la red social. Los datos se modelaron con el enfoque Bag-Of-Words y se implementaron 4 algoritmos de Machine Learning para clasificar los tweets en una primera etapa dentro de 4 clases, incluida reclamo, y en una segunda etapa en 9 categorías predefinidas. Para la primera etapa el algoritmo Support Vector Machines entregó los mejores resultados con un F-Measure de 0.823 para la clase Reclamo. Y para la segunda etapa los mejores resultados se lograron en Support Vector Machines y Decision Trees con un accuracy de 81.3%. Lo que permite validar la hipótesis de investigación. Finalmente, se diseñó e implemento el módulo para detectar y categorizar reclamos en la plataforma web de OpinionZoom. / Este trabajo ha sido parcialmente financiado por el proyecto CORFO 13IDL2-23170
Identifer | oai:union.ndltd.org:UCHILE/oai:repositorio.uchile.cl:2250/147220 |
Date | January 2017 |
Creators | Aguilar Ruiz, Joaquín Esteban |
Contributors | Velásquez Silva, Juan, Calisto Leiva, Ignacio, Ruiz Moreno, Rocío |
Publisher | Universidad de Chile |
Source Sets | Universidad de Chile |
Language | Spanish |
Detected Language | Spanish |
Type | Tesis |
Rights | Attribution-NonCommercial-NoDerivs 3.0 Chile, http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ |
Page generated in 0.0023 seconds