Ingeniera Civil Industrial / El presente trabajo tiene como objetivo diseñar y construir una metodología para la creación de un lexicón de opinión en el que se identifique su polaridad, considerando las características del español de Chile y basado en comentarios de Twitter, aplicado al proyecto OpinionZoom . Es desarrollado dentro del proyecto OpinionZoom, plataforma de análisis de sentimientos e ironía a partir de la información textual en redes sociales para la caracterización de la demanda de productos y servicios , donde se presenta la problemática de no tener un lexicón de opinión apropiado para el análisis de sentimientos que se realiza.
La hipótesis de investigación de este trabajo postula que la construcción de un lexicón de opinión que considere las particularidades del español de Chile en Twitter mejora el desempeño de la herramienta OpinionZoom . Para comprobar esta hipótesis se ha utilizado una metodología basada en un corpus lingüístico para la generación de un lexicón de opinión.
Se construyó un corpus de tweets clasificados en positivos y negativos según los emoticones que presentan, luego se utilizó este corpus en la construcción del lexicón, utilizando la frecuencia de las palabras presentes en comentarios positivos y negativos y calculando su polaridad en base a la información mutua que se tiene, empleando el cálculo de PMI.
Para la validación del lexicón de opinión se midió el desempeño del sistema de análisis de opiniones con el lexicón de opinión actual, que presenta licencia sólo de uso académico, y con el lexicón de opinión construido en este trabajo. Comparando ambos desempeños, se observaron mejoras en cuanto a exactitud, precisión y exhaustividad para el sistema con el lexicón construido, por lo que la hipótesis planteada en este trabajo se comprueba.
En conclusión, la utilización de un lexicón de opinión que considere las características del español de Chile mejora el desempeño del sistema de análisis de opiniones de OpinionZoom , la utilización de emoticones para identificar la polaridad representa un indicador representativo en comentarios de Twitter, por lo que se puede ampliar la investigación utilizando emojis para la identificación de polaridad.
Identifer | oai:union.ndltd.org:UCHILE/oai:repositorio.uchile.cl:2250/139092 |
Date | January 2016 |
Creators | Hernández Muñoz, Natalia Paola |
Contributors | Velásquez Silva, Juan Domingo, Facultad de Ciencias Físicas y Matemáticas, Departamento de Ingeniería Industrial, Vildoso Castillo, Felipe, Moya Muñoz, Patricio |
Publisher | Universidad de Chile |
Source Sets | Universidad de Chile |
Language | Spanish |
Detected Language | Spanish |
Type | Tesis |
Rights | Atribución-NoComercial-SinDerivadas 3.0 Chile, http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ |
Page generated in 0.0025 seconds