Spelling suggestions: "subject:"minería dde oso eeb"" "subject:"minería dde oso beb""
1 |
Extracción de información y conocimiento de las opiniones emitidas por usuarios de los sistemas WEB 2.0Dueñas Fernández, Rodrigo Alfonso January 2013 (has links)
Magíster en Gestión de Operaciones / Ingeniero Civil Industrial / El objetivo de este trabajo de tesis es desarrollar una plataforma informática Web Opinion Mining (WOM) para la extracción de información que permita caracterizar la demanda de productos y servicios de una empresa, a través del uso de documentos publicados en sitios de noticias y las opiniones consignadas por los usuarios de las redes sociales.
En la sociedad de hoy, gracias a la aparición de la Web, el panorama competitivo de las empresas se ha vuelto mucho más complejo, debido a la cantidad de mercados interconectados en tiempo real que tienen que considerar. Por lo tanto, para obtener rendimientos sobre el promedio en este medio, es necesario tener nuevas maneras de predecir las acciones de la competencia y la demanda por productos y servicios.
Debido a lo anterior, la necesidad de procesar grandes cantidades de datos para obtener información ha ido creciendo a lo largo de los años. A medida que la capacidad de una empresa de procesar los datos de su entorno aumenta y se vuelve capaz de tomar decisiones estratégicas en base a la información obtenida, obtiene ventajas competitivas que reditúan en rendimientos sobre el promedio.
En base a lo anterior, es que se plantea la siguiente hipótesis de investigación: Las opiniones de los usuarios sobre productos y servicios de un nicho de mercado particular consignadas en los sistemas Web 2.0, contienen la información necesaria y suficiente para caracterizar su demanda aproximada
Para probar esta hipótesis, se desarrollo una plataforma de detección de tendencias compuesta de tres módulos: minado de tópicos, minado de opiniones y visualización de tendencias. Debido a que esta plataforma tiene como objetivo apoyar la toma de decisiones de un grupo de expertos, es que se realizará el minado a partir de un conjunto predefinido de fuentes que describa el mercado que se quiere analizar.
El primer módulo se encarga de minar documentos de noticias y extraer qué tópicos están siendo publicados por semana. Una vez los tópicos de una semana son inferidos a través del uso del modelo de tópicos LDA, se generan queries para recuperar documentos opinados desde la red social Twitter, y se obtiene un puntaje de opinión para el tópico en particular durante esa semana. Una vez que se tiene información sobre un tópico por varios periodos, el módulo de visualización se encarga de entregar una representación gráfica de la evolución del tópico a lo largo del tiempo, tanto en documentos publicados como la opinión consignada por los usuarios en la Web 2.0.
Los resultados obtenidos por el módulo de minado de tópicos fue un precisión de 0.56, un recall de 0.52 y un F-Measure de 0.54. En el minado de opiniones se obtuvo un precisión de 0.6, 0.53 y 0.61 y un recall de 0.59, 0.49 y 0.58 para las polaridades positiva, neutra y negativa respectivamente. En el caso del modelo de tendencias, a medida que el umbral mínimo para considerar un evento como significativo aumenta, su precisión aumenta, llegando a una precisión de 0.61, recall de 0.51 y un F-Measure de 0.56.
Se concluye que el sistema propuesto para la representación de tendencias en la Web es un enfoque factible para modelar tendencias en la Web a través de la interacción de eventos, tópicos y opiniones consignadas en la Web 2.0. Por otro lado, los experimentos realizados comprueban la hipótesis planteada al inicio de este trabajo, ya que una vez toda la información es recolectada y analizada, es posible analizar el comportamiento de los tópicos a lo largo del tiempo, y ver como reaccionan los usuarios de la Web 2.0 y de manera indirecta caracterizar la demanda sobre ciertos productos y servicios.
|
2 |
Unsupervised Identification of the User’s Query Intent in Web SearchCalderón-Benavides, Liliana 27 September 2011 (has links)
This doctoral work focuses on identifying and understanding the intents that motivate a user to perform a search on the Web. To this end, we apply machine learning models that do not require more information than the one provided by the very needs of the users, which in this work are represented by their queries. The knowledge and interpretation of this invaluable information can help search engines to obtain resources especially relevant to users, and thus improve their satisfaction.
By means of unsupervised learning techniques, which have been selected according to the context of the problem being solved, we show that is not only possible to identify the user’s intents, but that this process can be conducted automatically.
The research conducted in this thesis has involved an evolutionary process that starts from the manual analysis of different sets of real user queries from a search engine. The work passes through the proposition of a new classification of user’s query intents; the application of different unsupervised learning techniques to identify those intents; up to determine that the user’s intents, rather than being considered as an uni–dimensional problem, should be conceived as a composition of several aspects, or dimensions (i.e., as a multi–dimensional problem), that contribute to clarify and to establish what the user’s intents are. Furthermore, from this last proposal, we have configured a framework for the on–line identification of the user’s query intent. Overall, the results from this research have shown to be effective for the problem of identifying user’s query intent. / Este trabajo doctoral se enfoca en identificar y entender las intenciones que motivan a los usuarios a realizar búsquedas en la Web a través de la aplicación de métodos de aprendizaje automático que no requieren datos adicionales más que las necesidades de información de los mismos usuarios, representadas a través de sus consultas. El conocimiento y la interpretación de esta información, de valor incalculable, puede ayudar a los sistemas de búsqueda Web a encontrar recursos particularmente relevantes y así mejorar la satisfacción de sus usuarios.
A través del uso de técnicas de aprendizaje no supervisado, las cuales han sido seleccionadas dependiendo del contexto del problema a solucionar, y cuyos resultados han demostrado ser efectivos para cada uno de los problemas planteados, a lo largo de este trabajo se muestra que no solo es posible identificar las intenciones de los usuarios, sino que este es un proceso que se puede llevar a cabo de manera automática.
La investigación desarrollada en esta tesis ha implicado un proceso evolutivo, el cual inicia con el análisis de la clasificación manual de diferentes conjuntos de consultas que usuarios reales han sometido a un motor de búsqueda. El trabajo pasa a través de la proposición de una nueva clasificación de las intenciones de consulta de usuarios, y el uso de diferentes técnicas de aprendizaje no supervisado para identificar dichas intenciones, llegando hasta establecer que éste no es un problema unidimensional, sino que debería ser considerado como un problema de múltiples dimensiones, donde cada una de dichas dimensiones, o facetas, contribuye a clarificar y establecer cuál es la intención del usuario. A partir de este último trabajo, hemos creado un modelo para la identificar la intención del usuario en un escenario on–line.
|
Page generated in 0.0953 seconds