Return to search

Learning to rank social knowledge for question answering in streaming platforms

Tesis para optar al grado de Doctor en Ciencias, Mención Computación / Las plataformas de redes sociales han cambiado la forma de buscar y encontrar información en la web. En particular, los sitios de Preguntas y Respuestas (QA: Question Answering) han surgido como plataformas diseñadas específicamente para el intercambio de preguntas y respuestas entre las comunidades de usuarios. Si bien los usuarios tienden a encontrar respuestas de buena calidad en estos sitios, hay evidencia de que existe un volumen significativo de interacciones QA en plataformas sociales como Twitter. La literatura al día de hoy indica que los usuarios eligen este tipo de plataformas, no especializadas para QA, dado que contienen información actualizada de eventos recientes, por la rapidez en la propagación de la información y además por la confianza social (con el círculo cercano).
A pesar del potencial que tiene la información de las redes sociales para tareas de QA, no es sencillo utilizarla través de la aplicación de técnicas ya existentes basadas en sitios tradicionales de QA. Existen características únicas que diferencian el contenido social de las plataformas tradicionales de QA, por ejemplo; el tamaño de los mensajes suele ser corto y sin mucho contenido, por lo tanto no es simple determinar la calidad del mismo. Además el contenido es más propenso a ser ruidoso, irrelevante o por debajo del estándar. Lo anterior, en combinación con la alta cantidad de información que se genera en cada instante, constituye una sobrecarga de información que es compleja de extraer y estructurar para tareas de QA.
En esta tesis, estudiamos el potencial que tienen las plataformas de microblogs para tareas de QA. Además estudiamos las características que poseen las respuestas más relevantes dada una pregunta inicial. En particular, creamos un modelo de documento a nivel de hilos de conversación en microblogs que nos permitió agregar información de contenido y entrenar un modelo de ranking basado en preguntas y respuestas de tipo factoid. Nuestros resultados experimentales, llevados a cabo en Twitter, nos indican que esta plataforma social sí provee de información valiosa para tareas de QA. Además identificamos las principales características de contenido y sociales (y la combinación entre ellas) que permiten obtener respuestas relevantes. El modelo consigue una mejora de alrededor de un 62% con respecto al método base empleado. De hecho, empleando el mismo modelo ya entrenado y la técnica de Transfer Learning, fuimos capaces de responder preguntas más complejas de tipo non-factoid capturadas directamente de Twitter. / CONICYT, INSTITUTO MILENIO FUNDAMENTOS DE LOS DATOS

Identiferoai:union.ndltd.org:UCHILE/oai:repositorio.uchile.cl:2250/170922
Date January 2019
CreatorsHerrera Maldonado, José Miguel
ContributorsPoblete Labra, Barbara, Parra Santander, Denis, Hogan, Aidan, Mendoza Rocha, Marcelo, Lalmas, Mounia
PublisherUniversidad de Chile
Source SetsUniversidad de Chile
LanguageEnglish
Detected LanguageSpanish
TypeTesis
RightsAttribution-NonCommercial-NoDerivs 3.0 Chile, http://creativecommons.org/licenses/by-nc-nd/3.0/cl/

Page generated in 0.0015 seconds