Return to search

Identificación de contenido multimedia relevante a partir de eventos utilizando su información social

Ingeniero Civil en Computación / Este trabajo consistió en el diseño e implementación de una metodología para la generación
automática de resúmenes de eventos a partir de documentos de contenido tanto textual como
multimedial. La medida de relevancia para la extracción de documentos representativos en el
proceso de la generación de resúmenes consideró la inclusión de indicadores sociales, es decir, se
consideran más importantes los documentos con mayor impacto en medios sociales, tal como las
redes sociales online.
El problema central fue la generación de resúmenes de eventos bien definidos, es decir, no
se consideró el problema de identificación de eventos en medios sociales. Para este trabajo, un
evento se define como un acontecimiento que genera actividad en medios sociales. El resumen de
un evento se construye principalmente a partir de una selección de documentos descriptivos que
son publicados en los medios sociales en torno al evento en cuestión.
Se utilizó una estrategia de clustering particional para la identificación de subtópicos de cada
evento, y una estrategia simple para ponderar la relevancia de cada documento. Al no considerar
el contenido de los documentos, éstos pueden ser de tipo textual o multimedial, pudiendo generar
resúmenes multimedia o visuales. Este tipo de trabajo no ha sido profundamente estudiado en las
áreas de investigación relacionadas a la fecha de esta memoria.
Se utilizaron los servicios de Google News y Last.fm para la obtención de eventos noticiosos
y musicales, respectivamente. Además, se utilizó la red social Twier para el enriquecimiento y
generación de documentos con información social. Se utilizó el algoritmo de clustering K-means
para la identificación de subtópicos mediante una representación adecuada de los documentos
que no considerara su contenido, de forma de generar un resumen visual de cada evento, y una
estrategia simple para ordenar los resultados de acuerdo a relevancia de acuerdo a determinados
indicadores sociales de los documentos.
La metodología fue evaluada sobre distintos eventos, tanto noticiosos como musicales, a partir
de los cuales se generaron resúmenes multimediales automáticamente. También se analizaron
casos puntuales manualmente, previa determinación de parámetros adecuados. Los resultados
obtenidos indicaron que la calidad de los resultados no depende directamente de la cantidad de
documentos utilizados, y que los indicadores sociales utilizados pueden ser calibrados para entregar
más resultados relevantes. La metodología diseñada fue adecuada para alcanzar el objetivo
principal, y puede ser mejorada en muchas aristas tanto en diseño como en implementación en el
futuro.

Identiferoai:union.ndltd.org:UCHILE/oai:repositorio.uchile.cl:2250/113482
Date January 2013
CreatorsQuezada Veas, Mauricio Daniel
ContributorsPoblete Lara, Barbara, Facultad de Ciencias Físicas y Matemáticas, Departamento de Ciencias de la Computación, Ochoa Delorenzi, Sergio, Marín Caihuan, Juan
PublisherUniversidad de Chile
Source SetsUniversidad de Chile
LanguageSpanish
Detected LanguageSpanish
TypeTesis

Page generated in 0.002 seconds