La sindicación de contenidos en la Web permite la generación y distribución de contenidos a través de canales de información tales como blogs, medios de prensa o comunidades digitales. En la Web actual existen millones de estos canales, los cuales producen un flujo continuo de información actualizada: artículos de texto, fotografías, vídeos, etc. Los canales constantemente publican resúmenes de contenido en la forma de archivos de metadatos RSS o Atom, que son recolectados por agregadores de Internet o directamente por los consumidores finales.
En el presente proyecto se propone el desarrollo de un sistema de segmentación de artículos RSS, utilizando técnicas de clustering de documentos de manera de agrupar y reconocer los tópicos más relevantes y visualizar los resultados de aplicar el sistema sobre la Web chilena, a través del portal orbitando.com
Identifer | oai:union.ndltd.org:UCHILE/oai:repositorio.uchile.cl:2250/104601 |
Date | January 2007 |
Creators | Gómez Martínez, Daniel Alejandro Arturo |
Contributors | Hurtado Larraín, Carlos, Facultad de Ciencias Físicas y Matemáticas, Departamento de Ciencias de la Computación, Gutiérrez Gallardo, Claudio, González González, Dionisio |
Publisher | Universidad de Chile |
Source Sets | Universidad de Chile |
Language | Spanish |
Detected Language | Spanish |
Type | Tesis |
Rights | Attribution-NonCommercial-NoDerivs 3.0 Chile, http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ |
Page generated in 0.0017 seconds