Return to search

Herramienta de análisis y clasificación de complejidad de textos en español

La selección de textos es una de las responsabilidades principales de los profesores
dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a
la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea
demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un
problema, sobre el cual proponemos una alternativa de automatización.
Se toma como proyecto la implementación de una herramienta de análisis y
clasificación de complejidad de tetos en español. Con ello se busca brindar una
alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto
se refiere a la necesidad de tener un orden de textos evaluados por complejidad.
Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al
español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios
de coherencia y cohesión que los autores de Coh-Metrix desarrollaron.
En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en
técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por
fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron
unidos en una herraamienta web para la accesibilidad pública de la herramienta
desarrollada. / Tesis

Identiferoai:union.ndltd.org:PUCP/oai:tesis.pucp.edu.pe:123456789/6042
Date04 June 2015
CreatorsPérez Urcia, Walter, Quispesaravia Ildefonso, André Raúl
ContributorsAlva Manchego, Fernando Emilio
PublisherPontificia Universidad Católica del Perú
Source SetsPontificia Universidad Católica del Perú
LanguageSpanish
Detected LanguageSpanish
Typeinfo:eu-repo/semantics/bachelorThesis
Formatapplication/pdf, application/pdf
SourcePontificia Universidad Católica del Perú, Repositorio de Tesis - PUCP
RightsAtribución-NoComercial-SinDerivadas 2.5 Perú, info:eu-repo/semantics/openAccess, http://creativecommons.org/licenses/by-nc-nd/2.5/pe/

Page generated in 0.0019 seconds