La selección de textos es una de las responsabilidades principales de los profesores
dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a
la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea
demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un
problema, sobre el cual proponemos una alternativa de automatización.
Se toma como proyecto la implementación de una herramienta de análisis y
clasificación de complejidad de tetos en español. Con ello se busca brindar una
alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto
se refiere a la necesidad de tener un orden de textos evaluados por complejidad.
Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al
español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios
de coherencia y cohesión que los autores de Coh-Metrix desarrollaron.
En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en
técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por
fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron
unidos en una herraamienta web para la accesibilidad pública de la herramienta
desarrollada. / Tesis
Identifer | oai:union.ndltd.org:PUCP/oai:tesis.pucp.edu.pe:123456789/6042 |
Date | 04 June 2015 |
Creators | Pérez Urcia, Walter, Quispesaravia Ildefonso, André Raúl |
Contributors | Alva Manchego, Fernando Emilio |
Publisher | Pontificia Universidad Católica del Perú |
Source Sets | Pontificia Universidad Católica del Perú |
Language | Spanish |
Detected Language | Spanish |
Type | info:eu-repo/semantics/bachelorThesis |
Format | application/pdf, application/pdf |
Source | Pontificia Universidad Católica del Perú, Repositorio de Tesis - PUCP |
Rights | Atribución-NoComercial-SinDerivadas 2.5 Perú, info:eu-repo/semantics/openAccess, http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
Page generated in 0.0023 seconds