Desde hace tiempo se viene comentando que los estudiantes universitarios presentan
serios problemas de expresión escrita. En diversas fuentes de información, tales como
artículos de investigación científica, tesis, u otros medios académicos y profesionales,
se puede apreciar diversos errores de redacción. Ésta es una situación que se
considera inadmisible en personas con un alto nivel de instrucción formal,
especialmente porque todas ellas ya han pasado alrededor de once años de
escolarización en la que aprobaron diversas materias relativas a la enseñanza de su
lengua materna.
Como medida para solucionar este problema, se busca promover la enseñanza de la
organización de las ideas. Existen varias técnicas que ayudan a organizar las ideas y
preparar la información antes de la redacción del ensayo, monografía o artículo
científico. Una de las técnicas más básicas es la redacción del resumen.
Se sabe que la redacción del resumen de los textos científicos es una técnica básica y
fundamental para la organización de ideas y preparación de información para redactar
correctamente textos científicos más complejos. Por tal motivo, el presente proyecto
de fin de carrera presenta la implementación de un software de apoyo a la escritura de
resúmenes de textos científicos en español, el cual ayudará al escritor a redactar
resúmenes de sus textos científicos con una estructura adecuada.
Para poder llevarlo a cabo, primero se formó un corpus de 44 resúmenes de textos
científicos en español, que sirven para el entrenamiento y prueba del modelo
clasificador AZEsp. Para formar el corpus, se tuvo como estructura óptima de los
textos la presencia de 6 categorías: Contexto, Brecha, Propósito, Metodología,
Resultado y Conclusión.
Luego, se procedió a determinar un conjunto de 7 características (atributos), las cuales
serían utilizadas para identificar cada una de las categorías. Posteriormente, se
implementaron una serie de algoritmos para la extracción de los valores de dichos
atributos de cada oración de los resúmenes de textos científicos para que sean
utilizadas por el modelo. Una vez obtenidos dichos valores, éstos fueron utilizados
para la implementación del modelo clasificador AZEsp y evaluación de su desempeño
utilizando métricas tales como Precision, Recall y F-Measure.
Finalmente, se implementó el ambiente de ayuda SciEsp, el cual utiliza el modelo
clasificador AZEsp para clasificar automáticamente las oraciones de los resúmenes de
textos científicos en español ingresados por el usuario, siguiendo una estructura predefinida.
Se hizo una serie de experimentos para evaluar el desempeño del modelo clasificador
AZEsp. Se obtuvo diferentes resultados; sin embargo, el más resaltante fue que el
modelo logró un desempeño de 65.4%. Esto demuestra que la herramienta informática
propuesta (SciEsp) está apta para su utilización. En conclusión, los estudiantes
universitarios podrán emplear esta herramienta para la redacción de sus resúmenes;
ellos podrán identificar sus errores y deficiencias en la redacción, y serán capaces de
mejorar de forma autodidacta. / Tesis
Identifer | oai:union.ndltd.org:PUCP/oai:tesis.pucp.edu.pe:123456789/5505 |
Date | 18 August 2014 |
Creators | Vargas Campos, Irvin Rosendo |
Contributors | Alva Manchego, Fernando Emilio |
Publisher | Pontificia Universidad Católica del Perú |
Source Sets | Pontificia Universidad Católica del Perú |
Language | Spanish |
Detected Language | Spanish |
Type | info:eu-repo/semantics/bachelorThesis |
Format | application/pdf, application/pdf |
Source | Pontificia Universidad Católica del Perú, Repositorio de Tesis - PUCP |
Rights | Atribución-NoComercial-SinDerivadas 2.5 Perú, info:eu-repo/semantics/openAccess, http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
Page generated in 0.049 seconds