Return to search

Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU

El Shiwilu es considerada ‘seriamente en peligro’ porque es hablada principalmente por
adultos mayores de forma parcial, poco frecuente y en contextos restringidos; además, no
continúa siendo transmitida a nuevas generaciones. Este tipo de lenguas necesitan pasar por un
proceso de revitalización (fortalecimiento) para garantizar que no se extingan y así fomentar el
interés de sus hablantes. Además, su documentación es muy escasa debido a los pocos estudios
lingüísticos realizados. A fin de elevar su status, se sugiere la creación de recursos y tecnología
de corte lingüístico, como corpus monolingüe y bilingüe, diccionarios, reconocimiento de
categorías gramaticales, analizadores morfológicos, etc. Sin embargo, la mayoría de las
lenguas existentes no se beneficia con alguno de estos recursos y/o tecnologías, y por ello son
consideradas como lenguas de escasos recursos. Debido a la falta de inversión, se requiere un
enfoque en el que se busquen soluciones robustas a un bajo costo a través de herramientas
independientes de la lengua, modelos de desarrollo de código abierto o algoritmos de
aprendizaje automático no supervisado. Bajo este contexto, se identifica como problema
central el desconocimiento de un enfoque adecuado para la segmentación morfológica de una
lengua de escasos recursos; y para ello, el presente proyecto propone realizar una segmentación
morfológica automática no supervisada en una lengua con estas características a partir de la
identificación del tipo de enfoque, monolingüe o multilingüe, que ofrece mejores resultados en
esta tarea.

Identiferoai:union.ndltd.org:PUCP/oai:tesis.pucp.edu.pe:20.500.12404/25281
Date27 June 2023
CreatorsAsmat Ramirez, Evelyn Fiorella
ContributorsZapata del Rio, Claudia Maria Del Pilar, Oncevay Marcos, Felix Arturo
PublisherPontificia Universidad Católica del Perú, PE
Source SetsPontificia Universidad Católica del Perú
LanguageSpanish
Detected LanguageSpanish
Typeinfo:eu-repo/semantics/bachelorThesis
Formatapplication/pdf, application/pdf
Rightsinfo:eu-repo/semantics/openAccess, Atribución-CompartirIgual 2.5 Perú, http://creativecommons.org/licenses/by-sa/2.5/pe/

Page generated in 0.0013 seconds