Spelling suggestions: "subject:"lenguas indígenas"" "subject:"lenguas ndígenas""
41 |
La codificación de los objetos en las construcciones aplicativas del asháninkaMontoya Samamé, Jaime Rafael 30 November 2021 (has links)
La presente tesis consiste en un estudio acerca de las construcciones aplicativas de la
lengua asháninka. El objetivo de esta tesis es doble: analiza la codificación de los objetos
de las construcciones aplicativas del asháninka y la compara con la codificación de los
objetos de las construcciones ditransitivas no derivadas de esta lengua. Dada la riqueza
de sufijos aplicativos reportada en las lenguas arawak peruanas y la escasez de estudios
gramaticales del asháninka, se busca contribuir tanto a la investigación de la
morfosintaxis de esta lengua como a los estudios tipológicos acerca de la relación entre
las construcciones ditransitivas derivadas y no derivadas. El asháninka cuenta con nueve
sufijos aplicativos: generalizado -ako, presencial -imo, intención -ashi, benefactivo sustitutivo -bent, benefactivo -anont, separativo -apitsa, instrumental -ant, motivo -iment
y sociativo-causativo -aka. Los objetos de las construcciones aplicativas (objeto
aplicativo y objeto base) del asháninka pueden ser marcados en el verbo mediante sufijos
de concordancia de objeto. Nuestro análisis revela que la codificación de los objetos de
la construcción aplicativa interactúa con la oposición entre los participantes del acto de
habla (PAH) y la tercera persona, y con la animicidad. Asimismo, se observa que las
construcciones aplicativas ditransitivas tienden a marcar en el verbo al objeto aplicativo
(y no al objeto base) cuando estos factores semánticos no entran en juego. Además, el
asháninka cuenta con dos construcciones ditransitivas no derivadas: una con el verbo
ditransitivo p ‘dar’ y una construcción benefactiva no derivada. Estas construcciones
también recurren a los mismos sufijos verbales de objeto y la codificación de sus objetos
también es sensible a la oposición entre PAH y tercera persona; asimismo, manifiestan
un alineamiento secundativo cuando ambos objetos son de tercera persona.
|
42 |
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanasCardoso Yllanes, Gerardo 09 November 2022 (has links)
Para combatir los ataques de ejemplos adversarios, se propuso implementar un modelo de reconocimiento de palabras y entrenarlo con oraciones creadas a través de diferentes técnicas de generación de data aumentada para cuatro lenguas amazónicas peruanas de pocos recursos: Shipibo-Konibo, Asháninka, Yanesha y Yine. Observamos que, para la gran mayoría de experimentos, el modelo propuesto logró corregir oraciones con palabras con errores ortográficos. Los modelos que fueron entrenados mediante oraciones creadas a través de los canales de errores de ambigüedad fonema-grafema y desnormalización; y, el modelo de ensamble, se desempeñaron mejor al momento de evaluarlos con los corpus creados por profesores de las lenguas. Finalmente, se implementó un prototipo del corrector ortográfico neuronal, en donde se encuentran todos los modelos entrenados en la presente investigación.
|
43 |
Data augmentation and subword segmentation for spell-checking in amazonian languagesAlva Cohello, Carlo André 24 September 2021 (has links)
En el Perú se han identificado 48 lenguas originarias, según la información extraída
de la Base de Datos oficial de Pueblos Indígenas u originarios (BDPI). Estas son de
tradición oral [BDPI, 2020]. Por lo que no había una forma oficial de enseñanza. El
Instituto Linguistico de Verano (ILV) recopiló y documentó diversas lenguas nativas
[Faust, 1973], como un primer intento para tener un documento formal para la
enseñanza de una lengua originaria. Fue después que el Gobierno Peruano con su
estrategia de inclusión social “Incluir para crecer” creó una guía oficial para la
enseñanza de las lenguas originarias en su intento de normalizar el uso de estas
lenguas [Jara Males, Gonzales Acer, 2015].
Como se menciona en [Forcada, 2016], el uso de tecnologías del lenguaje permite
obtener una normalidad, incremento de literatura, estandarización y mayor
visibilidad. En el caso de Perú, ha habido iniciativas, como analizadores morfológicos
[Pereira-Noriega, et al., 2017] o correctores ortográficos [Alva, Oncevay, 2017],
enfocados en las lenguas originarias de escasos recursos computacionales que
pretenden apoyar el esfuerzo de revitalización, la educación indígena y la
documentación de las lenguas [Zariquiey et al., 2019].
Enfocándose en lenguas amazónicas se realizó un proyecto utilizando redes
neuronales para desarrollar un corrector ortográfico enfocado en las lenguas
originarias con buenos resultados a nivel de precisión [Lara, 2020]. En ese trabajo, al
disponer de poca cantidad de datos se generaron datos sintéticos con un método
aleatorio los cuales al ser evaluados con las métricas CharacTER [Wang, et al., 2016]
y BLEU [Papineni, et al., 2002] obtuvieron resultados bastante bajos. Además, las
lenguas amazónicas al ser ricas a nivel morfológico y tener un vocabulario extenso es
difícil representar palabras fuera del vocabulario, por lo que es recomendable usar
sub-palabras como término medio [Wu, Zhao, 2018].
El presente proyecto desarrolla distintos métodos de generación de datos, diferentes
al aleatorio, que son más robustos al considerar errores que son más cercanos a la
realidad. A su vez, para reducir el costo computacional y mantener la capacidad de
generar un vocabulario abierto, adicionalmente se entrena redes neuronales que
reciban como entrada sub-palabras tales como sílabas y segmentos divididos por byte
pair encoding (BPE). Finalmente, de los experimentos concluimos que hubo mejoras
con los métodos y la segmentación propuesta y se tienen más recursos
computacionales para nuestras lenguas amazónicas.
|
44 |
La terminología de parentesco del quechua en los documentos lingüísticos de los siglos XVI-XVIIBendezú Araujo, Raúl 03 May 2013 (has links)
El trabajo de tesis que presentamos tiene como objetivo examinar la forma en que se ha documentado el sistema de términos de parentesco del quechua durante el periodo colonial temprano (siglos XVI-XVII) y determinar cuál era la constitución formal de este paradigma léxico. Para ello, hemos trabajado sobre un material compuesto de datos extraídos textos lingüísticos elaborados por misioneros de diversas órdenes religiosas en el marco del auge y declive de la evangelización en lenguas vernáculas, así como de un texto que formaba parte de la campaña de extirpación de idolatrías que, si bien no persigue un objetivo lingüístico, registra de manera muy detallada el léxico de parentesco, pues esta institución social resultaba crucial para los afanes evangelizadores.
El estudio de la documentación del sistema de términos de parentesco quechua en la colonia temprana se justifica desde dos perspectivas: una concerniente a la Lingüística y la otra relativa a disciplinas al interior de las ciencias humanas y sociales. En relación con la primera, consideramos que esta investigación se relaciona con la lingüística histórico-comparativa y con la filología andina. Por otra parte, en relación con las ciencias sociales y humanas, consideramos que esta propuesta atañe a la Antropología y a la Etnohistoria andinas. Dado que las relaciones de parentesco ocupan un lugar central en el entramado de las relaciones de reciprocidad, un esclarecimiento acerca de cómo fue el sistema de parentesco quechua en su dimensión lingüística en los inicios de la Colonia puede ser de mucha utilidad a los diversos estudios sobre el parentesco andino, en particular a aquellos cuyo estudio se basa en los datos lingüísticos coloniales, sobre todo porque, durante décadas, se han realizado sin considerar los aportes que la Lingüística puede ofrecer.
En tal sentido, una vez presentado el tema que es abordado por la tesis, el objetivo del trabajo de investigación puede resumirse en dos preguntas específicas: (1) ¿cómo fue documentado el sistema léxico-conceptual de parentesco quechua en un contexto de contacto lingüístico asimétrico como el del periodo colonial temprano? y (2) ¿qué restitución podemos ofrecer para el paradigma léxico de parentesco del quechua de los siglos XVI-XVII? Por su parte, las preguntas que ayudaron a su resolución son (a) ¿qué información específica podemos obtener de estas fuentes para dar cuenta del paradigma de parentesco? y (b) ¿qué elementos propios de la cultura occidental intervinieron en el proceso de registro, entendido como parte de un proceso de interacción entre la cultura del codificador y la cultura codificada?
Tras el trabajo de investigación elaborado, hemos llegado a las siguientes respuestas: (1) el léxico de parentesco quechua fue registrado con un relativo grado de sorpresa, preocupación y desconcierto por parte de los primeros gramáticos y lexicógrafos del quechua, lo que se evidencia en la necesidad de tomar en consideración secciones especiales que tratan sobre el tema en sus obras y a los juicios valorativos que incluyen en ellas; y (2) en la medida en que el quechua no constituía una sola variedad lingüística, sino que presentaba una rica variación dialectal que, obviamente, afectaba al plano léxico, debemos ofrecer dos reconstrucciones distintas para el sistema léxico de parentesco quechua: una para el quechua costeño y las áreas en las que predominaba el quechua denominado “chinchaysuyo”, y otra para las zonas en las que predominaba un quechua de tipo cuzqueño, altamente influenciado por la variedad sureña del aimara. Estas respuestas combinadas dan cuenta de los objetivos centrales de la investigación. Conclusiones adicionales, a las que hemos llegado durante la investigación, atañen a la relación entre lengua y cultura (en el caso particular del léxico de parentesco quechua), a aspectos teóricos y metodológicos, como la propuesta de elaboración de un análisis a partir de macrocategorías léxicas y de la distinción entre formas uniléxicas y formas perifrásticas. / Tesis
|
45 |
Awajunnum kuntin aidau: categorización etnozoológica en awajúnEspejo Apikai, Hermenegildo 14 June 2022 (has links)
La presente investigación busca describir y analizar la categorización taxonómica
propia de la cosmovisión awajún para las categorías que se pueden encontrar
dentro del concepto de ANIMAL. A partir de la teoría de taxonomías
etnolingüísticas propuesta por Berlin, B. (1992) Ethnobiological classification:
principles of categorization of plants and animals in traditional societies, la tesis
plantea que existen diferentes tipos de categorías etnozoológicas en awajún,
algunas de las cuales cuentan con etiquetas terminológicas y otras son categorías
encubiertas que no cuentan con una etiqueta terminológica, pero que de acuerdo
con esta investigación conforman taxones para los hablantes awajún. La
metodología sigue pasos de gabinete para extraer información de diccionarios, así
como trabajo de campo y entrevistas a profundidad a hablantes de awajún de la
variedad todavía poco descrita del Cenepa.
|
46 |
Corrección ortográfica de lenguas amazónicas usando redes neuronales secuencia a secuenciaLara Avila, César Jesús 26 May 2020 (has links)
De acuerdo a la Base de Datos Oficial de Pueblos Indígenas u Originarios (BDPI), el Perú cuenta con 55 pueblos indígenas, identificados hasta la fecha; que hablan al menos 47 lenguas originarias y que según el Documento Nacional de Lenguas Originarias del Perú están divididos en 19 familias lingüísticas, siendo las familias Pano y Arawak las que presentan una mayor cantidad de lenguas, ambas con 10 lenguas. En este trabajo, se plantea un modelo de corrección ortográfica utilizando modelos de redes neuronales profundas, a nivel de caracteres, en lenguas de las dos familias antes mencionadas: Shipibo-Konibo de la familia Pano y Yanesha, Yine y Ashaninka para la familia Arawak. Para ello se han realizamos experimentos en conjuntos de datos obtenidos de páginas como PerúEduca, incorporando errores ortográficas cometidos a nivel de caracteres, en modelos secuencia a secuencia (seq2seq) que han demostrado recientemente ser un marco exitoso para varias tareas de procesamiento de lenguaje natural, incluyendo el proceso de corrección ortográfica. / Tesis
|
47 |
Prefijos de partes del cuerpo en la lengua iskonawa (Pano, Perú) : una descripción sincrónicaRodríguez Alzza, Ana Carolina 26 November 2015 (has links)
La presente tesis es una descripción sincrónica del funcionamiento de los prefijos de partes del cuerpo del iskonawa, lengua pano (Ucayali-Perú) en estado de obsolescencia y en peligro de extinción. Esta investigación se organiza en cuatro capítulos. El capítulo 1 consiste en una introducción al pueblo iskonawa y su lengua. Además, se exponen las preguntas que guían la presente investigación, sus objetivos y la metodología utilizada. En el capítulo 2, se presentan los antecedentes sobre los prefijos de partes del cuerpo en la familia lingüística pano. En el capítulo 3, se realiza la descripción sincrónica del funcionamiento de los prefijos de partes del cuerpo de la lengua iskonawa. En primer lugar, se ofrece el inventario de prefijos de partes del cuerpo de la lengua. En segundo lugar, se describen las propiedades fonológicas y morfofonológicas. En tercer lugar, se describen las propiedades morfosintácticas y semánticas. Por último, se muestran los patrones de correspondencia entre prefijos de partes del cuerpo y raíces correspondientes, así como las disimilitudes fonológicas entre ambos. El capítulo 4 expone las conclusiones de esta tesis.
|
48 |
Categorización de vocales anteriores por hablantes bilingües quechua-españolNapurí Espejo, Andrés 02 September 2011 (has links)
La presente tesis busca estudiar cómo categorizan auditivamente los sonidos vocálicos los hablantes bilingües quechua-español. En ese sentido, la presente tesis busca explicar qué características tiene el sistema fonológico de los bilingües quechua-español y si se distingue del sistema fonológico de los hablantes monolingües de español. Además, esta investigación explora las posibles estrategias que emplean en el proceso de adquisición del sistema fonológico de su L2.
La principal hipótesis de la presente investigación es la siguiente: Ante el mismo continuo de estímulos vocálicos anteriores, los hablantes monolingües de español categorizarán los estímulos en dos grupos correspondientes a los fonemas /im/ y /em/, a lo sumo con un estímulo de cruce que a veces se caracterizará como /im/ y a veces como /em/. Por su parte, los hablantes bilingües quechua-español categorizarán los estímulos en dos grupos correspondientes a los fonemas /ib/ y /eb/, pero caracterizarán más de un estímulo a veces como /ib/ y a veces /eb/.
La segunda hipótesis que se plantea en la investigación es la siguiente: El aprendizaje de las unidades fonológicas del español por parte de los bilingües sigue un orden determinado: a partir de una indistinción inicial de las vocales anteriores de esta lengua en los bilingües incipientes, el aprendizaje de la L2 va dando paso a la distinción de las categorías fonológicas /ib/ y /eb/ de la L2 en uno de los siguientes órdenes. (1) Los primeros estímulos en ser distinguidos como un sonido diferente son los más altos y más anteriores. Estos se identifican con el nuevo fonema /ib/, mientras que el resto se identifica con /eb/. (2) Los primeros estímulos en ser distinguidos como un sonido diferente son los menos altos y menos anteriores. Estos se identifican con el nuevo fonema /eb/, mientras que el resto se identifica con /ib/.
Para poder observar la percepción de los hablantes, fue necesario un experimento auditivo. Se preparó un set de trece estímulos que van desde una [i] alta y anterior hasta una [ɛ] media y centralizada. Estos trece estímulos se repitieron tres veces y de manera aleatoria durante el experimento para tener una mayor certeza de cómo categorizan cada estímulo. El colaborador responde una pequeña entrevista para obtener información sociolingüística. Luego, realiza el experimento de categorización. El colaborador escucha un estímulo y debe señalar si el estímulo que escuchó es <a>, <e>,
<i>, <o> o <u>. Después que el colaborador marca qué sonido cree que es, escucha el siguiente estímulo y así sucesivamente hasta terminar con los 39 sonidos.
Tras la recolección de datos y su respectivo análisis la tesis culmina con las siguientes conclusiones. La primera y más importante es que los monolingües y bilingües quechua-español dividen el mismo continuo sonoro de manera diferente. Mientras que los hablantes monolingües presentan hasta un estímulo de cruce; los bilingües quechua-español, en cambio, presentan otro tipo de categorización para los mismos sonidos escuchados. El grupo de bilingües muestra un rango de sonidos categorizados de manera ambigua, que pueden ser /ib/ como /eb/. Este rango abarca del desde los 344 Hz en el F1 y entre los 2.320 en el F2, hasta los 365 7 Hz en el F1 y los 2.244 7 Hz en el F2. Esto equivale a cuatro sonidos de los trece estímulos que conforman el continuo, frente al único sonido ambiguo (o ninguno) mostrado en las cartas de formantes de los monolingües.
El 80% de los colaboradores bilingües quechua-español poseen un conjunto de tres sonidos de categorización ambigua dentro del rango que se acaba de nombrar. Por otro lado, el 20% restante de los colaboradores bilingües muestran un rango de dos estímulos ambiguos en lugar de tres que van desde los 365 7 Hz en el F1 y 2.244 7 Hz en el F2 hasta los 387 8 Hz en el F1 y 2.171 1 Hz en el F2.
La segunda conclusión a la que llega esta investigación es que el aprendizaje de las unidades fonológicas del español sigue un orden en el bilingüe quechua-español. Este comienza por no distinguir ningún sonido anterior identificándolo con el fonema quechua /ɪ/, según la Hipótesis de Copiado Total. Luego, conforme recibe mayor input el hablante comienza a realizar distinciones fonológicas a partir de los estímulos más altos.
La evidencia para confirmar esta hipótesis consiste en los colaboradores bilingües que muestran un rango de dos estímulos ambiguos. Estos bilingües presentan solo dos estímulos ambiguos en lugar de tres estímulos como el resto de colaboradores bilingües. Son dos estímulos que se encuentran contenidos dentro del grupo de estímulos ambiguos que presentan el resto de bilingües. Se puede señalar que este rango de dos estímulos sería un avance en la adquisición de la percepción de la L2 entre los colaboradores que presentan tres estímulos ambiguos y los hablantes monolingües de español, lo que se explica gracias a la mayor exposición al español.
|
49 |
Clasificadores en shiwilu (jebero) : organización semántica y morfosintácticaFarfán Reto, Harold 27 March 2012 (has links)
Los shiwilu, también llamados jebero, son un pueblo de la Amazonía peruana que
habita en la provincia de Alto Amazonas, departamento de Loreto. Según Valenzuela
(2010: 117) su número de miembros asciende a dos mil personas aproximadamente, de
las cuales sólo un número muy reducido sigue utilizando su idioma indígena.
Actualmente, la población se encuentra repartida en varios pueblos de la provincia (e
incluso fuera de esta), pero la mayor parte reside en el distrito de Jeberos, ubicado
entre los ríos Marañón y Huallaga.
La lengua se considera, junto al shawi o chayahuita, uno de los dos únicos
miembros de la familia etnolingüística kawapana. Este parentesco se ha asumido
como cierto sobre la base de la propuesta de Beuchat y Rivet (1909) y una “ligera
inteligibilidad”
entre ambos idiomas. (Grime, citado por Valenzuela 2010). Sin
embargo, el único trabajo amplio hasta la fecha es el de Pilar Valenzuela (2011a),
quien demuestra este parentesco a través de la comparación léxica y gramatical de
ambas lenguas, además de proponer una reconstrucción del proto-cahuapana. / Tesis
|
50 |
Rimachishanchikta intrakarqa imatapis yaĉakunchik! “Desarrollo de niveles de comprensión de lectura en las diferentes áreas curriculares de los niveles primario y secundario": plan de acción.Bernilla Carlos, Oscar Del Carmen January 2018 (has links)
El diseño del plan de acción me ha permitido empoderarme de una estrategia metodológica efectiva para afrontar y resolver los diversos problemas institucionales, cimentado en un marco teórico sólido y la participación activa de todos los actores educativos. En este caso, el objetivo es mejorar los resultados de aprendizaje en las diferentes áreas curriculares a través de la transversalización de la lectura. La teoría en la que se sustenta es el enfoque de liderazgo pedagógico en la gestión escolar que me ha permitido comprender las dimensiones desde mi rol directivo para mejorar los aprendizajes, el territorial que nos da la posibilidad de atender el problema teniendo en cuenta las condiciones sociales, culturales y lingüísticos del contexto, promover la participación activa todos los actores educativos poniendo en valor la lengua y cultura del Centro Poblado de Uyurpampa; y, el modelo interactivo de comprensión de lectura que orienta la estrategia del modo de abordar la lectura den las diferentes áreas curriculares. Transversalizar la comprensión de lectura a través del plan de acción –en mi modesta opinión– es una estrategia innovadora para mejorar los resultados de aprendizaje en la Institución Educativa N° 10082 “Sagrado Corazón de Jesús”; y su diseño ha redundado en mi desarrollo personal, académico y profesional. / Trabajo académico
|
Page generated in 0.0759 seconds