1 |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-koniboEgo Aguirre Santa Cruz, Renzo Alberto 12 November 2018 (has links)
La presente tesis ofrece una solución para las dificultades que constituyen los morfemas
polisémicos en el marco de la traducción automática de lenguas minoritarias. El caso
concreto en el que se enfoca este trabajo de investigación es la polisemia de una entidad
lingüística bastante relevante y muy recurrente en el shipibo-konibo y en las demás
lenguas que conforman la familia pano: el enclítico =n. Este morfema posee un mínimo
de seis significados diferentes.
Para abordar la complejidad que supone esta forma lingüística, la presente tesis se
centra principalmente en la creación de un algoritmo que desambigüe los distintos
valores del morfema en cuestión. Esta alternativa se consideró conveniente dado que la
creación de un software de traducción automática basado en estadística requiere el uso
de amplia cantidad de material lingüístico digitalizado, lo que en el caso de la mayoría
de lenguas minoritarias es virtualmente inexistente. De ahí la necesidad del uso de
métodos de traducción automática basados en reglas.
En esta misma línea, puesto que el algoritmo toma como base reglas, nuestra propuesta
prioriza, en una primera instancia, la desambiguación de las funciones más
morfosintácticas por encima de las funciones más semánticas, debido a que, tal como se
argumenta en este trabajo de investigación, son más fáciles de procesar por un software
de este tipo. Para ello, primero, se realizó un análisis y catalogación de los rasgos de
tales funciones a nivel morfosintáctico y, posteriormente, sobre la base de dicho
análisis, se fijó una jerarquía de desambiguación funcional. La posterior codificación del algoritmo resultante en lenguaje de programación
comprobó la efectividad de este enfoque, por lo que es sostenible postular que esta
constituye una estrategia potencialmente repicable para la desambiguación de morfemas
polifuncionales en el marco de proyectos de traducción automática que trabajen con
otras lenguas minoritarias. / Tesis
|
2 |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y españolGalarreta Asian, Ana Paula 31 March 2017 (has links)
Actualmente, existe información que debe estar disponible para todos los habitantes de
nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un
país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las
razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque
el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un
traductor automático basado en colecciones de textos, también llamados corpus, que utilice
métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática
de texto entre el español y el shipibo-konibo.
Para implementar un método estadístico, es necesario contar con corpus paralelos en los
idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo,
y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario
construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al
español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los
corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar
los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos,
se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de
traducción automática que será implementada por investigadores del Grupo de Reconocimiento de
Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP. / Tesis
|
3 |
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-koniboEgo Aguirre Santa Cruz, Renzo Alberto 26 November 2018 (has links)
La presente tesis ofrece una solución para las dificultades que constituyen los morfemas
polisémicos en el marco de la traducción automática de lenguas minoritarias. El caso
concreto en el que se enfoca este trabajo de investigación es la polisemia de una entidad
lingüística bastante relevante y muy recurrente en el shipibo-konibo y en las demás
lenguas que conforman la familia pano: el enclítico =n. Este morfema posee un mínimo
de seis significados diferentes.
Para abordar la complejidad que supone esta forma lingüística, la presente tesis se
centra principalmente en la creación de un algoritmo que desambigüe los distintos
valores del morfema en cuestión. Esta alternativa se consideró conveniente dado que la
creación de un software de traducción automática basado en estadística requiere el uso
de amplia cantidad de material lingüístico digitalizado, lo que en el caso de la mayoría
de lenguas minoritarias es virtualmente inexistente. De ahí la necesidad del uso de
métodos de traducción automática basados en reglas.
En esta misma línea, puesto que el algoritmo toma como base reglas, nuestra propuesta
prioriza, en una primera instancia, la desambiguación de las funciones más
morfosintácticas por encima de las funciones más semánticas, debido a que, tal como se
argumenta en este trabajo de investigación, son más fáciles de procesar por un software
de este tipo. Para ello, primero, se realizó un análisis y catalogación de los rasgos de
tales funciones a nivel morfosintáctico y, posteriormente, sobre la base de dicho
análisis, se fijó una jerarquía de desambiguación funcional. La posterior codificación del algoritmo resultante en lenguaje de programación
comprobó la efectividad de este enfoque, por lo que es sostenible postular que esta
constituye una estrategia potencialmente repicable para la desambiguación de morfemas
polifuncionales en el marco de proyectos de traducción automática que trabajen con
otras lenguas minoritarias. / Tesis
|
4 |
Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y españolGalarreta Asian, Ana Paula 01 January 2018 (has links)
Actualmente, existe información que debe estar disponible para todos los habitantes de
nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un
país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las
razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque
el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un
traductor automático basado en colecciones de textos, también llamados corpus, que utilice
métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática
de texto entre el español y el shipibo-konibo.
Para implementar un método estadístico, es necesario contar con corpus paralelos en los
idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo,
y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario
construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al
español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los
corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar
los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos,
se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de
traducción automática que será implementada por investigadores del Grupo de Reconocimiento de
Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP. / Tesis
|
Page generated in 0.0578 seconds