Spelling suggestions: "subject:"procesamiento dde voz"" "subject:"procesamiento dee voz""
1 |
Diseño y simulación de un scrambler digital de vozMontoya Limón, Roberto Isaac 15 October 2012 (has links)
Un primer acercamiento a la definición de comunicación puede realizarse
desde su etimología. La palabra deriva del latín communicare, que significa
“compartir algo, poner en común”. Por lo tanto, la comunicación es el
proceso mediante el cual el emisor y el receptor establecen una conexión en
un momento y espacio determinados para compartir ideas, transmitir e
intercambiar información o significados que son comprensibles para ambos.
Desde un punto de vista técnico se entiende por comunicación al hecho que
un determinado mensaje originado por el emisor llegue a un receptor,
distante en el espacio o en el tiempo. La comunicación implica transmitir y
recepcionar una determinada información que en la actualidad se encuentra
muy vulnerable e insegura debido a las interceptaciones, la existencia de
intereses personales, empresariales o de terceros. Este problema ha
motivado la presente tesis a diseñar una alternativa de solución mediante el
cual se mejora la confidencialidad de las comunicaciones que en su mayoría
de casos se requiere.
En tal sentido, la presente tesis tiene como objetivo presentar un Diseño y
Simulación de un Scrambler Digital de Voz, el cual permitirá codificar la
señal de voz a fin de transmitirla por el canal.
La transmisión permitirá la comunicación exclusiva entre el emisor y
receptor. Sólo el receptor podrá decodificar el mensaje y a su vez recibirá del
emisor una contraseña que será establecida aleatoriamente en cada
transmisión. Para la recepción, se decodificará la señal de voz con la
contraseña recibida aleatoriamente garantizando de esta manera una
comunicación segura. / Tesis
|
2 |
Implementación de un algoritmo para la localización de la voz de un orador en un plano tomando como punto de referencia el nivel máximo de su patrón de radiaciónPinto Valdiviezo, David Fernando 09 November 2011 (has links)
Actualmente se vive en un mundo competitivo donde el conocimiento de las nuevas tecnologías y tendencias se ha convertido en la herramienta más poderosa. Las personas acuden más frecuentemente a todo tipo de conferencias y exposiciones para enterarse de los últimos avances e investigaciones en los campos que a cada uno le conciernen.
Este tipo de eventos tienen lugar dentro de salas de conferencias o auditorios los cuales han sido diseñados para brindar la mejor infraestructura y acústica posible para el público usuario. Sin embargo no se ha logrado controlar los altibajos de niveles de presión sonora del micrófono del expositor producido por los movimientos naturales de su cabeza, lo cual genera problemas de inteligibilidad y distracción en el público. El objetivo de la presente tesis es localizar la dirección de mayor intensidad de la voz de un orador respecto a un punto como parte de un proyecto que pretende ecualizar un micrófono para lograr en la medida de lo posible un mismo nivel y grado de inteligibilidad durante una exposición hablada que solucione el problema antes mencionado.
En el primer capítulo, se muestra información teórica sobre la voz humana y los micrófonos, puesto que es sumamente importante conocer la fuente y el receptor de señales y cómo es que interaccionan entre sí.
En el segundo capítulo, se describe el marco problemático y los posibles métodos de localización para resolver el problema, además se encuentra la investigación realizada de los últimos avances en localización sonora.
En el tercer capítulo, se define el método a emplear y el diseño del algoritmo que toma en cuenta los requerimientos del método y las características de la voz humana.
En el cuarto capítulo se muestran los resultados de la implementación del diseño basándose en las pruebas realizadas y el costo del proyecto.
Finalmente se presentan las conclusiones, las cuales muestran que se cumplieron con los objetivos planteados y se dan algunas recomendaciones para futuras investigaciones sobre el proyecto. / Tesis
|
3 |
Diseño e implementación de un sistema interactivo de respuesta de voz (IVR) piloto para la reserva de boletos del ferrocarril Cuzco-Machu PichuOrtega Gallegos, David Alfonso 09 May 2011 (has links)
El proyecto de tesis consiste en el estudio, diseño e implementación de un sistema IVR
IP de interfaz telefónica bilingüe (español inglés) para la reserva de boletos del
ferrocarril de Cuzco para el viaje desde la estación de San Pedro hasta la ciudadela
Machu Picchu (Aguas Calientes).
Este sistema consistirá en una arquitectura conformada por tres servidores: El primero
será una PBX IP implementada en software libre, el segundo un servidor de
requerimientos que tramitará pedidos y almacenará la lógica del sistema, y el tercero un
servidor de Base de datos que sigue el modelamiento desarrollado en este trabajo. / Tesis
|
4 |
Modelo de entonación para un sintetizador de voz con aplicación a un sistema de información vía telefónica en cinesFlores Álvarez, Crisaida Marlit 10 February 2010 (has links)
Los sistemas de diálogo vía telefónica son desarrollos en los cuales la computadora
emula el comportamiento humano para dar respuesta a la consulta del usuario. En
este contexto, la entonación con la cual la computadora emita la respuesta, tiene un
papel importante, pues es el factor que dotará de naturalidad al sistema. En tanto
esté bien modelada, la entonación permitirá que para el usuario sea casi imperceptible
la diferencia entre una voz de persona y una voz sintética. / Tesis
|
5 |
Módulo de reconocimiento de voz a texto independiente de locutor para sistemas de diálogoGarcía García, Ursula del Milagro 09 May 2011 (has links)
En la actualidad, gracias al avance de la tecnología y del desarrollo matemático, los
sistemas que interactúan con el usuario utilizando el habla son una realidad en varias partes del mundo, principalmente dando información sobre diversos dominios, ya sean viajes en avión y en tren, búsquedas medicas, etc. Sin embargo, construir uno implica una investigación multidisciplinaria, donde se mezclan la lingüística, el procesamiento digital
de señales y la inteligencia artificial. / Tesis
|
6 |
Compensación no Supervisada de Variabilidad Intra-Locutor y Ruido en Reconocimiento de Patrones de VozGarretón Vender, Claudio January 2007 (has links)
En un sistema de verificación de locutor, la cantidad y calidad de los datos utilizados en el proceso de
enrolamiento son fundamentales para lograr un desempeño mínimo acorde a los requerimientos de la mayoría de
los servicios. Sin embargo, en una aplicación que funciona sobre una plataforma telefónica, es escencial realizar
los diálogos de entrenamiento y verificación de forma rápida y eficiente. Estas restricciones obligan a operar con
una cantidad limitada de datos de enrolamiento. Situación que trae como consecuencia, en muchos casos, modelos
con un bajo nivel de robustez lo que implica una degradación en el rendimiento del sistema.
El problema de datos limitados de enrolamiento en verificación de locutor es un tema poco abordado en la
literatura. Los métodos propuestos se han basado principalmente en adaptación de modelos HMM (Hidden
Markov Models). Estas técnicas adaptan los parámetros de los modelos de cliente usando datos de voz generados
por los usuarios en eventos de verificación.
El objetivo principal de esta tesis es lograr un sistema de verificación de locutor telefónico robusto al efecto
negativo causado por los datos limitados de entrenamiento y el ruido. Para esto, este trabajo de investigación se
centra en el análisis y modelación de la variabilidad intra-locutor. Basándose en el criterio de MAP (Maximum a
posteriori) se propone un modelo de compensación no supervisado para las señales de verificación, ISVC (Intraspeaker
variability compensation). Esta técnica no modifica los modelos de usuario, evitando de esta forma los
errores provocados por la clasificación errónea de datos de adaptación. Es posible estimar los parámetros del
modelo propuesto con un conjunto reducido de usuarios. Además, el método descrito es independiente del usuario
y de la clase fonética en que es aplicado.
ISVC entrega reducciones entre 20% y 40% en la tasa de error del sistema. Cuando existen cambios de canal
entre condiciones de entrenamiento y verificación, el método genera mejoras entre 5% y 10% en la probabilidad
de error. El método propuesto se compara y combina con una técnica de adaptación no supervisada de modelos. Se
analizan ventajas y desventajas de ambos métodos simulando distintos escenarios de operación. Los resultados
obtenidos sugieren que ISVC es compatible con esquemas de adaptación no supervisados. Más aun, la
combinación de ambas técnicas puede llevar a una reducción entre 30% y 40% en la tasa de error de verificación
|
7 |
Sistema de asistencia para personas cuadripléjicas que permite la manipulación de un mecanismo robótico mediante la vozEscalante Zelada, Joel Eduardo 18 November 2020 (has links)
En la actualidad, la cuadriplejia resulta ser uno de los padecimientos más difíciles de
afrontar, al ser una discapacidad irreversible, la cual implica la inmovilización de miembros
superiores e inferiores, ocasionando un alto impacto en la vida de un ser humano. El resultado
de esta patología influye en la dependencia de una segunda persona, generándole sentimientos
de inferioridad, perdida de su intimidad y sobre todo aislamiento social.
Dada la existencia de esta patología, diversas instituciones han desarrollado soluciones
que a la actualidad han demostrado que una persona con padecimiento de cuadriplejia puede
tomar el control de diversos dispositivos usando medios alternativos, como el movimiento
ocular, señales electroencefalográficas u órdenes verbales resultando atractivo para su
desarrollo tecnológico.
El presente proyecto de investigación se centra en la creación de un sistema de
asistencia robótica basado en el control por voz que, a diferencia de otros, tiene un óptimo
funcionamiento sin la limitación de estar conectado a un ordenador y/o a internet, siendo un
sistema fácilmente transportable y adaptable a cualquier entorno en el que se encuentre el
discapacitado. Con la ayuda de este sistema, el usuario podrá tener el control de un mecanismo
robótico, con el cual ejecutará acciones que normalmente son realizadas por una segunda
persona. Adicionalmente, se presentará la simulación del sistema y sus resultados al evaluar su
performance y su funcionalidad con respeto al ayudar a personas que padecen de cuadriplejia
ya sea en la realización independiente de ciertas actividades de su vida cotidiana, como asearse
o alimentarse.
Este proyecto sumará también a la labor de diversos especialistas enfocados en ayudar
psicológicamente a las personas con padecimiento de cuadriplejia, cuya esencia se basa en
mejorar su autoestima, su inserción en la sociedad y sustancialmente su calidad de vida y de
los que lo rodean.
|
8 |
Implementación de un algoritmo para la localización de la voz de un orador en un plano tomando como punto de referencia el nivel máximo de su patrón de radiaciónPinto Valdiviezo, David Fernando 09 November 2011 (has links)
Actualmente se vive en un mundo competitivo donde el conocimiento de las nuevas tecnologías y tendencias se ha convertido en la herramienta más poderosa. Las personas acuden más frecuentemente a todo tipo de conferencias y exposiciones para enterarse de los últimos avances e investigaciones en los campos que a cada uno le conciernen.
Este tipo de eventos tienen lugar dentro de salas de conferencias o auditorios los cuales han sido diseñados para brindar la mejor infraestructura y acústica posible para el público usuario. Sin embargo no se ha logrado controlar los altibajos de niveles de presión sonora del micrófono del expositor producido por los movimientos naturales de su cabeza, lo cual genera problemas de inteligibilidad y distracción en el público. El objetivo de la presente tesis es localizar la dirección de mayor intensidad de la voz de un orador respecto a un punto como parte de un proyecto que pretende ecualizar un micrófono para lograr en la medida de lo posible un mismo nivel y grado de inteligibilidad durante una exposición hablada que solucione el problema antes mencionado.
En el primer capítulo, se muestra información teórica sobre la voz humana y los micrófonos, puesto que es sumamente importante conocer la fuente y el receptor de señales y cómo es que interaccionan entre sí.
En el segundo capítulo, se describe el marco problemático y los posibles métodos de localización para resolver el problema, además se encuentra la investigación realizada de los últimos avances en localización sonora.
En el tercer capítulo, se define el método a emplear y el diseño del algoritmo que toma en cuenta los requerimientos del método y las características de la voz humana.
En el cuarto capítulo se muestran los resultados de la implementación del diseño basándose en las pruebas realizadas y el costo del proyecto.
Finalmente se presentan las conclusiones, las cuales muestran que se cumplieron con los objetivos planteados y se dan algunas recomendaciones para futuras investigaciones sobre el proyecto.
|
9 |
Sistema de medición de la fluidez del habla en personas con tartamudez utilizando procesamiento de vozPorras Ramírez, Diego José 20 October 2020 (has links)
En esta época, se han desarrollado diversas aplicaciones y sistemas que permiten mejorar la
vida de las personas que han nacido u adquirido algún tipo de discapacidad con el paso de los
años.
En el caso de las personas cuyas discapacidades están relacionadas a la incapacidad de hablar
fluidamente, las aplicaciones de entrenamiento que actualmente existen buscan hacer que el
usuario practique ciertas lecturas y situaciones reales a fin de evaluar el nivel de fluidez
mediante la práctica constante. Sin embargo, no todas ellas proporcionan información concisa
sobre la ubicación de distorsiones y disfluencias en las cuales el tartamudo debe entrenarse.
El presente trabajo comprende el diseño de un sistema de medición de la fluidez del habla
mediante procesamiento de voz que, aplicando diversos algoritmos, permite a un usuario
practicar, retroalimentar e identificar vocales críticas en las cuales se debe prestar mayor
atención al momento de hablar. Finalmente, se analizan resultados cuantitativos provenientes
de los usuarios para poder clasificar el nivel de gravedad de su tartamudez. / Tesis
|
10 |
Modelado lingüístico-prosódico para un sistema conversor texto a voz mediante concatenación de demisílabasSegura Salas, Elí Rónal 09 May 2011 (has links)
El objeto principal de esta tesis ha sido el estudio del procesamiento
lingüístico y prosódico en un sistema conversor de texto a voz, basado en
concatenación de unidades para un hablante limeño del castellano.
Basado en la información proporcionada por el estudio antes mencionado, se
realizó el análisis, diseño e implementación de los módulos del procesamiento
lingüísticoprosódico de un sistema conversor texto a voz; así como también,
se hicieron los cambios necesarios en los módulos del sintetizador de voz,
para aprovechar la información prosódica (duración segmental y contorno de
frecuencia fundamental) proveniente de esos módulos. / Tesis
|
Page generated in 0.1144 seconds