Global ETD Search

1	Diseño y simulación de un scrambler digital de voz Montoya Limón, Roberto Isaac 15 October 2012 (has links) Un primer acercamiento a la definición de comunicación puede realizarse desde su etimología. La palabra deriva del latín communicare, que significa “compartir algo, poner en común”. Por lo tanto, la comunicación es el proceso mediante el cual el emisor y el receptor establecen una conexión en un momento y espacio determinados para compartir ideas, transmitir e intercambiar información o significados que son comprensibles para ambos. Desde un punto de vista técnico se entiende por comunicación al hecho que un determinado mensaje originado por el emisor llegue a un receptor, distante en el espacio o en el tiempo. La comunicación implica transmitir y recepcionar una determinada información que en la actualidad se encuentra muy vulnerable e insegura debido a las interceptaciones, la existencia de intereses personales, empresariales o de terceros. Este problema ha motivado la presente tesis a diseñar una alternativa de solución mediante el cual se mejora la confidencialidad de las comunicaciones que en su mayoría de casos se requiere. En tal sentido, la presente tesis tiene como objetivo presentar un Diseño y Simulación de un Scrambler Digital de Voz, el cual permitirá codificar la señal de voz a fin de transmitirla por el canal. La transmisión permitirá la comunicación exclusiva entre el emisor y receptor. Sólo el receptor podrá decodificar el mensaje y a su vez recibirá del emisor una contraseña que será establecida aleatoriamente en cada transmisión. Para la recepción, se decodificará la señal de voz con la contraseña recibida aleatoriamente garantizando de esta manera una comunicación segura. / Tesis Sistemas de procesamiento de voz Criptografía Transformadas de Fourier MATLAB (Programas para computadoras)
2	Implementación de un algoritmo para la localización de la voz de un orador en un plano tomando como punto de referencia el nivel máximo de su patrón de radiación Pinto Valdiviezo, David Fernando 09 November 2011 (has links) Actualmente se vive en un mundo competitivo donde el conocimiento de las nuevas tecnologías y tendencias se ha convertido en la herramienta más poderosa. Las personas acuden más frecuentemente a todo tipo de conferencias y exposiciones para enterarse de los últimos avances e investigaciones en los campos que a cada uno le conciernen. Este tipo de eventos tienen lugar dentro de salas de conferencias o auditorios los cuales han sido diseñados para brindar la mejor infraestructura y acústica posible para el público usuario. Sin embargo no se ha logrado controlar los altibajos de niveles de presión sonora del micrófono del expositor producido por los movimientos naturales de su cabeza, lo cual genera problemas de inteligibilidad y distracción en el público. El objetivo de la presente tesis es localizar la dirección de mayor intensidad de la voz de un orador respecto a un punto como parte de un proyecto que pretende ecualizar un micrófono para lograr en la medida de lo posible un mismo nivel y grado de inteligibilidad durante una exposición hablada que solucione el problema antes mencionado. En el primer capítulo, se muestra información teórica sobre la voz humana y los micrófonos, puesto que es sumamente importante conocer la fuente y el receptor de señales y cómo es que interaccionan entre sí. En el segundo capítulo, se describe el marco problemático y los posibles métodos de localización para resolver el problema, además se encuentra la investigación realizada de los últimos avances en localización sonora. En el tercer capítulo, se define el método a emplear y el diseño del algoritmo que toma en cuenta los requerimientos del método y las características de la voz humana. En el cuarto capítulo se muestran los resultados de la implementación del diseño basándose en las pruebas realizadas y el costo del proyecto. Finalmente se presentan las conclusiones, las cuales muestran que se cumplieron con los objetivos planteados y se dan algunas recomendaciones para futuras investigaciones sobre el proyecto. / Tesis Sistemas de procesamiento de voz Procesamiento de señales acústicas Algoritmos Micrófonos Sonido
3	Diseño e implementación de un sistema interactivo de respuesta de voz (IVR) piloto para la reserva de boletos del ferrocarril Cuzco-Machu Pichu Ortega Gallegos, David Alfonso 09 May 2011 (has links) El proyecto de tesis consiste en el estudio, diseño e implementación de un sistema IVR IP de interfaz telefónica bilingüe (español inglés) para la reserva de boletos del ferrocarril de Cuzco para el viaje desde la estación de San Pedro hasta la ciudadela Machu Picchu (Aguas Calientes). Este sistema consistirá en una arquitectura conformada por tres servidores: El primero será una PBX IP implementada en software libre, el segundo un servidor de requerimientos que tramitará pedidos y almacenará la lógica del sistema, y el tercero un servidor de Base de datos que sigue el modelamiento desarrollado en este trabajo. / Tesis Programas de código abierto Reconocimiento del habla Sistemas de procesamiento de voz Telecomunicaciones
4	Modelo de entonación para un sintetizador de voz con aplicación a un sistema de información vía telefónica en cines Flores Álvarez, Crisaida Marlit 10 February 2010 (has links) Los sistemas de diálogo vía telefónica son desarrollos en los cuales la computadora emula el comportamiento humano para dar respuesta a la consulta del usuario. En este contexto, la entonación con la cual la computadora emita la respuesta, tiene un papel importante, pues es el factor que dotará de naturalidad al sistema. En tanto esté bien modelada, la entonación permitirá que para el usuario sea casi imperceptible la diferencia entre una voz de persona y una voz sintética. / Tesis Procesamiento de señales digitales Reconocimiento de voz Reconocimiento del habla Sistemas de procesamiento de voz Telefonía
5	Módulo de reconocimiento de voz a texto independiente de locutor para sistemas de diálogo García García, Ursula del Milagro 09 May 2011 (has links) En la actualidad, gracias al avance de la tecnología y del desarrollo matemático, los sistemas que interactúan con el usuario utilizando el habla son una realidad en varias partes del mundo, principalmente dando información sobre diversos dominios, ya sean viajes en avión y en tren, búsquedas medicas, etc. Sin embargo, construir uno implica una investigación multidisciplinaria, donde se mezclan la lingüística, el procesamiento digital de señales y la inteligencia artificial. / Tesis Procesamiento de señales Reconocimiento del habla Sistemas de procesamiento de voz
6	Compensación no Supervisada de Variabilidad Intra-Locutor y Ruido en Reconocimiento de Patrones de Voz Garretón Vender, Claudio January 2007 (has links) En un sistema de verificación de locutor, la cantidad y calidad de los datos utilizados en el proceso de enrolamiento son fundamentales para lograr un desempeño mínimo acorde a los requerimientos de la mayoría de los servicios. Sin embargo, en una aplicación que funciona sobre una plataforma telefónica, es escencial realizar los diálogos de entrenamiento y verificación de forma rápida y eficiente. Estas restricciones obligan a operar con una cantidad limitada de datos de enrolamiento. Situación que trae como consecuencia, en muchos casos, modelos con un bajo nivel de robustez lo que implica una degradación en el rendimiento del sistema. El problema de datos limitados de enrolamiento en verificación de locutor es un tema poco abordado en la literatura. Los métodos propuestos se han basado principalmente en adaptación de modelos HMM (Hidden Markov Models). Estas técnicas adaptan los parámetros de los modelos de cliente usando datos de voz generados por los usuarios en eventos de verificación. El objetivo principal de esta tesis es lograr un sistema de verificación de locutor telefónico robusto al efecto negativo causado por los datos limitados de entrenamiento y el ruido. Para esto, este trabajo de investigación se centra en el análisis y modelación de la variabilidad intra-locutor. Basándose en el criterio de MAP (Maximum a posteriori) se propone un modelo de compensación no supervisado para las señales de verificación, ISVC (Intraspeaker variability compensation). Esta técnica no modifica los modelos de usuario, evitando de esta forma los errores provocados por la clasificación errónea de datos de adaptación. Es posible estimar los parámetros del modelo propuesto con un conjunto reducido de usuarios. Además, el método descrito es independiente del usuario y de la clase fonética en que es aplicado. ISVC entrega reducciones entre 20% y 40% en la tasa de error del sistema. Cuando existen cambios de canal entre condiciones de entrenamiento y verificación, el método genera mejoras entre 5% y 10% en la probabilidad de error. El método propuesto se compara y combina con una técnica de adaptación no supervisada de modelos. Se analizan ventajas y desventajas de ambos métodos simulando distintos escenarios de operación. Los resultados obtenidos sugieren que ISVC es compatible con esquemas de adaptación no supervisados. Más aun, la combinación de ambas técnicas puede llevar a una reducción entre 30% y 40% en la tasa de error de verificación Electricidad Verificación de locutor Compesación no supervisada Variabilidad intra-locutor Procesamiento de voz
7	Sistema de asistencia para personas cuadripléjicas que permite la manipulación de un mecanismo robótico mediante la voz Escalante Zelada, Joel Eduardo 18 November 2020 (has links) En la actualidad, la cuadriplejia resulta ser uno de los padecimientos más difíciles de afrontar, al ser una discapacidad irreversible, la cual implica la inmovilización de miembros superiores e inferiores, ocasionando un alto impacto en la vida de un ser humano. El resultado de esta patología influye en la dependencia de una segunda persona, generándole sentimientos de inferioridad, perdida de su intimidad y sobre todo aislamiento social. Dada la existencia de esta patología, diversas instituciones han desarrollado soluciones que a la actualidad han demostrado que una persona con padecimiento de cuadriplejia puede tomar el control de diversos dispositivos usando medios alternativos, como el movimiento ocular, señales electroencefalográficas u órdenes verbales resultando atractivo para su desarrollo tecnológico. El presente proyecto de investigación se centra en la creación de un sistema de asistencia robótica basado en el control por voz que, a diferencia de otros, tiene un óptimo funcionamiento sin la limitación de estar conectado a un ordenador y/o a internet, siendo un sistema fácilmente transportable y adaptable a cualquier entorno en el que se encuentre el discapacitado. Con la ayuda de este sistema, el usuario podrá tener el control de un mecanismo robótico, con el cual ejecutará acciones que normalmente son realizadas por una segunda persona. Adicionalmente, se presentará la simulación del sistema y sus resultados al evaluar su performance y su funcionalidad con respeto al ayudar a personas que padecen de cuadriplejia ya sea en la realización independiente de ciertas actividades de su vida cotidiana, como asearse o alimentarse. Este proyecto sumará también a la labor de diversos especialistas enfocados en ayudar psicológicamente a las personas con padecimiento de cuadriplejia, cuya esencia se basa en mejorar su autoestima, su inserción en la sociedad y sustancialmente su calidad de vida y de los que lo rodean. Mecatrónica--Biomecánica Sistemas de procesamiento de voz Robótica
8	Implementación de un algoritmo para la localización de la voz de un orador en un plano tomando como punto de referencia el nivel máximo de su patrón de radiación Pinto Valdiviezo, David Fernando 09 November 2011 (has links) Actualmente se vive en un mundo competitivo donde el conocimiento de las nuevas tecnologías y tendencias se ha convertido en la herramienta más poderosa. Las personas acuden más frecuentemente a todo tipo de conferencias y exposiciones para enterarse de los últimos avances e investigaciones en los campos que a cada uno le conciernen. Este tipo de eventos tienen lugar dentro de salas de conferencias o auditorios los cuales han sido diseñados para brindar la mejor infraestructura y acústica posible para el público usuario. Sin embargo no se ha logrado controlar los altibajos de niveles de presión sonora del micrófono del expositor producido por los movimientos naturales de su cabeza, lo cual genera problemas de inteligibilidad y distracción en el público. El objetivo de la presente tesis es localizar la dirección de mayor intensidad de la voz de un orador respecto a un punto como parte de un proyecto que pretende ecualizar un micrófono para lograr en la medida de lo posible un mismo nivel y grado de inteligibilidad durante una exposición hablada que solucione el problema antes mencionado. En el primer capítulo, se muestra información teórica sobre la voz humana y los micrófonos, puesto que es sumamente importante conocer la fuente y el receptor de señales y cómo es que interaccionan entre sí. En el segundo capítulo, se describe el marco problemático y los posibles métodos de localización para resolver el problema, además se encuentra la investigación realizada de los últimos avances en localización sonora. En el tercer capítulo, se define el método a emplear y el diseño del algoritmo que toma en cuenta los requerimientos del método y las características de la voz humana. En el cuarto capítulo se muestran los resultados de la implementación del diseño basándose en las pruebas realizadas y el costo del proyecto. Finalmente se presentan las conclusiones, las cuales muestran que se cumplieron con los objetivos planteados y se dan algunas recomendaciones para futuras investigaciones sobre el proyecto. Sistemas de procesamiento de voz Procesamiento de señales acústicas Algoritmos Micrófonos Sonido
9	Sistema de medición de la fluidez del habla en personas con tartamudez utilizando procesamiento de voz Porras Ramírez, Diego José 20 October 2020 (has links) En esta época, se han desarrollado diversas aplicaciones y sistemas que permiten mejorar la vida de las personas que han nacido u adquirido algún tipo de discapacidad con el paso de los años. En el caso de las personas cuyas discapacidades están relacionadas a la incapacidad de hablar fluidamente, las aplicaciones de entrenamiento que actualmente existen buscan hacer que el usuario practique ciertas lecturas y situaciones reales a fin de evaluar el nivel de fluidez mediante la práctica constante. Sin embargo, no todas ellas proporcionan información concisa sobre la ubicación de distorsiones y disfluencias en las cuales el tartamudo debe entrenarse. El presente trabajo comprende el diseño de un sistema de medición de la fluidez del habla mediante procesamiento de voz que, aplicando diversos algoritmos, permite a un usuario practicar, retroalimentar e identificar vocales críticas en las cuales se debe prestar mayor atención al momento de hablar. Finalmente, se analizan resultados cuantitativos provenientes de los usuarios para poder clasificar el nivel de gravedad de su tartamudez. / Tesis Sistemas de procesamiento de voz Algoritmos--Aplicaciones Trastornos del habla
10	Modelado lingüístico-prosódico para un sistema conversor texto a voz mediante concatenación de demisílabas Segura Salas, Elí Rónal 09 May 2011 (has links) El objeto principal de esta tesis ha sido el estudio del procesamiento lingüístico y prosódico en un sistema conversor de texto a voz, basado en concatenación de unidades para un hablante limeño del castellano. Basado en la información proporcionada por el estudio antes mencionado, se realizó el análisis, diseño e implementación de los módulos del procesamiento lingüísticoprosódico de un sistema conversor texto a voz; así como también, se hicieron los cambios necesarios en los módulos del sintetizador de voz, para aprovechar la información prosódica (duración segmental y contorno de frecuencia fundamental) proveniente de esos módulos. / Tesis Procesamiento de señales digitales Programación orientada a objetos Programas para computadoras--Desarrollo Reconocimiento de voz Sistemas de procesamiento de voz UML (Computación)

Search results