• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 14
  • Tagged with
  • 14
  • 14
  • 14
  • 10
  • 9
  • 6
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Plataforma de aprendizaje de segundo idioma con ASR

Olivares Cotal, José Luis January 2013 (has links)
Ingeniero Civil Electricista / Las redes de datos que permiten acceder a la información desde cualquier lugar del mundo están cada vez más cerca del publico en general. Este hecho, asociado al empleo de browser o navegadores ampliamente difundidos y de fácil uso, posibilita el desarrollo de sistema de enseñanza en linea. Esta memoria se centra en el desarrollo de una plataforma de enseñanza basada en las redes y sistemas Web. Se emplea la técnica de Reconocimiento Automático de Voz (Automatic Speech Recognition, ASR), una base de datos relacional llamada Postgresql y un servidor HTTP cuyo nombre es Tomcat. Para el desarrollo se emplearon lo modelos Cliente Servidor, Vista Controlador y la Arquitectura AJAX. La estructura de la base de datos y las lecciones se diseñaron de manera que futuras revisiones se puedan realizar con facilidad. Se destaca el empleo de un formato ligero y compatible para la transferencia de datos por medio de JavaScript Object Notation. El programa permite el almacenamiento de las lecciones, el registro de la información de uso y el envío-recepción de datos asincrónicos entre el servidor y el cliente. El trabajo finaliza con un análisis de estabilidad y robustez del sistema por medio de la carga de 150 usuarios simultáneos. Para realizar esta prueba fue empleado Jmeter, un software gráfico para el análisis de carga y desempeño de sistemas Web. Como trabajo a futuro se propone el empleo de HTML5 como lenguaje de reemplazo del Applet, para el envío de los datagramas de voz. El sistema al estar basado en servicios se puede configurar para trabajar en paralelo de modo que se está frente a un sistema escalable a nivel de servicios.
12

Sistema interactivo por voz para robot PR2

Guerrero Díaz, Sebastián Adolfo January 2015 (has links)
Ingeniero Civil Eléctrico / En el marco de la línea de investigación: Interacción Humano Robot, el lenguaje es un candidato natural para la interacción con máquinas y robots. En particular las tecnologías de procesamiento y transmisión voz juegan un rol fundamental en lo que respecta al reconocimiento automático de la voz o \gls{ASR}, ya que como concepto entrega la habilidad de escuchar al momento de interaccionar con un robot.\\ El objetivo principal de esta memoria es implementar una aplicación para comandar a un \gls{PR2} a través de instrucciones por voz, utilizando arquitectura cliente-servidor mediante un micrófono como elemento para muestrear la señal de audio o comando enunciado por el usuario. \\ En el desarollo de la aplicación se crea una interfaz de interacción con el usuario que permite grabar audio usando HTML5/CSS/JS. Para el funcionamiento de la aplicación la comunicación con todos los servidores se realiza a través de \textit{socket} TCP/IP y el procesamiento de la señal de audio se realiza utilizando KALDI, estado del arte en \gls{ASR}. Luego de obtener el resultado de la transcripción de la elocución grabada por el usuario, es analizada por el \textit{Robot \gls{PR2}} y entrega la respuesta del comando de voz mediante el \gls{TTS} Festival y ejecuta el movimiento correspondiente al requerimiento del usuario.\\ A partir esta investigación y el desarrollo de la aplicación se concluye que es posible comandar el \textit{Robot \gls{PR2}} de forma exitosa mediante la interfaz de interacción con el usuario. Dicha aplicación puede ser instalada en cualquier versión del sistema operativo Ubuntu. Utilizando un modo de conexión local para los servidores: ASR y WEB, se cumple el objetivo de realizar procesamiento en tiempo real. El sistema de reconocimiento de voz obtiene un 10\% de \gls{WER} cuando es probado con el mismo micrófono con el que se construye la base de datos, que corresponde a un conjunto de 4991 elocuciones de base de datos Latino-4k y 200 elocuciones grabadas en el Laboratorio de Procesamiento y Transmisión de Voz LPTV, todas a una frecuencia de 16~kHz y 16~bit.\\ El trabajo futuro considera la realización de una base de datos independiente del hablante y género. Considerar el efecto del canal en el \gls{ASR}: ambiente y micrófonos. Debido a la forma de construcción de la aplicación, ésta es escalable ,por lo que es factible complementar el diccionario utilizado en el \gls{ASR} y la personalización de los movimientos.
13

Robustez a Variabilidad de Canal en Reconocimiento de Patrones Acústicos con Aplicaciones en Enseñanza de Idiomas y Biometría

Garretón Vender, Claudio January 2011 (has links)
No description available.
14

Diseño e implementación de una unidad de procesamiento de sonido para optimizar la comunicación de voz en mascaras de protección respiratoria

Atenas Orellana, Erik Andrés January 2012 (has links)
Ingeniero Civil Electricista / Actualmente la industria se esfuerza por disminuir la tasa de enfermedades laborales, con especial énfasis en el caso de la silicosis. Para ello el principal elemento de control es la máscara de protección respiratoria. Sin embargo ésta, introduce otro problema: bloquea la salida clara de la voz e impide la comunicación. Además, como el ambiente está dominado por altos niveles ruido, los trabajadores optan por no usarla a la hora de transmitir los mensajes, perdiendo toda protección. En este contexto nace la idea de resolver esta disyuntiva: proteger y simultáneamente permitir la comunicación. El objetivo de este trabajo es desarrollar un nuevo dispositivo para máscaras respiratorias, que permita comunicarse por voz sin la necesidad de quitársela. Estando además acoplado a los sistemas de radios portátiles, permite la comunicación sin tener que hacer uso del botón push-to-talk , liberando al operario de tener que ocupar sus manos al comunicarse. Se propone una solución en forma de un detector de comandos de voz que active/desactive el canal. Para ello, se analiza la necesidad de mejorar la calidad del audio ante efectos como la respiración del operario y ruidos externos. El trabajo se divide en cuatro etapas: cancelación de ruido, para disminuir los niveles de ruido externo que enmascaran la voz; filtrado de señales, para disminuir el paso de sonidos molestos que no estén en el rango de la voz; reconocimiento de voz, para crear un detector de comandos y finalmente, la activación del canal, con el propósito de abrir el canal de la radio con la voz remplazando al botón push-to-talk . Los resultados indican que es posible reducir hasta en 20 dB los niveles de ruido externo manteniendo los de la voz, bajo ruido ambiental de hasta 100 dB. El filtrado elimina considerablemente las frecuencias de audio no deseadas, pudiéndose aplicar en diferentes rangos volviendo el sistema adaptable. El detector de comandos en ambientes con bajos niveles de ruido funciona correctamente. Sin embargo, para aquellos en los cuales las condiciones de ruido son muy adversas los resultados no son tan positivos. La activación del canal de comunicación logra el objetivo final y ante un correcto reconocimiento abre la comunicación entre las radios. Dado que el sistema de activación entrega la suficiente independencia como para ser integrado a cualquier dispositivo, se propone controlar otros sistemas de interés a través comandos de voz dictados desde la máscara. De todos modos, como punto de partida, debe considerar la mejora del sistema de reconocimiento por uno mas robusto que no falle ante condiciones de ruido extremo.

Page generated in 0.249 seconds