Spelling suggestions: "subject:"reconocimiento"" "subject:"deconocimiento""
101 |
Robust speech recognition in noisy and reverberant environments using deep neural network-based systemsNovoa Ilic, José Eduardo January 2018 (has links)
Doctor en Ingeniería Eléctrica / In this thesis an uncertainty weighting scheme for deep neural network-hidden Markov model (DNN-HMM) based automatic speech recognition (ASR) is proposed to increase discriminability in the decoding process. To this end, the DNN pseudo-log-likelihoods are weighted according to the uncertainty variance assigned to the acoustic observation. The results presented here suggest that substantial reduction in word error rate (WER) is achieved with clean training. Moreover, modelling the uncertainty propagation through the DNN is not required and no approximations for non linear activation functions are made. The presented method can be applied to any network topology that delivers log likelihood-like scores. It can be combined with any noise removal technique and adds a minimal computational cost. This technique was exhaustively evaluated and combined with uncertainty-propagation-based schemes for computing the pseudo-log-likelihoods and uncertainty variance at the DNN output. Two proposed methods optimized the parameters of the weighting function by leveraging the grid search either on a development database representing the given task or on each utterance based on discrimination metrics. Experiments with Aurora-4 task showed that, with clean training, the proposed weighting scheme can reduce WER by a maximum of 21% compared with a baseline system with spectral subtraction and uncertainty propagation using the unscented transform.
Additionally, it is proposed to replace the classical black box integration of automatic speech recognition technology in human-robot interaction (HRI) applications with the incorporation of the HRI environment representation and modeling, and the robot and user states and contexts. Accordingly, this thesis focuses on the environment representation and modeling by training a DNN-HMM based automatic speech recognition engine combining clean utterances with the acoustic channel responses and noise that were obtained from an HRI testbed built with a PR2 mobile manipulation robot. This method avoids recording a training database in all the possible acoustic environments given an HRI scenario. In the generated testbed, the resulting ASR engine provided a WER that is at least 26% and 38% lower than publicly available speech recognition application programming interfaces (APIs) with the loudspeaker and human speakers testing databases, respectively, with a limited amount of training data.
This thesis demonstrates that even state-of-the-art DNN-HMM based speech recognizers can benefit by combining systems for which the acoustic models have been trained using different feature sets. In this context, the complementarity of DNN-HMM based ASR systems trained with the same data set but with different signal representations is discussed. DNN fusion methods based on flat-weight combination, the minimization of mutual information and the maximization of discrimination metrics were proposed and tested. Schemes that consider the combination of ASR systems with lattice combination and minimum Bayes risk decoding were also evaluated and combined with DNN fusion techniques. The experimental results were obtained using a publicly-available naturally-recorded highly reverberant speech data. Significant improvements in WER were observed by combining DNN-HMM based ASR systems with different feature sets, obtaining relative improvements of 10% with two classifiers and 18% with four classifiers, without any tuning or a priori information of the ASR accuracy.
|
102 |
Modelo neurofisiológico para la difusión de información en redes socialesCleveland Ortega, Pablo Andre January 2018 (has links)
Magíster en Gestión de Operaciones / El creciente uso de los servicios de Internet, particularmente de las redes sociales
(OSN) ha generado una gran oportunidad para entender mejor el comportamiento
de los usuarios como también de los flujos de información. A pesar de que la
modelación de los flujos de información no es un tema nuevo, sí es de mucha
dificultad y gracias a la aparición de OSNs y comunidades virtuales de práctica
(VCoPs) es que ha resurgido como tema, gracias a la disponibilidad de data. Sin
embargo, la mayoría si no todos los estudios revisado solo modelan a un nivel
macroscópico, donde los grandes números absorben comportamientos indeseados
y así se reportan buenos resultados. Nuestra hipótesis es que es posible modelar
la difusión de información a nivel microscópico mediante un modelo derivado de
la neurofisiología.
El objetivo principal de este trabajo es desarrollar e implementar una metodología
para predecir el intercambio de información entre usuarios a un nivel microscópico
usando el contenido de texto mediante técnicas de Text Mining, con el _n de
apoyar el proceso de administración de una VCoP.
Para ello se propone una metodología que combina dos procesos Knowledge
Discovery in Databases (KDD) y SNA y fue aplicada sobre una VCoP real llamada
Plexilandia. En la etapa de KDD se efectuó la selección, limpieza y transformación
de los posts de los usuarios, para luego aplicar una estrategia de reducción de
contenido Latent Dirichlet Allocation (LDA), que permite describir cada post en
términos de tópicos. En la etapa de SNA se aplicó un modelo neurofisiológico de
toma de decisiones adaptado a preferencias de texto para predecir la formación de
arcos entre hilos y usuarios usando la información obtenida en la etapa anterior.
Los resultados de los experimentos muestran que es posible predecir con un
alto porcentaje de éxito, 65 a 80% cuando hay poco ruido y 40 a 60% cuando
existe elevado ruido, las interacciones entre usuarios basándose en la similaridad
de los textos producidos por ellos. Esto permite vislumbrar la forma en que se
difundirá un mensaje e identificar a usuarios que potencialmente estén interesados
en un hilo.
|
103 |
Estudio comparativo de técnicas para robustez de sistemas de verificación de locutor texto independienteFredes Sandoval, Josué Abraham January 2015 (has links)
Ingeniero Civil Electricista / Las técnicas de biometría son métodos automáticos de verificación o reconocimiento de la
identidad de una persona basándose en una característica fisiológica o de comportamiento.
En este marco se encuentra la tarea de verificación de locutor, que es el proceso de verificar
la identidad de una persona basada en su señal de voz.
Un sistema de verificación de locutor usualmente es entrenado bajo ciertas condiciones
de grabación o de canal de comunicación, y utilizar el sistema bajo otras condiciones de canal
puede ser problemático. Debido a esto se han desarrollado diversas técnicas para cancelar
o compensar el efecto del ruido y del canal, y así hacer la tecnología más robusta. En los
últimos años se han propuesto nuevas técnicas basadas en análisis factorial que intentan
modelar el efecto del canal de comunicación sobre la señal de voz.
En este trabajo se analizan en detalle dos sistemas de análisis factorial: Joint Factor
Analysis o JFA, y Total Variability Front-End Factor Analysis más conocido como i-Vectors.
Se implementaron ambos sistemas para ser integrados al conjunto de softwares para ve-
rificación de locutor del Laboratorio de Procesamiento y Transmisión de Voz, LPTV, de la
Universidad de Chile.
Los sistemas implementados se validaron usando un software de referencia que tiene
rendimiento state-of-the-art. Al utilizar las mismas condiciones iniciales de entrenamiento,
los sistemas JFA e i-Vectors desarrollados para el LPTV igualaron el rendimiento del software de referencia, validando así su implementación.
|
104 |
Improving web multimedia information retrieval using social dataBracamonte Nole, Teresa Jacqueline January 2018 (has links)
Tesis para optar al grado de Doctora en Ciencias, Mención Computación / Buscar contenido multimedia es una de las tareas más comunes que los usuarios realizan en la Web. Actualmente, los motores de búsqueda en la Web han mejorado la precisión de sus búsquedas de contenido multimedia y ahora brindan una mejor experiencia de usuarios. Sin embargo, estos motores aún no logran obtener resultados precisos para consultas que no son comunes, y consultas que se refieren a conceptos abstractos. En ambos escenarios, la razón principal es la falta de información preliminar.
Esta tesis se enfoca en mejorar la recuperación de información multimedia en la Web usando datos generados a partir de la interacción entre usuarios y recursos multimedia. Para eso, se propone mejorar la recuperación de información multimedia desde dos perspectivas: (1) extrayendo conceptos relevantes a los recursos multimedia, y (2) mejorando las descripciones multimedia con datos generados por el usuario. En ambos casos, proponemos sistemas que funcionan independientemente del tipo de multimedia, y del idioma de los datos de entrada.
En cuanto a la identificación de conceptos relacionados a objetos multimedia, desarrollamos un sistema que va desde los resultados de búsqueda específicos de la consulta hasta los conceptos detectados para dicha consulta. Nuestro enfoque demuestra que podemos aprovechar la vista parcial de una gran colección de documentos multimedia para detectar conceptos relevantes para una consulta determinada. Además, diseñamos una evaluación basada en usuarios que demuestra que nuestro algoritmo de detección de conceptos es más sólido que otros enfoques similares basados en detección de comunidades.
Para mejorar la descripción multimedia, desarrollamos un sistema que combina contenido audio-visual de documentos multimedia con información de su contexto para mejorar y generar nuevas anotaciones para los documentos multimedia. Específicamente, extraemos datos de clicks de los registros de consultas y usamos las consultas como sustitutos para las anotaciones manuales. Tras una primera inspección, demostramos que las consultas proporcionan una descripción concisa de los documentos multimedia.
El objetivo principal de esta tesis es demostrar la relevancia del contexto asociado a documentos multimedia para mejorar el proceso de recuperación de documentos multimedia en la Web. Además, mostramos que los grafos proporcionan una forma natural de modelar problemas multimedia. / Fondef D09I-1185, CONICYT-PCHA/Doctorado Nacional/2013-63130260, Apoyo a estadías corta de la Escuela de Postgrado de la U. de Chile, y el Núcleo Milenio CIWS
|
105 |
Modelo Tecnológico de Reconocimiento Facial para la Identificación de Pacientes en el Sector SaludLa Madrid Arroyo, Diego Alonso, Barriga Rivera, Martín Humberto 01 December 2019 (has links)
El fraude médico y los ciberataques en el sector sanitario son fenómenos en aumento. La suplantación de identidad es una modalidad de fraude que tiene como propósito asumir la identidad de otra persona en una institución médica para obtener bienes y servicios médicos a las aseguradoras presentando reclamaciones falsas obteniendo un beneficio económico. Por lo tanto, afecta a la población asegurada ya que involucra un monto invertido, tiempo y servicio brindado. Sólo es necesario presentar documentos de identidad para ser atendido, la cual puede ser una medida de verificación y validación de alto riesgo para el paciente si se trata de algún fraude, debido a que cuando una persona usa la identidad médica de la víctima para obtener servicios médicos o medicamentos con receta, esa información se incorpora a la historia clínica electrónica de la víctima y puede complicar su atención médica en el futuro. Identificar al paciente de forma segura e inequívoca es de vital importancia para el paciente, impidiendo que nadie pueda suplantar su identidad.
El presente proyecto detalla el desarrollo de un modelo tecnológico que tiene como objetivo la identificación de pacientes mediante un servicio cognitivo de reconocimiento facial en Cloud computing para cubrir la necesidad que tienen los sectores de salud de prevenir la suplantación de identidad. Además, en caso de emergencias, se alerta a los parientes del paciente identificado el estado de salud en el que se encuentra mediante un mensaje de texto. Se espera que el modelo les permita a los pacientes ser atendidos sin la necesidad de contar con un documento de identidad en caso se encuentren en estado de emergencia y prevenir fraudes como las suplantaciones de identidad. Finalmente, se definirá un plan de continuidad que contenga mecanismos de respaldo en tiempo real para la disponibilidad y confiabilidad. Asimismo, se contará con recursos a nivel de software, los cuales serán detallados en base a características, especificaciones y uso. / Medical fraud and cyber-attacks in the health sector are increasing phenomena. Impersonation is a form of fraud whose purpose is to assume the identity of another person in a medical institution to obtain medical goods and services to insurers by presenting false claims obtaining an economic benefit. Therefore, it affects the insured population as it involves an amount invested, time and service provided. It is only necessary to present identity documents to be treated, which can be a measure of verification and validation of high risk for the patient if it is a fraud, because when a person uses the victim's medical identity to obtain services doctors or prescription drugs, that information is incorporated into the victim's electronic medical record and may complicate their medical care in the future. Identifying the patient safely and unequivocally is of vital importance to the patient, preventing anyone from supplanting their identity.
This project details the development of a technological model that aims to identify patients through a cognitive facial recognition service on cloud computing to cover the need of health sectors to prevent phishing. In addition, the closest relatives of the identified patient will be alerted to the state of health in which they are in a text message. The model is expected to allow patients to be treated without the need to have an identity document in case they are in a state of emergency and prevent fraud such as phishing. Finally, a continuity plan will be defined that contains real-time backup mechanisms for availability and reliability. Also, there will be resources at the software level, which will be detailed based on features, specifications and use. / Tesis
|
106 |
El control difuso en los procesos de filiación de paternidad y la protección del derecho a la identidad como derecho fundamentalMaza Lupuche, Juan Arturo January 2019 (has links)
Plantea aportes significativos sobre el el control difuso en los procesos de filiación de paternidad y la protección del derecho a la identidad como derecho fundamental, en el contexto de la legislación civil vigente. Para ello, se utilizó la metodología de la investigación científica, que permite cumplir de manera óptima los aspectos importantes del estudio. A su vez, en el presente estudio se utilizó el tipo de investigación dogmático - jurídica. Las técnicas del estudio están conformadas por el análisis documental, el análisis de la legislación y el análisis de la jurisprudencia. Los instrumentos del estudio están conformados por la doctrina, la legislación y la jurisprudencia. En la doctrina nacional y comparada se obtienen los diferentes puntos de vista sobre el Control Difuso aplicado a los proceso de filiación de paternidad, que posteriormente son analizados de modo oportuno en el contenido del estudio, con sus respectivas interpretaciones. En adición, el análisis dogmático jurídico del estudio fue efectuado de forma ordenada dentro del Estado de la Cuestión para luego exponer las consecuencias de su implementación. Para finalizar, se presentan las conclusiones que se dan como resultado del desarrollo de la investigación, que se pueden aplicar en los procesos de filiación de paternidad. Con esto, se facilitan las recomendaciones, que se consideran como factibles y aplicables a los problemas frecuentes que se presentan en los juzgados. / Tesis
|
107 |
A statistical pattern recognition approach to symbolic music classificationPonce de León Amador, Pedro José 26 September 2011 (has links)
No description available.
|
108 |
Filtro adaptivo LMS y su aplicación en el reconocimiento de palabras aisladas para el control de un equipo de sonido por medio de la vozSimón Bendezú, Giovani Said 09 May 2011 (has links)
Esta investigación intenta mejorar el porcentaje de aciertos de un sistema de reconocimiento ante la presencia de ruido, y por tal motivo se va a intentar controlar un equipo de sonido marca Panasonic y modelo SC-AK45 con control remoto modelo EUR644853, del cual se tomarán algunas de las funciones para el control mediante la voz.
|
109 |
Modelo de entonación para un sintetizador de voz con aplicación a un sistema de información vía telefónica en cinesFlores Álvarez, Crisaida Marlit 10 February 2010 (has links)
Los sistemas de diálogo vía telefónica son desarrollos en los cuales la computadora
emula el comportamiento humano para dar respuesta a la consulta del usuario. En
este contexto, la entonación con la cual la computadora emita la respuesta, tiene un
papel importante, pues es el factor que dotará de naturalidad al sistema. En tanto
esté bien modelada, la entonación permitirá que para el usuario sea casi imperceptible
la diferencia entre una voz de persona y una voz sintética.
|
110 |
Comprendre l’exclusion sociale à la lumière de la reconnaissance : réflexions théoriques sur l’approche d’Axel Honneth et illustration à partir d’une étude de cas à Bogotá / Understanding social exclusion in the light of recognition : theoretical exploration of Axel Honneth's approach based on a case study in Bogotá / Entender la exclusión social a través del reconocimiento : reflexiones sobre la teoría de Axel Honneth e ilustración basada en un estudio de caso en BogotáCarrillo, Juan 12 January 2012 (has links)
Aujourd’hui, le concept d’exclusion sociale est ambigu, voire banalisé, alors que le processus même affecte des millions d’individus. La plupart des études en sociologie et en politiques sociales dont il est l’objet s’adonnent principalement à une analyse de sa dimension matérielle (et objective). Malgré l’avancée et l’importance de ces études, il existe une dimension symbolique (et subjective) à nos yeux très partiellement explorée jusqu’alors, et qui permettrait de mieux appréhender le processus d’exclusion en termes relationnels. Notre travail se propose d’examiner avec précision cette dimension symbolique dont le contenu moral suggère que l’exclusion peut être conçue comme le signe d’une injustice et plus précisément le signe d’une situation de non-reconnaissance.Ainsi, en faisant appel aux réflexions du philosophe allemand Axel Honneth sur la notion de reconnaissance, et plus particulièrement sur les catégories définies comme étant de « non-reconnaissance », nous traçons de manière critique le chemin théorique qui conduit à une lecture de l’exclusion sociale à la lumière de l’approche honnethienne de la reconnaissance, c’est-à-dire, à une analyse de l’exclusion en termes de non-reconnaissance. En outre, notre travail vise à illustrer le lien entre exclusion sociale et reconnaissance à partir d’une étude de terrain basée sur 40 entretiens réalisés entre juin 2007 et mars 2009 à Bogotá en Colombie. Ceci nous permettra non seulement d’analyser le « caractère opératoire » de la reconnaissance, mais surtout de voir jusqu’à quel point la démarche entreprise favorise la découverte de nouvelles compréhensions du processus d’exclusion, compréhensions sans lesquelles une analyse « opératoire » resterait incomplète.La première partie de cette thèse offre un aperçu général des concepts d’exclusion et de reconnaissance selon l’idée qu’au sein de la dimension symbolique de l’exclusion se révèle un contenu moral que nous nous proposons d’examiner à partir de l’approche de la reconnaissance d’Axel Honneth. La deuxième partie s’attache à l’étude de ce contenu moral ainsi que des éléments qui permettent de faire une lecture de l’exclusion selon les travaux de Honneth. Cette lecture théorique est illustrée sur le terrain comme le montre la présentation de notre étude de cas à Bogotá. La troisième partie examine, à travers l’analyse des entretiens, dans quelle mesure le potentiel heuristique de l’approche honnethienne favorise la compréhension du processus d’exclusion sociale. / The concept of social exclusion might nowadays seem ambiguous and banal, but its underlying processes affect millions of people. The majority of studies in sociology and social policy about the topic mainly analyze its material (and objective) dimension. Despite the progress and importance of these studies, there is also a symbolic (and subjective) dimension to social exclusion – a dimension which has in our opinion only been partially explored and could help to grasp the processes of exclusion from a relational point of view. Our work attempts to examine this symbolic dimension, the moral content of which suggests that exclusion can be perceived as a sign of injustice and more precisely, as a sign of non-recognition.Based on the reflections of the German philosopher Axel Honneth on the notion of recognition, and more precisely on the categories defined as “non-recognition”, we critically draw the theoretical path towards understanding social exclusion in the light of the Honnethian approach to recognition, i.e. towards an analysis of exclusion in terms of non-recognition. Our work also aims to illustrate the link between social exclusion and recognition through a field study consisting of 40 interviews carried out between June 2007 and March 2009 in Bogotá, Colombia. This will not only allow us to analyze the “operational character” of recognition, but more still, to explore to what extent our approach fosters the discovery of new understandings of the process of exclusion, without which a merely “operational” analysis would remain incomplete.The first part of this thesis presents a general overview of the concepts of exclusion and recognition according to the idea that the symbolic dimension of exclusion reveals a moral content that we aim to examine through Axel Honneth’s approach. The second part focuses on examining this moral content as well as the elements that allow an analysis of exclusion following this approach. This analysis is both theoretical and practical as shown by our field study in Bogotá. Finally, the third part uses the interviews to explore to what extent the heuristical potential of the Honnethian approach helps understanding the process of social exclusion. / Hoy en día, aunque el concepto de exclusión social es ambiguo, al punto de parecer banal, el proceso al que está asociado afecta millones de personas. La mayoría de los estudios sociológicos y de políticas sociales sobre este proceso suelen hacer énfasis en una dimensión material (y objetiva). Sin embargo, pese a la importancia de estos estudios, existe también una dimensión simbólica (y subjetiva) la cual, desde nuestro punto de vista, no ha sido lo suficientemente explorada y permitiría una mejor comprensión del proceso de exclusión en términos relacionales. Nuestro trabajo busca examinar esta dimensión simbólica tomando en cuenta su contenido moral, el cual sugiere que la exclusión puede ser considerada como el signo de una injusticia, y más aún como el signo de una situación de no reconocimiento.De esta manera, tomando como base las reflexiones del filósofo alemán Axel Honneth sobre la noción de reconocimiento, y de manera más precisa las categorías de “no reconocimiento”, nuestro trabajo marca, con sentido crítico, las pautas del camino teórico que permiten une lectura más precisa de la exclusión social a la luz del estudio honnethiano del reconocimiento, o dicho de otra forma, releva con precisión el camino hacia un análisis de la exclusión social en términos de no reconocimiento. Además, nuestro trabajo busca ilustrar la relación entre exclusión social y reconocimiento por medio de un estudio de caso basado en 40 entrevistas realizadas entre junio de 2007 y marzo de 2009 en Bogotá (Colombia). Dicha ilustración nos permite no sólo analizar el “carácter operativo” del reconocimiento, sino también observar hasta qué punto nuestro trabajo facilita descubrir nuevas comprensiones sobre el proceso de exclusión sin las cuales el análisis “operativo” resulta incompleto.La primera parte presenta una visión global de los conceptos de exclusión y reconocimiento, según la cual la dimensión simbólica de la exclusión revela un contenido moral que proponemos examinar a partir del estudio de Honneth. La segunda parte está consagrada a estudiar dicho contenido moral, así como los elementos que hacen posible un análisis de la exclusión basado en los trabajos de Honneth. Se trata de un análisis teórico ilustrado gracias a un estudio de caso en Bogotá. La tercera parte examina, por medio de una serie de entrevistas, hasta dónde el potencial heurístico de la teoría de Honneth favorece la comprensión del proceso de exclusión social y su eventual atenuación para permitir un análisis más acertado de un fenómeno que requiere considerar su dimensión simbólica, poniendo de presente lo sugerido por el contenido moral que esta tesis expone.
|
Page generated in 0.0813 seconds