• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • 1
  • 1
  • Tagged with
  • 7
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

A principled approach to the design of auditory interaction in the non-visual user interface

Mitsopoulos, Evangelos Nikolaos January 2000 (has links)
No description available.
2

Trackbot : acoustic tracking with a peoplebot

Murray, John Christopher January 2006 (has links)
No description available.
3

A computational model of auditory feature extraction and sound classification

Coath, Martin January 2005 (has links)
This thesis introduces a computer model that incorporates responses similar to those found in the cochlea, in sub-corticai auditory processing, and in auditory cortex. The principle aim of this work is to show that this can form the basis for a biologically plausible mechanism of auditory stimulus classification. We will show that this classification is robust to stimulus variation and time compression. In addition, the response of the system is shown to support multiple, concurrent, behaviourally relevant classifications of natural stimuli (speech). The model incorporates transient enhancement, an ensemble of spectro - temporal filters, and a simple measure analogous to the idea of visual salience to produce a quasi-static description of the stimulus suitable either for classification with an analogue artificial neural network or, using appropriate rate coding, a classifier based on artificial spiking neurons. We also show that the spectotemporal ensemble can be derived from a limited class of 'formative' stimuli, consistent with a developmental interpretation of ensemble formation. In addition, ensembles chosen on information theoretic grounds consist of filters with relatively simple geometries, which is consistent with reports of responses in mammalian thalamus and auditory cortex. A powerful feature of this approach is that the ensemble response, from which salient auditory events are identified, amounts to stimulus-ensemble driven method of segmentation which respects the envelope of the stimulus, and leads to a quasi-static representation of auditory events which is suitable for spike rate coding. We also present evidence that the encoded auditory events may form the basis of a representation-of-similarity, or second order isomorphism, which implies a representational space that respects similarity relationships between stimuli including novel stimuli.
4

Αναγνώριση φύλου μέσω ομιλίας

Βασιλόπουλος, Χρήστος 20 October 2010 (has links)
Η παρούσα διπλωματική εργασία αναφέρεται σε ένα αυτόματο σύστημα αναγνώρισης με χρήση της ομιλίας, και πιο συγκεκριμένα σε ένα σύστημα αναγνώρισης φύλου μέσω ομιλίας. Αναλύεται η δομή του, περιγράφεται η λειτουργία του και δίνονται οι λεπτομέρειες κάθε τμήματος του. Αρχικά, η εργασία επικεντρώνεται στην προεπεξεργασία του σήματος ομιλίας και στην εξαγωγή των κατάλληλων παραμέτρων, οι οποίες θα μπορέσουν να χαρακτηρίσουν κάθε φύλο. Στη συνέχεια, περιγράφεται η διαδικασία ταξινόμησης του συστήματος, οι αλγόριθμοι που χρησιμοποιούνται και στο τέλος παρουσιάζονται τα ποσοστά επιτυχίας. Τα αποτελέσματα υποδεικνύουν και το βέλτιστο σύνολο παραμέτρων ομιλίας για αξιόπιστη αναγνώριση φύλου. / The purpose of this diploma thesis is the study of a gender recognition system based on speech. More specifically the system’s structure is analyzed, its functions are described and details regarding every single part are given. We focus on the preprocessing of the speech signal and the definition of the appropriate parameters that characterize every gender. Moreover, the methods, which are used for classification during the experimental setup, are described and be presented with their results. These results also suggest the optimized speech parameters appropriate for reliable gender recognition.
5

Représentation de signaux robuste aux bruits - Application à la détection et l'identification des signaux d'alarme / Signals representation robust to noise - Application to the detection and identification of alarm signals

El jili, Fatimetou 17 December 2018 (has links)
Ces travaux ont pour application la détection l'identification des signaux audio et particulièrement les signaux d'alarmes de voitures prioritaires. Dans un premier temps, nous proposons une méthode de détection des signaux d'alarme dans un environnement bruité, fondée sur des techniques d'analyse temps-fréquence des signaux. Cette méthode permet de détecter et d'identifier des signaux d'alarmes noyés dans du bruit, y compris pour des rapports signal à bruit négatifs. Puis nous proposons une quantification des signaux robuste aux bruits de transmission. Il s'agit de remplacer chaque niveau de bit d'un vecteur d'échantillons temporels ou fréquentiels par un mot binaire de même longueur fourni par un codeur correcteur d'erreur. Dans une première approche, chaque niveau de bits est quantifié indépendamment des autres selon le critère de minimisation de la distance de Hamming. Dans une seconde approche, pour réduire l'erreur de quantification à robustesse égale, les différents niveaux de bits sont quantifiés successivement selon un algorithme de type matching pursuit. Cette quantification donne aux signaux une forme spécifique permettant par la suite de les reconnaitre facilement parmi d'autres signaux. Nous proposons donc enfin deux méthodes de détection et d'identification des signaux fondées sur la quantification robuste, opérant dans le domaine temporel ou dans le domaine fréquentiel, par minimisation de la distance entre les signaux reçus restreints à leurs bits de poids fort et les signaux de référence. Ces méthodes permettent de détecter et d'identifier les signaux dans des environnements à rapport signal à bruit très faible et ceci grâce à la quantification. Par ailleurs, la première méthode, fondée sur la signature temps-fréquence, s'avère plus performante avec les signaux quantifiés. / This work targets the detection and identification of audio signals and in particular alarm signals from priority cars. First, we propose a method for detecting alarm signals in a noisy environment, based on time-frequency signal analysis. This method makes it possible to detect and identify alarm signals embedded in noise, even with negative signal-to-noise ratios. Then we propose a signal quantization robust against transmission noise. This involves replacing each bit level of a vector of time or frequency samples with a binary word of the same length provided by an error- correcting encoder. In a first approach, each bit level is quantized independently of the others according to the Hamming distance minimization criterion. In a second approach, to reduce the quantization error at equal robustness, the different bit levels are quantized successively by a matching pursuit algorithm. This quantization gives the signals a specific shape that allows them to be easily recognized among other signals. Finally, we propose two methods for detecting and identifying signals based on robust quantization, operating in the time domain or in the frequency domain, by minimizing the distance between the received signals restricted to their high-weight bits and the reference signals. These methods make it possible to detect and identify signals in environments with very low signal-to-noise ratios, thanks to quantization. In addition, the first method, based on the time-frequency signature, is more efficient with quantized signals.
6

Κατασκευή συστήματος αναγνώρισης προτύπων ηχητικών σημάτων ανθρώπου που κοιμάται / Design of a pattern recognition system to estimate sleep sounds

Βερτεούρη, Ελένη 03 April 2012 (has links)
Το θέμα της κατασκευής ενός συστήματος αναγνώρισης προτύπων για τα ηχητικά σήματα ενός ανθρώπου που κοιμάται είναι ένα από τα ανοιχτά ζητήματα της Βιοιατρικής. Στην παρούσα διπλωματική εξετάζουμε την εξαγωγή ερμηνεύσιμων σημάτων που αντιστοιχούν στον καρδιακό ρυθμό, την αναπνοή και το ροχαλητό. Χρησιμοποιούμε μεθόδους Ανάλυσης σε Ανεξάρτητες Συνιστώσες και μεθόδους Τυφλού Διαχωρισμού που εκμεταλεύονται Στατιστικές Δεύτερης Τάξης. Συμπεραίνουμε ότι οι δεύτερες είναι οι πλέον κατάλληλες όταν συνοδεύονται από ένα στάδιο προεπεξεργασίας που αφορά ανάλυση σε ζώνες συχνοτήτων. / The design of a non-intrusive Pattern Recognition System to estimate the sleep sounds is an open problem of Bioengineering. We use recordings from body-sensors to estimate the heart beat, the breathing and the snoring. In this thesis we examine the effectiveness of Independent Component Analysis for this Blind Source Separation Problem and we compare it with methods that perform Source Separation using Second Order Statistics. We take into account the temporal structure of the sources as well as the presence of noise. Our system is greatly improved by a preprocessing stage of targeted subband decomposition which uses a priori knowledge about the sources. We propose an efficient solution to this problem which is confirmed by medical data.
7

Dynamic sound rendering of complex environments / Rendu sonore dynamique d'environnements complexes

Loyet, Raphaël 18 December 2012 (has links)
De nombreuses études ont été menées lors des vingt dernières années dans le domaine de l’auralisation.Elles consistent à rendre audible les résultats d’une simulation acoustique. Ces études se sont majoritairementfocalisées sur les algorithmes de propagation et la restitution du champ acoustique dans desenvironnements complexes. Actuellement, de nombreux travaux portent sur le rendu sonore en tempsréel.Cette thèse aborde la problématique du rendu sonore dynamique d’environnements complexes selonquatre axes : la propagation des ondes sonores, le traitement du signal, la perception spatiale du son etl’optimisation informatique. Dans le domaine de la propagation, une méthode permettant d’analyser lavariété des algorithmes présents dans la bibliographie est proposée. A partir de cette méthode d’analyse,deux algorithmes dédiés à la restitution en temps réel des champs spéculaires et diffus ont été extraits.Dans le domaine du traitement du signal, la restitution est réalisée à l’aide d’un algorithme optimisé despatialisation binaurale pour les chemins spéculaires les plus significatifs et un algorithme de convolutionsur carte graphique pour la restitution du champ diffus. Les chemins les plus significatifs sont extraitsgrace à un modèle perceptif basé sur le masquage temporel et spatial des contributions spéculaires.Finalement, l’implémentation de ces algorithmes sur des architectures parallèles récentes en prenant encompte les nouvelles architectures multi-coeurs et les nouvelles cartes graphiques est présenté. / During the past twenty years many studies have been conducted in the field of auralization, which aimsat rendering audible the results of an acoustic simulation. These studies have mainly focused on thepropagation algorithms and the sound field audio rendering for complex environments. Currently, muchresearch concentrates on real-time audio rendering.This thesis addresses the problematic of real-time audio rendering of complex environments accordingto four axes: sound propagation, Digital Signal Processing (DSP), spatial perception of sound andcomputational optimizations. In the field of propagation, a method that aims at analyzing the varietyof existing algorithms is proposed. This method yields two algorithms dedicated to the real-time propagationof both specular and diffuse information. In the field of DSP, the auralization is performed withan efficient binaural spatialization module for the most significant specular information, and a GPUconvolution algorithm for the diffuse sound field auralization. The most significant paths are extractedthanks to a perceptive model based on temporal and spatial masking of the specular contributions.Finally, the implementation of these algorithms on recent computer architectures, taking advantage ofthe parallel processing of the new CPUs, and the benefits of GPUs for DSP calculations is presented.

Page generated in 0.0505 seconds