• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 40
  • 4
  • Tagged with
  • 44
  • 20
  • 14
  • 12
  • 12
  • 8
  • 8
  • 7
  • 6
  • 6
  • 6
  • 6
  • 6
  • 6
  • 6
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Μοdelling, analysis, and processing of room responses and reverberant signals / Μοντελοποίηση, ανάλυση και επεξεργασία ακουστικών αποκρίσεων και σημάτων σε συνθήκες αντήχησης

Γεωργαντή, Ελευθερία 16 May 2014 (has links)
The main focus of this thesis is to analyse signals (signal-dependent analysis) and room responses (system-dependent analysis) from a statistical point of view, attempt to determine the underlying statistical relationships between the reverberant signals and the room responses and propose relevant statistical models. Based on such a statistical framework, this thesis aims to propose novel methodologies for the extraction of room acoustical information and parameters from reverberant signals. Schroeder's theory is experimentally evaluated for various Room Transfer Functions (RTFs) measured in many source/receiver positions in various enclosures and several related aspects are discussed. Using a statistical approach, the effects of reverberant energy on the histograms and statistical measures are discussed and models describing the relationship of statistical measures between the reverberant signal and the RTFs are extracted. Then, the statistical properties of Binaural Room Transfer Functions (BRTFs) and binaural cues are examined. The well-known property of the spectral standard deviation of the magnitude of RTFs, that is its convergence to 5.6 dB for diffuse fields, is examined for the case of BRTFs, using a similar approach and a generic model for the relationship of the spectral standard deviation of RTFs and BRTFs. This thesis is also concerned with the distance estimation problem from a perceptual and computational point of view. Two novel methods for the estimation of the source/receiver distance using speech signals are proposed. The first method is able to detect the distance between the speaker and the microphone in a room environment using single-channel signals. The distance-dependent variation of several temporal and spectral statistical features of single-channel signals is studied and a novel sound source distance detector, based on these features is developed. The second method estimates distance from binaural speech signals (two-channel signals). This method does not require a priori knowledge of the room impulse response, the reverberation time or any other acoustical parameter and relies on a set of novel features extracted from the reverberant binaural signals. For this method, a novel distance estimation feature is introduced exploiting the standard deviation of the difference of the magnitude spectra of the left and right binaural signals (termed here as Binaural Spectral Magnitude Difference Standard Deviation (BSMD STD)). Moreover, an extended and novel set of additional features based on the statistical properties of binaural cues (ILDs, ITDs, ICs) is extracted from an auditory front-end which models the peripheral processing of the human auditory system. Both methods rely on novel distance-dependent features, related to statistical parameters of speech signals. Finally, a novel method for the estimation of the direct-to-reverberant-ratio (DRR) from dual-channel microphone recordings without having knowledge of the source signal is presented. / Η παρούσα διατριβή ασχολείται με τη μελέτη και ανάλυση των στατιστικών χαρακτηριστικών ηχητικών σημάτων και των ακουστικών αποκρίσεων χώρου, έχοντας ως πρωταρχικό σκοπό να προτείνει σχέσεις που περιγράφουν τη συσχέτιση των στατιστικών χαρακτηριστικών των σημάτων με αντήχηση με τις ακουστικές αποκρίσεις χώρων. Βάσει ενός τέτοιου θεωρητικού πλαισίου, η διατριβή αυτή αποσκοπεί στο να προτείνει νέες μεθοδολογίες για την εξαγωγή πληροφορίας που σχετίζεται με τα ακουστικά χαρακτηριστικά των χώρων, κάνοντας χρήση ηχογραφημένων ηχητικών σημάτων (π.χ. σήματα ομιλίας) στους εκάστοτε κλειστούς χώρους. Το θεωρητικό υπόβαθρο αυτής της διατριβής βασίζεται σε υπάρχοντα θεωρητικά μοντέλα για το ηχητικό πεδίο μέσα σε ένα κλειστό χώρο, όπως, για παράδειγμα, το στατιστικό μοντέλο του Schroeder. Το μοντέλο του Schroeder επιβεβαιώνεται πειραματικά για ακουστικές αποκρίσεις που έχουν μετρηθεί σε διάφορες θέσεις, μέσα σε κλειστούς χώρους, οι οποίοι διαφέρουν στα ακουστικά χαρακτηριστικά τους. Βάσει στατιστικής ανάλυσης, εξάγονται στατιστικά μοντέλα, τα οποία περιγράφουν την επίδραση της αντήχησης στα ηχητικά σήματα, όταν αυτά αναπαραχθούν μέσα σε ένα κλειστό χώρο. Στη συνέχεια, λαμβάνοντας υπόψη αντιληπτικά μοντέλα ακοής, τα οποία προϋποθέτουν την ύπαρξη δυο ηχητικών σημάτων (δυο αυτιά, αμφιωτική ακοή) σε αυτή τη διατριβή, μελετώνται κάποιες παράμετροι οι οποίες εξάγονται από αμφιωτικές ακουστικές αποκρίσεις χώρου. Η ιδιότητα της φασματικής τυπικής απόκλισης συναρτήσεων μεταφοράς χώρων να συγκλίνει στην τιμή των 5.6~dB για διάχυτα ηχητικά πεδία, επεκτείνεται στην περίπτωση των αμφιωτικών αποκρίσεων χώρου και προτείνεται ένα γενικευμένο μοντέλο που συσχετίζει τη φασματική τυπική απόκλιση μονοφωνικών και αμφιωτικών συναρτήσεων μεταφοράς χώρου. Η διατριβή αυτή, επίσης, ασχολείται με το πρόβλημα της εκτίμησης της απόστασης μεταξύ πηγής και δέκτη. Προτείνονται δυο νέες μέθοδοι για την εκτίμηση της απόστασης μεταξύ πηγής και δέκτη, κάνοντας χρήση ηχητικών σημάτων ομιλίας. Η προτεινόμενη μέθοδος βασίζεται σε μια σειρά από στατιστικές παραμέτρους των οποίων οι τιμές μεταβάλλονται είτε στο πεδίο του χρόνου είτε στο πεδίο της συχνότητας. Η δεύτερη προτεινόμενη μέθοδος αφορά, επίσης, στην εκτίμηση της απόστασης πηγής/δέκτη, αλλά από αμφιωτικά σήματα. Η μέθοδος αυτή δεν προαπαιτεί γνώση της ακουστικής απόκρισης του χώρου, του χρόνου αντήχησης ή άλλης ακουστικής παραμέτρου και βασίζεται σε μια σειρά από νέες παραμέτρους, οι οποίες μπορούν να υπολογισθούν από τα αμφιωτικά σήματα με αντήχηση. Οι παράμετροι συνδυάζονται με δυο διαφορετικές τεχνικές αναγνώρισης προτύπων των οποίων τα μειονεκτήματα και πλεονεκτήματα συζητώνται. Στα πλαίσια αυτής της μεθόδου, προτείνεται μια νέα παράμετρος, η οποία βασίζεται στη διαφορά της φασματικής τυπικής απόκλισης του αριστερού και του δεξιού αμφιωτικού ηχητικού σήματος, η οποία αποδεικνύεται ότι σχετίζεται με τα στατιστικά της αντίστοιχης μονοφωνικής ακουστικής απόκρισης. Τέλος, προτείνεται μια σειρά από παραμέτρους οι οποίες βασίζονται στα στατιστικά χαρακτηριστικά αμφιωτικών παραμέτρων και σχετίζονται με το αντιληπτικό μοντέλο της ανθρώπινης ακοής. Τέλος, προτείνεται μια νέα μέθοδος για την εκτίμηση της στάθμης λόγου κατευθείαν προς ανακλώμενου ήχου από στερεοφωνικά σήματα.
42

Χρήση μεθόδων συνοριακών στοιχείων και τοπικών ολοκληρωτικών εξισώσεων χωρίς διακριτοποίηση για την αριθμητική επίλυση προβλημάτων κυματικής διάδοσης σε εφαρμογές μη-καταστροφικού ελέγχου

Βαβουράκης, Βασίλειος 18 August 2008 (has links)
Ο στόχος της παρούσας διδακτορικής διατριβής είναι διττός: η ανάπτυξη και η εφαρμογή αριθμητικών τεχνικών για την επίλυση προβλημάτων που εμπίπτουν στην περιοχή του Μη-Καταστροφικού Ελέγχου. Συγκεκριμένα αναπτύχθηκαν η Μέθοδος των Συνοριακών Στοιχείων (ΜΣΣ) και η Μέθοδος των Τοπικών Ολοκληρωτικών Εξισώσεων χωρίς Διακριτοποίηση για την αριθμητική ανάλυση στατικών και μεταβατικών προβλημάτων στο πεδίο της ελαστικότητας και της αλληλεπίδρασης ελαστικού με ακουστικό μέσο στις δύο διαστάσεις. Σημαντικό μέρος της διδακτορικής διατριβής αποτέλεσε η ανάπτυξη προγράμματος ηλεκτρονικού υπολογιστή, το οποίο επιλύει τα προβλήματα στα οποία πραγματεύεται το παρόν σύγγραμμα. Η διδακτορική διατριβή αποτελείται από τρεις ενότητες. Στην πρώτη ενότητα γίνεται πλήρης περιγραφή της απαραίτητης θεωρίας για την κάλυψη και κατανόηση των αριθμητικών ΜΣΣ αλλά και των Τοπικών Μεθόδων χωρίς Διακριτοποίηση (ΤΜχΔ). Στη δεύτερη ενότητα εφαρμόζονται οι προαναφερθείσες αριθμητικές μέθοδοι για την επίλυση στατικών και δυναμικών (στο πεδίο συχνοτήτων) διδιάστατων προβλημάτων, ώστε να πιστοποιηθεί η ακρίβεια και η αξιοπιστία των εν λόγω μεθοδολογιών. Τέλος, στην τρίτη ενότητα οι αριθμητικές ΜΣΣ και ΤΜχΔ εφαρμόζονται για την επίλυση προβλημάτων κυματικής διάδοσης που εμπίπτουν στο πεδίο του Μη-Καταστροφικού Ελέγχου. Πιο συγκεκριμένα μελετήθηκε η κυματική διάδοση σε ελεύθερες επίπεδες πλάκες και σε κυλινδρικές δεξαμενές αποθήκευσης υγρών καυσίμων. / The aim of this doctoral thesis is twofold: the development and implementation of numerical techniques for solving wave propagation problems in Non-Destructive Testing applications. Particularly, the Boundary Element Method (BEM) and the Local Boyndary Integral Equation Method are developed, so as to numerically solve static and transient problems on the field of elasticity and fluid-structure interaction in two dimensions. A major part of the present research is the construction of a computer program for solving such kind of problems. This textbook consists of three sections. In the first section, a thorough description on the theory of the BEM and the Local Meshless Methods (LMM) is done. The second section is dedicated for the numerical implementation of the BEM and LMM for solving steady state and time-harmonic two dimensional elastic and acoustic problems, in order to verify the accuracy and the ability of the proposed methodologies to solve the above-mentioned problems. Finally in the third section, the wave propagation problems of traction-free plates and cylindrical fuel storage tanks is studied, from the perspective of Non-Destructive Testing. The numerical methods of BEM and LMM are implemented, as well as spectral methods are utilized, for drawing useful conclusions on the wave propagation phenomena.
43

Ψηφιακή επεξεργασία και αυτόματη κατηγοριοποίηση περιβαλλοντικών ήχων

Νταλαμπίρας, Σταύρος 20 September 2010 (has links)
Στο κεφάλαιο 1 παρουσιάζεται μία γενική επισκόπηση της αυτόματης αναγνώρισης γενικευμένων ακουστικών γεγονότων. Επιπλέον συζητάμε τις εφαρμογές της τεχνολογίας αναγνώρισης ακουστικού σήματος και δίνουμε μία σύντομη περιγραφή του state of the art. Τέλος, αναφέρουμε τη συνεισφορά της διατριβής. Στο κεφάλαιο 2 εισάγουμε τον αναγνώστη στο χώρο της επεξεργασίας ακουστικών σημάτων που δε περιλαμβάνουν ομιλία. Παρουσιάζονται οι σύγχρονες προσεγγίσεις όσον αφορά στις μεθοδολογίες εξαγωγής χαρακτηριστικών και αναγνώρισης προτύπων. Στο κεφάλαιο 3 προτείνεται ένα καινοτόμο σύστημα αναγνώρισης ήχων ειδικά σχεδιασμένο για το χώρο των ηχητικών γεγονότων αστικού περιβάλλοντος και αναλύεται ο σχεδιασμός της αντίστοιχης βάσης δεδομένων. Δημιουργήθηκε μία ιεραρχική πιθανοτική δομή μαζί με δύο ομάδες ακουστικών παραμέτρων που οδηγούν σε υψηλή ακρίβεια αναγνώρισης. Στο κεφάλαιο 4 ερευνάται η χρήση της τεχνικής πολλαπλών αναλύσεων όπως εφαρμόζεται στο πρόβλημα της διάκρισης ομιλίας/μουσικής. Στη συνέχεια η τεχνική αυτή χρησιμοποιήθηκε για τη δημιουργία ενός συστήματος το οποίο συνδυάζει χαρακτηριστικά από διαφορετικά πεδία με στόχο την αποδοτική ανάλυση online ραδιοφωνικών σημάτων. Στο κεφάλαιο 5 προτείνεται ένα σύστημα το οποίο εντοπίζει μη-τυπικές καταστάσεις σε περιβάλλον σταθμού μετρό με στόχο να βοηθήσει το εξουσιοδοτημένο προσωπικό στην συνεχή επίβλεψη του χώρου. Στο κεφάλαιο 6 προτείνεται ένα προσαρμοζόμενο σύστημα για ακουστική παρακολούθηση εν δυνάμει καταστροφικών καταστάσεων ικανό να λειτουργεί κάτω από διαφορετικά περιβάλλοντα. Δείχνουμε ότι το σύστημα επιτυγχάνει υψηλή απόδοση και μπορεί να προσαρμόζεται αυτόνομα σε ετερογενείς ακουστικές συνθήκες. Στο κεφάλαιο 7 ερευνάται η χρήση της μεθόδου ανίχνευσης καινοτομίας για ακουστική επόπτευση κλειστών και ανοιχτών χώρων. Ηχογραφήθηκε μία βάση δεδομένων πραγματικού κόσμου και προτείνονται τρεις πιθανοτικές τεχνικές. Στο κεφάλαιο 8 παρουσιάζεται μία καινοτόμα μεθοδολογία για αναγνώριση γενικευμένου ακουστικού σήματος που οδηγεί σε υψηλή ακρίβεια αναγνώρισης. Εκμεταλλευόμαστε τα πλεονεκτήματα της χρονικής συγχώνευσης χαρακτηριστικών σε συνδυασμό με μία παραγωγική τεχνική κατηγοριοποίησης. / The dissertation is outlined as followed: In chapter 1 we present a general overview of the task of automatic recognition of sound events. Additionally we discuss the applications of the generalized audio signal recognition technology and we give a brief description of the state of the art. Finally we mention the contribution of the thesis. In chapter 2 we introduce the reader to the area of non speech audio processing. We provide the current trend in the feature extraction methodologies as well as the pattern recognition techniques. In chapter 3 we analyze a novel sound recognition system especially designed for addressing the domain of urban environmental sound events. A hierarchical probabilistic structure was constructed along with a combined set of sound parameters which lead to high accuracy. chapter 4 is divided in the following two parts: a) we explore the usage of multiresolution analysis as regards the speech/music discrimination problem and b) the previously acquired knowledge was used to build a system which combined features of different domains towards efficient analysis of online radio signals. In chapter 5 we exhaustively experiment on a new application of the sound recognition technology, space monitoring based on the acoustic modality. We propose a system which detects atypical situations under a metro station environment towards assisting the authorized personnel in the space monitoring task. In chapter 6 we propose an adaptive framework for acoustic surveillance of potentially hazardous situations under environments of different acoustic properties. We show that the system achieves high performance and has the ability to adapt to heterogeneous environments in an unsupervised way. In chapter 7 we investigate the usage of the novelty detection method to the task of acoustic monitoring of indoor and outdoor spaces. A database with real-world data was recorded and three probabilistic techniques are proposed. In chapter 8 we present a novel methodology for generalized sound recognition that leads to high recognition accuracy. The merits of temporal feature integration as well as multi domain descriptors are exploited in combination with a state of the art generative classification technique.
44

Μοντελοποίηση και επεξεργασία ηχητικών δεδομένων για αναπαραγωγή σε χώρους με αντήχηση / Modeling and processing audio signals for sound reproduction in reverberant rooms

Ζαρούχας, Θωμάς 27 December 2010 (has links)
H διδακτορική διατριβή μελετά ζητήματα που αφορούν την ενσωμάτωση υπολογιστικών μοντέλων ακοής για την μοντελοποίηση και επεξεργασία ηχητικών σηματών για την βέλτιστη αναπαραγωγή τους σε χώρους με αντήχηση καθώς και την κωδικοποίηση ηχητικών δεδομένων. Το κύριο μέρος της διατριβής επικεντρώθηκε στην μοντελοποίηση των αντιληπτικά σημαντικών αλλοιώσεων λόγω αντήχησης, με την βοήθεια κατάλληλα οριζόμενων μόνο-ωτικών και διαφορικών ενδο-καναλικών παραμέτρων και την απεικόνιση τους με τη βοήθεια χρονο-συχνοτικών 2Δ αναπαραστάσεων. Ο λεπτομερής εντοπισμός των αλλοιώσεων στα ηχητικά σήματα μέσω του προτεινόμενου Δείκτη Επικάλυψης λόγω Αντήχησης (ΔΕΑ) διαμόρφωσε κατάλληλη μεθοδολογία ανάλυσης-σύνθεσης, για την καταστολή της αντήχησης σε συγκεκριμένες χρονο-συχνοτικές περιοχές. Το κύριο πλεονέκτημα της προτεινόμενης, εξαρτώμενης του σήματος, μεθοδολογίας είναι ότι επιτυγχάνεται η καταστολή των, με σχετική καθυστέρηση, παραμορφώσεων λόγω αντήχησης σε μια μεγαλύτερη κλίμακα, δεδομένου ότι μόνο οι αντιληπτικά σημαντικές περιοχές του σήματος επηρεάζονται από την επεξεργασία. Επιπλέον, αναζητήθηκε η δυνατότητα ανάλυσης των ηχητικών δεδομένων με βάση τις εσωτερικές τους αναπαραστάσεις (όπως δηλαδή τις παρέχει το υπολογιστικό μοντέλο ακοής) με εφαρμογή στην περιοχή της κωδικοποίησης σημάτων. Ο προτεινόμενος μη-ομοιόμορφος κβαντιστής πραγματοποιεί τη διαδικασία της κβάντισης χρονο-συχνοτικά με κατάλληλη οδήγηση από το υπολογιστικό μοντέλο ακοής, εξασφαλίζοντας καλύτερη υποκειμενική ηχητική ποιότητα, σε σχέση με ένα ομοιόμορφο PCM κβαντιστή. Χρησιμοποιώντας τη βασική λειτουργία του μη-ομοιόμορφου κβαντιστή, υλοποιήθηκε ενά κριτήριο αξιολόγησης ηχητικών δεδομένων, όπου σε αντίθεση με καθιερώμενα κριτήρια (όπως το Noise to Mask Ration, NMR) επιτελεί τις λειτουργίες του στο πεδίο χρόνου-συχνότητας και παρέχει τη δυνατότητα εντοπισμού της υποκειμενικά σημαντικής παραμόρφωσης με βάση την χρονική εξέλιξη του σήματος. / The dissertation studies issues concerning the integration of computational auditory models for modeling and processing of audio signals for optimal reproduction in reverberant spaces as well as topics related to audio coding. Based on the theoretical framework analysis that was established, the necessity of a signal-dependent approach was underlined for modeling the perceptually-relevant effects of reverberation. The main part of the dissertation thesis was focused on describing the perceptually-relevant alterations due to reverberation, based on appropriate defined monaural and differential inter-channel parameters and also their representation with well-defined time-frequency 2D maps. The detailed localization of alterations due to reverberation in the acoustic signals via the proposed Reverberation Masking Index (RMI) introduced an analysis-synthesis methodology for the compensation of reverberation in perceptually-significant time-frequency regions incorporating also, well-established digital signal processing techniques. The main advantage of the proposed signal-dependent methodology is that the suppression of reverberant tails can be achieved on a larger scale under practical conditions, since only perceptually significant regions of the signal are affected after processing. Additionally, the proposed framework complements the more traditional system-dependent inverse filtering methods, enabling novel and efficient signal processing schemes to evolve for room dereverberation applications. The thesis examines also the feasibility of the acoustic signal analysis based on the internal representations provided by the computational auditory model, applicable in the area of audio coding. The proposed non-uniform quantizer operates in the time-frequency domain, where a novel quantization process is driven by the computational auditory model, thus enabling an overall better perceptual quality with respect to uniform PCM quantizer. Considering the fundamental operation of the novel non-uniform quantizer, a criterion for audio quality evaluation was proposed, where contrary to well-established criteria (i.e., Noise to Mask Ratio, NMR) its potential structure performs in the time-frequency domain and provides the detailed localization of perceptually-important distortions based on the input signal’s evolution.

Page generated in 0.2744 seconds