Global ETD Search

1	Στατιστική ανάλυση ηχητικών σημάτων με έμφαση σε συνθήκες αντήχησης Κρασούλης, Αγαμέμνων 08 July 2011 (has links) Στην παρούσα διπλωματική εργασία γίνεται μελέτη των στατιστικών παραμέτρων ηχητικών σημάτων. Μελετάται η δυνατότητα αυτόματης ταξινόμησης μουσικής ανά είδος, η οποία βασίζεται στην εξαγωγή αυτών των παραμέτρων. Επίσης, μελετάται η μεταβολή αυτών σε συνθήκες αντήχησης, δίνοντας έμφαση στην παράμετρο φασματικής ασυμμετρίας ηχητικού σήματος. Σε αυτό το πλαίσιο, προτείνεται μέθοδος κατασκευής μοντέλου πρόβλεψης της συμπεριφοράς της συγκεκριμένης παραμέτρου σε συνθήκες αντήχησης, που στόχο έχει την εκτίμηση της απόστασης ηχητικής πηγής – δέκτη σε κλειστό χώρο, καθώς και την πρόβλεψη της ανωτέρω παραμέτρου ανηχωικού σήματος από σήματα με αντήχηση. / In this thesis we study the audio features and their applications, such as automatic music genre classification. It is also studied the behavior of these features under reverberant conditions, emphasizing on spectral skewness. In this framework, it is suggested a method of predicting the behavior of this feature under reverberant conditions, which could have many applications such as source - receiver distance estimation and prediction of the spectral skewness of anechoic audio signals. Τεχνολογία ήχου Ηχητικές παράμετροι Αντήχηση 621.382 2 Audio features Reverberation
2	Ανάπτυξη μεθόδων ψηφιακής ισοστάθμισης για ηλεκτρακουστικές εφαρμογές / Development of digital equalization methods for audio applications Χατζηαντωνίου, Παναγιώτης 25 June 2007 (has links) H Διδακτορική Διατριβή μελετά το πρόβλημα της ψηφιακής ισοστάθμισης,σκοπεύοντας στην ανάπτυξη αποτελεσματικών μεθόδων εξάλειψης των ηχητικών παραμορφώσεων, που εισάγονται κατά την ηχητική αναπαραγωγή εξαιτίας της απόκρισης, είτε των ηχείων (ανηχωική ισοστάθμιση), είτε των χώρων ακρόασης (εξάλειψη αντήχησης). Αναπτύσσονται πρωτότυπες μέθοδοι που αφενός εξασφαλίζουν ακριβείς μετρήσεις των ανηχωικών ηλεκτρακουστικών αποκρίσεων μέσα σε μη ανηχωικούς χώρους, αφετέρου πετυχαίνουν κατάλληλη εξομάλυνση των πολύπλοκων αποκρίσεων των ακουστικών συστημάτων για χρήση στην ψηφιακή ισοστάθμιση αλλά και για χρήση σε άλλες εφαρμογές της ακουστικής χώρων που απαιτούν ανάλυση συγκεκριμένων ιδιοτήτων αυτών των συστημάτων. Η συστηματική μελέτη της μεθόδου εξάλειψης αντήχησης που βασίζεται στην ιδανική αντιστροφή των αποκρίσεων χώρων οδηγεί στο πρωτότυπο συμπέρασμα ότι τα ακουστά οφέλη από την εφαρμογή της μεθόδου σε πραγματικό χρόνο είναι σημαντικά υποδεέστερα από τα αναμενόμενα που προκύπτουν από τα αντίστοιχα πειράματα εξομοίωσης αυτής της μεθόδου. Το πρόβλημα της εξάλειψης αντήχησης αντιμετωπίζεται για πρώτη φορά με έναν πρακτικά βιώσιμο τρόπο, με την εισαγωγή πρωτότυπης μεθόδου ισοστάθμισης που βασίζεται στην Μιγαδική Εξομάλυνση των αποκρίσεων χώρων. / The dissertation studies the digital audio equalization problem, in order to develop methods that would effectively eliminate the audio distortions being introduced during the sound reproduction by either the loudspeakers(anechoic equalization) or the room response (dereverberation). Novel methods are introduced that ensure precise measurements of anechoic electracoustic responses inside reverberant enclosures and on the other hand, achieve appropriately smoothed acoustic responses, for use in digital equalization and also in other applications of room acoustics that require analysis of concrete properties of these systems. Novel conclusions have been drawn by the analytic study of the room acoustics dereverberation based on ideal inverse filtering, indicating that the application of such a method in real time yields a significantly degraded performance compared to that achieved by the corresponding simulated dereverberation experiments. The problem of dereverberation is faced with a practically viable solution, with the introduction of a novel method based on the room response Complex Smoothing. Ψηφιακή ισοστάθμιση Αντήχηση Ηχεία ακουστική χώρων Μιγαδική εξομάλυνση Ακουστικά κριτήρια Ηλεκτρακουστική Αντίστροφο φίλτρο 621.382 8 Digital equalization Dereverberation Complex smoothing inverse, Complex smoothing inverse, Filtering room acoustics Loudspeakers Room response audio reverberation
3	Μοdelling, analysis, and processing of room responses and reverberant signals / Μοντελοποίηση, ανάλυση και επεξεργασία ακουστικών αποκρίσεων και σημάτων σε συνθήκες αντήχησης Γεωργαντή, Ελευθερία 16 May 2014 (has links) The main focus of this thesis is to analyse signals (signal-dependent analysis) and room responses (system-dependent analysis) from a statistical point of view, attempt to determine the underlying statistical relationships between the reverberant signals and the room responses and propose relevant statistical models. Based on such a statistical framework, this thesis aims to propose novel methodologies for the extraction of room acoustical information and parameters from reverberant signals. Schroeder's theory is experimentally evaluated for various Room Transfer Functions (RTFs) measured in many source/receiver positions in various enclosures and several related aspects are discussed. Using a statistical approach, the effects of reverberant energy on the histograms and statistical measures are discussed and models describing the relationship of statistical measures between the reverberant signal and the RTFs are extracted. Then, the statistical properties of Binaural Room Transfer Functions (BRTFs) and binaural cues are examined. The well-known property of the spectral standard deviation of the magnitude of RTFs, that is its convergence to 5.6 dB for diffuse fields, is examined for the case of BRTFs, using a similar approach and a generic model for the relationship of the spectral standard deviation of RTFs and BRTFs. This thesis is also concerned with the distance estimation problem from a perceptual and computational point of view. Two novel methods for the estimation of the source/receiver distance using speech signals are proposed. The first method is able to detect the distance between the speaker and the microphone in a room environment using single-channel signals. The distance-dependent variation of several temporal and spectral statistical features of single-channel signals is studied and a novel sound source distance detector, based on these features is developed. The second method estimates distance from binaural speech signals (two-channel signals). This method does not require a priori knowledge of the room impulse response, the reverberation time or any other acoustical parameter and relies on a set of novel features extracted from the reverberant binaural signals. For this method, a novel distance estimation feature is introduced exploiting the standard deviation of the difference of the magnitude spectra of the left and right binaural signals (termed here as Binaural Spectral Magnitude Difference Standard Deviation (BSMD STD)). Moreover, an extended and novel set of additional features based on the statistical properties of binaural cues (ILDs, ITDs, ICs) is extracted from an auditory front-end which models the peripheral processing of the human auditory system. Both methods rely on novel distance-dependent features, related to statistical parameters of speech signals. Finally, a novel method for the estimation of the direct-to-reverberant-ratio (DRR) from dual-channel microphone recordings without having knowledge of the source signal is presented. / Η παρούσα διατριβή ασχολείται με τη μελέτη και ανάλυση των στατιστικών χαρακτηριστικών ηχητικών σημάτων και των ακουστικών αποκρίσεων χώρου, έχοντας ως πρωταρχικό σκοπό να προτείνει σχέσεις που περιγράφουν τη συσχέτιση των στατιστικών χαρακτηριστικών των σημάτων με αντήχηση με τις ακουστικές αποκρίσεις χώρων. Βάσει ενός τέτοιου θεωρητικού πλαισίου, η διατριβή αυτή αποσκοπεί στο να προτείνει νέες μεθοδολογίες για την εξαγωγή πληροφορίας που σχετίζεται με τα ακουστικά χαρακτηριστικά των χώρων, κάνοντας χρήση ηχογραφημένων ηχητικών σημάτων (π.χ. σήματα ομιλίας) στους εκάστοτε κλειστούς χώρους. Το θεωρητικό υπόβαθρο αυτής της διατριβής βασίζεται σε υπάρχοντα θεωρητικά μοντέλα για το ηχητικό πεδίο μέσα σε ένα κλειστό χώρο, όπως, για παράδειγμα, το στατιστικό μοντέλο του Schroeder. Το μοντέλο του Schroeder επιβεβαιώνεται πειραματικά για ακουστικές αποκρίσεις που έχουν μετρηθεί σε διάφορες θέσεις, μέσα σε κλειστούς χώρους, οι οποίοι διαφέρουν στα ακουστικά χαρακτηριστικά τους. Βάσει στατιστικής ανάλυσης, εξάγονται στατιστικά μοντέλα, τα οποία περιγράφουν την επίδραση της αντήχησης στα ηχητικά σήματα, όταν αυτά αναπαραχθούν μέσα σε ένα κλειστό χώρο. Στη συνέχεια, λαμβάνοντας υπόψη αντιληπτικά μοντέλα ακοής, τα οποία προϋποθέτουν την ύπαρξη δυο ηχητικών σημάτων (δυο αυτιά, αμφιωτική ακοή) σε αυτή τη διατριβή, μελετώνται κάποιες παράμετροι οι οποίες εξάγονται από αμφιωτικές ακουστικές αποκρίσεις χώρου. Η ιδιότητα της φασματικής τυπικής απόκλισης συναρτήσεων μεταφοράς χώρων να συγκλίνει στην τιμή των 5.6~dB για διάχυτα ηχητικά πεδία, επεκτείνεται στην περίπτωση των αμφιωτικών αποκρίσεων χώρου και προτείνεται ένα γενικευμένο μοντέλο που συσχετίζει τη φασματική τυπική απόκλιση μονοφωνικών και αμφιωτικών συναρτήσεων μεταφοράς χώρου. Η διατριβή αυτή, επίσης, ασχολείται με το πρόβλημα της εκτίμησης της απόστασης μεταξύ πηγής και δέκτη. Προτείνονται δυο νέες μέθοδοι για την εκτίμηση της απόστασης μεταξύ πηγής και δέκτη, κάνοντας χρήση ηχητικών σημάτων ομιλίας. Η προτεινόμενη μέθοδος βασίζεται σε μια σειρά από στατιστικές παραμέτρους των οποίων οι τιμές μεταβάλλονται είτε στο πεδίο του χρόνου είτε στο πεδίο της συχνότητας. Η δεύτερη προτεινόμενη μέθοδος αφορά, επίσης, στην εκτίμηση της απόστασης πηγής/δέκτη, αλλά από αμφιωτικά σήματα. Η μέθοδος αυτή δεν προαπαιτεί γνώση της ακουστικής απόκρισης του χώρου, του χρόνου αντήχησης ή άλλης ακουστικής παραμέτρου και βασίζεται σε μια σειρά από νέες παραμέτρους, οι οποίες μπορούν να υπολογισθούν από τα αμφιωτικά σήματα με αντήχηση. Οι παράμετροι συνδυάζονται με δυο διαφορετικές τεχνικές αναγνώρισης προτύπων των οποίων τα μειονεκτήματα και πλεονεκτήματα συζητώνται. Στα πλαίσια αυτής της μεθόδου, προτείνεται μια νέα παράμετρος, η οποία βασίζεται στη διαφορά της φασματικής τυπικής απόκλισης του αριστερού και του δεξιού αμφιωτικού ηχητικού σήματος, η οποία αποδεικνύεται ότι σχετίζεται με τα στατιστικά της αντίστοιχης μονοφωνικής ακουστικής απόκρισης. Τέλος, προτείνεται μια σειρά από παραμέτρους οι οποίες βασίζονται στα στατιστικά χαρακτηριστικά αμφιωτικών παραμέτρων και σχετίζονται με το αντιληπτικό μοντέλο της ανθρώπινης ακοής. Τέλος, προτείνεται μια νέα μέθοδος για την εκτίμηση της στάθμης λόγου κατευθείαν προς ανακλώμενου ήχου από στερεοφωνικά σήματα. Room acoustics Room impulse response Reverberation Distance estimation Direct-to-reverberant-ratio Binaural room impulse response Room transfer function model Statistical analysis 620.21 Ακουστική χώρων Αντήχηση Εκτίμηση απόστασης Στατιστική ανάλυση
4	Μοντελοποίηση και επεξεργασία ηχητικών δεδομένων για αναπαραγωγή σε χώρους με αντήχηση / Modeling and processing audio signals for sound reproduction in reverberant rooms Ζαρούχας, Θωμάς 27 December 2010 (has links) H διδακτορική διατριβή μελετά ζητήματα που αφορούν την ενσωμάτωση υπολογιστικών μοντέλων ακοής για την μοντελοποίηση και επεξεργασία ηχητικών σηματών για την βέλτιστη αναπαραγωγή τους σε χώρους με αντήχηση καθώς και την κωδικοποίηση ηχητικών δεδομένων. Το κύριο μέρος της διατριβής επικεντρώθηκε στην μοντελοποίηση των αντιληπτικά σημαντικών αλλοιώσεων λόγω αντήχησης, με την βοήθεια κατάλληλα οριζόμενων μόνο-ωτικών και διαφορικών ενδο-καναλικών παραμέτρων και την απεικόνιση τους με τη βοήθεια χρονο-συχνοτικών 2Δ αναπαραστάσεων. Ο λεπτομερής εντοπισμός των αλλοιώσεων στα ηχητικά σήματα μέσω του προτεινόμενου Δείκτη Επικάλυψης λόγω Αντήχησης (ΔΕΑ) διαμόρφωσε κατάλληλη μεθοδολογία ανάλυσης-σύνθεσης, για την καταστολή της αντήχησης σε συγκεκριμένες χρονο-συχνοτικές περιοχές. Το κύριο πλεονέκτημα της προτεινόμενης, εξαρτώμενης του σήματος, μεθοδολογίας είναι ότι επιτυγχάνεται η καταστολή των, με σχετική καθυστέρηση, παραμορφώσεων λόγω αντήχησης σε μια μεγαλύτερη κλίμακα, δεδομένου ότι μόνο οι αντιληπτικά σημαντικές περιοχές του σήματος επηρεάζονται από την επεξεργασία. Επιπλέον, αναζητήθηκε η δυνατότητα ανάλυσης των ηχητικών δεδομένων με βάση τις εσωτερικές τους αναπαραστάσεις (όπως δηλαδή τις παρέχει το υπολογιστικό μοντέλο ακοής) με εφαρμογή στην περιοχή της κωδικοποίησης σημάτων. Ο προτεινόμενος μη-ομοιόμορφος κβαντιστής πραγματοποιεί τη διαδικασία της κβάντισης χρονο-συχνοτικά με κατάλληλη οδήγηση από το υπολογιστικό μοντέλο ακοής, εξασφαλίζοντας καλύτερη υποκειμενική ηχητική ποιότητα, σε σχέση με ένα ομοιόμορφο PCM κβαντιστή. Χρησιμοποιώντας τη βασική λειτουργία του μη-ομοιόμορφου κβαντιστή, υλοποιήθηκε ενά κριτήριο αξιολόγησης ηχητικών δεδομένων, όπου σε αντίθεση με καθιερώμενα κριτήρια (όπως το Noise to Mask Ration, NMR) επιτελεί τις λειτουργίες του στο πεδίο χρόνου-συχνότητας και παρέχει τη δυνατότητα εντοπισμού της υποκειμενικά σημαντικής παραμόρφωσης με βάση την χρονική εξέλιξη του σήματος. / The dissertation studies issues concerning the integration of computational auditory models for modeling and processing of audio signals for optimal reproduction in reverberant spaces as well as topics related to audio coding. Based on the theoretical framework analysis that was established, the necessity of a signal-dependent approach was underlined for modeling the perceptually-relevant effects of reverberation. The main part of the dissertation thesis was focused on describing the perceptually-relevant alterations due to reverberation, based on appropriate defined monaural and differential inter-channel parameters and also their representation with well-defined time-frequency 2D maps. The detailed localization of alterations due to reverberation in the acoustic signals via the proposed Reverberation Masking Index (RMI) introduced an analysis-synthesis methodology for the compensation of reverberation in perceptually-significant time-frequency regions incorporating also, well-established digital signal processing techniques. The main advantage of the proposed signal-dependent methodology is that the suppression of reverberant tails can be achieved on a larger scale under practical conditions, since only perceptually significant regions of the signal are affected after processing. Additionally, the proposed framework complements the more traditional system-dependent inverse filtering methods, enabling novel and efficient signal processing schemes to evolve for room dereverberation applications. The thesis examines also the feasibility of the acoustic signal analysis based on the internal representations provided by the computational auditory model, applicable in the area of audio coding. The proposed non-uniform quantizer operates in the time-frequency domain, where a novel quantization process is driven by the computational auditory model, thus enabling an overall better perceptual quality with respect to uniform PCM quantizer. Considering the fundamental operation of the novel non-uniform quantizer, a criterion for audio quality evaluation was proposed, where contrary to well-established criteria (i.e., Noise to Mask Ratio, NMR) its potential structure performs in the time-frequency domain and provides the detailed localization of perceptually-important distortions based on the input signal’s evolution. Ηχητικά σήματα Αντήχηση Χωρική ακουστική Ψυχοακουστική Αντιληπτικά μοντέλα Κβαντιστής 620.21 Audio signals Reverberation Spatial hearing Psychoacoustics Perceptual models Computational auditory masking model Reverberation masking index Differential inter-channel parameters Audio coding Quantizer Perceptual audio evaluation

1

Page generated in 0.0257 seconds