• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • 1
  • Tagged with
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Ανάπτυξη μεθόδων ψηφιακής ισοστάθμισης για ηλεκτρακουστικές εφαρμογές / Development of digital equalization methods for audio applications

Χατζηαντωνίου, Παναγιώτης 25 June 2007 (has links)
H Διδακτορική Διατριβή μελετά το πρόβλημα της ψηφιακής ισοστάθμισης,σκοπεύοντας στην ανάπτυξη αποτελεσματικών μεθόδων εξάλειψης των ηχητικών παραμορφώσεων, που εισάγονται κατά την ηχητική αναπαραγωγή εξαιτίας της απόκρισης, είτε των ηχείων (ανηχωική ισοστάθμιση), είτε των χώρων ακρόασης (εξάλειψη αντήχησης). Αναπτύσσονται πρωτότυπες μέθοδοι που αφενός εξασφαλίζουν ακριβείς μετρήσεις των ανηχωικών ηλεκτρακουστικών αποκρίσεων μέσα σε μη ανηχωικούς χώρους, αφετέρου πετυχαίνουν κατάλληλη εξομάλυνση των πολύπλοκων αποκρίσεων των ακουστικών συστημάτων για χρήση στην ψηφιακή ισοστάθμιση αλλά και για χρήση σε άλλες εφαρμογές της ακουστικής χώρων που απαιτούν ανάλυση συγκεκριμένων ιδιοτήτων αυτών των συστημάτων. Η συστηματική μελέτη της μεθόδου εξάλειψης αντήχησης που βασίζεται στην ιδανική αντιστροφή των αποκρίσεων χώρων οδηγεί στο πρωτότυπο συμπέρασμα ότι τα ακουστά οφέλη από την εφαρμογή της μεθόδου σε πραγματικό χρόνο είναι σημαντικά υποδεέστερα από τα αναμενόμενα που προκύπτουν από τα αντίστοιχα πειράματα εξομοίωσης αυτής της μεθόδου. Το πρόβλημα της εξάλειψης αντήχησης αντιμετωπίζεται για πρώτη φορά με έναν πρακτικά βιώσιμο τρόπο, με την εισαγωγή πρωτότυπης μεθόδου ισοστάθμισης που βασίζεται στην Μιγαδική Εξομάλυνση των αποκρίσεων χώρων. / The dissertation studies the digital audio equalization problem, in order to develop methods that would effectively eliminate the audio distortions being introduced during the sound reproduction by either the loudspeakers(anechoic equalization) or the room response (dereverberation). Novel methods are introduced that ensure precise measurements of anechoic electracoustic responses inside reverberant enclosures and on the other hand, achieve appropriately smoothed acoustic responses, for use in digital equalization and also in other applications of room acoustics that require analysis of concrete properties of these systems. Novel conclusions have been drawn by the analytic study of the room acoustics dereverberation based on ideal inverse filtering, indicating that the application of such a method in real time yields a significantly degraded performance compared to that achieved by the corresponding simulated dereverberation experiments. The problem of dereverberation is faced with a practically viable solution, with the introduction of a novel method based on the room response Complex Smoothing.
2

Signal processing methods for enhancing speech and music signals in reverberant environments / Μέθοδοι ανάλυσης και ψηφιακής επεξεργασίας για την βελτίωση σημάτων ομιλίας και μουσικής σε χώρους με αντήχηση

Τσιλφίδης, Αλέξανδρος 06 October 2011 (has links)
This thesis presents novel signal processing algorithms for speech and music dereverberation. The proposed algorithms focus on blind single-channel suppression of late reverberation; however binaural and semi-blind methods have also been introduced. Late reverberation is a particularly harmful distortion, since it significantly decreases the perceived quality of the reverberant signals but also degrades the performance of Automatic Speech Recognition (ASR) systems and other speech and music processing algorithms. Hence, the proposed deverberation methods can be either used as standalone enhancing techniques or implemented as preprocessing schemes prior to ASR or other applied systems. The main dereverberation method proposed here is a blind dereverberation technique based on perceptual reverberation modeling has been developed. This technique employs a computational auditory masking model and locates the signal regions where late reverberation is audible, i.e. where it is unmasked from the clean signal components. Following a selective signal processing approach, only such signal regions are further processed through sub-band gain filtering. The above technique has been evaluated for both speech and music signals and for a wide range of reverberation conditions. In all cases it was found to minimize the processing artifacts and to produce perceptually superior clean signal estimations than any other tested technique. Moreover, extensive ASR tests have shown that it significantly improves the recognition performance, especially in highly reverberant environments. / Η διατριβή αποτελείται από εννιά κεφάλαια, δύο παραρτήματα καθώς και την σχετική βιβλιογραφία. Είναι γραμμένη στα αγγλικά ενώ περιλαμβάνει και ελληνική περίληψη. Στην παρούσα διατριβή, αναπτύσσονται μεθόδοι ψηφιακής επεξεργασίας σήματος για την αφαίρεση αντήχησης από σήματα ομιλίας και μουσικής. Οι προτεινόμενοι αλγόριθμοι καλύπτουν ένα μεγάλο εύρος εφαρμογών αρχικά εστιάζοντας στην τυφλή (“blind”) αφαίρεση για μονοκαναλικά σήματα. Στοχεύοντας σε πιο ειδικά σενάρια χρήσης προτείνονται επίσης αμφιωτικοί αλγόριθμοι αλλά και τεχνικές που προϋποθέτουν την πραγματοποίηση κάποιας ακουστικής μέτρησης. Οι αλγόριθμοι επικεντρώνουν στην αφαίρεση της καθυστερημένης αντήχησης που είναι ιδιαίτερα επιβλαβής για την ποιότητα σημάτων ομιλίας και μουσικής και μειώνει την καταληπτότητα της ομιλίας. Επίσης, επειδή αλλοιώνει σημαντικά τα στατιστικά των σημάτων, μειώνει σημαντικά την απόδοση συστημάτων αυτόματης αναγνώρισης ομιλίας καθώς και άλλων αλγορίθμων ψηφιακής επεξεργασίας ομιλίας και μουσικής. Έτσι οι προτεινόμενοι αλγόριθμοι μπορούν είτε να χρησιμοποιηθούν σαν αυτόνομες τεχνικές βελτίωσης της ποιότητας των ακουστικών σημάτων είτε να ενσωματωθούν σαν στάδια προ-επεξεργασίας σε άλλες εφαρμογές. Η κύρια μέθοδος αφαίρεσης αντήχησης που προτείνεται στην διατριβή, είναι βασισμένη στην αντιληπτική μοντελοποίηση και χρησιμοποιεί ένα σύγχρονο ψυχοακουστικό μοντέλο. Με βάση αυτό το μοντέλο γίνεται μία εκτίμηση των σημείων του σήματος που η αντήχηση είναι ακουστή δηλαδή που δεν επικαλύπτεται από το ισχυρότερο σε ένταση καθαρό από αντήχηση σήμα. Η συγκεκριμένη εκτίμηση οδηγεί σε μία επιλεκτική επεξεργασία σήματος όπου η αφαίρεση πραγματοποιείται σε αυτά και μόνο τα σημεία, μέσω πρωτότυπων υβριδικών συναρτήσεων κέρδους που βασίζονται σε δείκτες αντικειμενικής και υποκειμενικής αλλοίωσης. Εκτεταμένα αντικειμενικά και υποκειμενικά πειράματα δείχνουν ότι η προτεινόμενη τεχνική δίνει βέλτιστες ποιοτικά ανηχωικές εκτιμήσεις ανεξάρτητα από το μέγεθος του χώρου.
3

Μοdelling, analysis, and processing of room responses and reverberant signals / Μοντελοποίηση, ανάλυση και επεξεργασία ακουστικών αποκρίσεων και σημάτων σε συνθήκες αντήχησης

Γεωργαντή, Ελευθερία 16 May 2014 (has links)
The main focus of this thesis is to analyse signals (signal-dependent analysis) and room responses (system-dependent analysis) from a statistical point of view, attempt to determine the underlying statistical relationships between the reverberant signals and the room responses and propose relevant statistical models. Based on such a statistical framework, this thesis aims to propose novel methodologies for the extraction of room acoustical information and parameters from reverberant signals. Schroeder's theory is experimentally evaluated for various Room Transfer Functions (RTFs) measured in many source/receiver positions in various enclosures and several related aspects are discussed. Using a statistical approach, the effects of reverberant energy on the histograms and statistical measures are discussed and models describing the relationship of statistical measures between the reverberant signal and the RTFs are extracted. Then, the statistical properties of Binaural Room Transfer Functions (BRTFs) and binaural cues are examined. The well-known property of the spectral standard deviation of the magnitude of RTFs, that is its convergence to 5.6 dB for diffuse fields, is examined for the case of BRTFs, using a similar approach and a generic model for the relationship of the spectral standard deviation of RTFs and BRTFs. This thesis is also concerned with the distance estimation problem from a perceptual and computational point of view. Two novel methods for the estimation of the source/receiver distance using speech signals are proposed. The first method is able to detect the distance between the speaker and the microphone in a room environment using single-channel signals. The distance-dependent variation of several temporal and spectral statistical features of single-channel signals is studied and a novel sound source distance detector, based on these features is developed. The second method estimates distance from binaural speech signals (two-channel signals). This method does not require a priori knowledge of the room impulse response, the reverberation time or any other acoustical parameter and relies on a set of novel features extracted from the reverberant binaural signals. For this method, a novel distance estimation feature is introduced exploiting the standard deviation of the difference of the magnitude spectra of the left and right binaural signals (termed here as Binaural Spectral Magnitude Difference Standard Deviation (BSMD STD)). Moreover, an extended and novel set of additional features based on the statistical properties of binaural cues (ILDs, ITDs, ICs) is extracted from an auditory front-end which models the peripheral processing of the human auditory system. Both methods rely on novel distance-dependent features, related to statistical parameters of speech signals. Finally, a novel method for the estimation of the direct-to-reverberant-ratio (DRR) from dual-channel microphone recordings without having knowledge of the source signal is presented. / Η παρούσα διατριβή ασχολείται με τη μελέτη και ανάλυση των στατιστικών χαρακτηριστικών ηχητικών σημάτων και των ακουστικών αποκρίσεων χώρου, έχοντας ως πρωταρχικό σκοπό να προτείνει σχέσεις που περιγράφουν τη συσχέτιση των στατιστικών χαρακτηριστικών των σημάτων με αντήχηση με τις ακουστικές αποκρίσεις χώρων. Βάσει ενός τέτοιου θεωρητικού πλαισίου, η διατριβή αυτή αποσκοπεί στο να προτείνει νέες μεθοδολογίες για την εξαγωγή πληροφορίας που σχετίζεται με τα ακουστικά χαρακτηριστικά των χώρων, κάνοντας χρήση ηχογραφημένων ηχητικών σημάτων (π.χ. σήματα ομιλίας) στους εκάστοτε κλειστούς χώρους. Το θεωρητικό υπόβαθρο αυτής της διατριβής βασίζεται σε υπάρχοντα θεωρητικά μοντέλα για το ηχητικό πεδίο μέσα σε ένα κλειστό χώρο, όπως, για παράδειγμα, το στατιστικό μοντέλο του Schroeder. Το μοντέλο του Schroeder επιβεβαιώνεται πειραματικά για ακουστικές αποκρίσεις που έχουν μετρηθεί σε διάφορες θέσεις, μέσα σε κλειστούς χώρους, οι οποίοι διαφέρουν στα ακουστικά χαρακτηριστικά τους. Βάσει στατιστικής ανάλυσης, εξάγονται στατιστικά μοντέλα, τα οποία περιγράφουν την επίδραση της αντήχησης στα ηχητικά σήματα, όταν αυτά αναπαραχθούν μέσα σε ένα κλειστό χώρο. Στη συνέχεια, λαμβάνοντας υπόψη αντιληπτικά μοντέλα ακοής, τα οποία προϋποθέτουν την ύπαρξη δυο ηχητικών σημάτων (δυο αυτιά, αμφιωτική ακοή) σε αυτή τη διατριβή, μελετώνται κάποιες παράμετροι οι οποίες εξάγονται από αμφιωτικές ακουστικές αποκρίσεις χώρου. Η ιδιότητα της φασματικής τυπικής απόκλισης συναρτήσεων μεταφοράς χώρων να συγκλίνει στην τιμή των 5.6~dB για διάχυτα ηχητικά πεδία, επεκτείνεται στην περίπτωση των αμφιωτικών αποκρίσεων χώρου και προτείνεται ένα γενικευμένο μοντέλο που συσχετίζει τη φασματική τυπική απόκλιση μονοφωνικών και αμφιωτικών συναρτήσεων μεταφοράς χώρου. Η διατριβή αυτή, επίσης, ασχολείται με το πρόβλημα της εκτίμησης της απόστασης μεταξύ πηγής και δέκτη. Προτείνονται δυο νέες μέθοδοι για την εκτίμηση της απόστασης μεταξύ πηγής και δέκτη, κάνοντας χρήση ηχητικών σημάτων ομιλίας. Η προτεινόμενη μέθοδος βασίζεται σε μια σειρά από στατιστικές παραμέτρους των οποίων οι τιμές μεταβάλλονται είτε στο πεδίο του χρόνου είτε στο πεδίο της συχνότητας. Η δεύτερη προτεινόμενη μέθοδος αφορά, επίσης, στην εκτίμηση της απόστασης πηγής/δέκτη, αλλά από αμφιωτικά σήματα. Η μέθοδος αυτή δεν προαπαιτεί γνώση της ακουστικής απόκρισης του χώρου, του χρόνου αντήχησης ή άλλης ακουστικής παραμέτρου και βασίζεται σε μια σειρά από νέες παραμέτρους, οι οποίες μπορούν να υπολογισθούν από τα αμφιωτικά σήματα με αντήχηση. Οι παράμετροι συνδυάζονται με δυο διαφορετικές τεχνικές αναγνώρισης προτύπων των οποίων τα μειονεκτήματα και πλεονεκτήματα συζητώνται. Στα πλαίσια αυτής της μεθόδου, προτείνεται μια νέα παράμετρος, η οποία βασίζεται στη διαφορά της φασματικής τυπικής απόκλισης του αριστερού και του δεξιού αμφιωτικού ηχητικού σήματος, η οποία αποδεικνύεται ότι σχετίζεται με τα στατιστικά της αντίστοιχης μονοφωνικής ακουστικής απόκρισης. Τέλος, προτείνεται μια σειρά από παραμέτρους οι οποίες βασίζονται στα στατιστικά χαρακτηριστικά αμφιωτικών παραμέτρων και σχετίζονται με το αντιληπτικό μοντέλο της ανθρώπινης ακοής. Τέλος, προτείνεται μια νέα μέθοδος για την εκτίμηση της στάθμης λόγου κατευθείαν προς ανακλώμενου ήχου από στερεοφωνικά σήματα.

Page generated in 0.0187 seconds