Μέθοδοι επεξεργασίας ηχητικών σημάτων για καταστολή παρεμβολών σε διατάξεις πολλαπλών μικροφώνων / Blind signal processing methods for microphone leakage suppression in multichannel audio applications

H παρούσα διατριβή εξετάζει το πρόβλημα της διαρροής μικροφώνου, δηλαδή την αλληλεπίδραση και παρεμβολή μεταξύ ταυτόχρονα
ενεργών ηχητικών πηγών σε πολυκαναλικές ηχητικές διατάξεις. Παρ'
όλο που είναι ένα πολύ συχνό φαινόμενο με το οποίο οι μηχανικοί
ήχου έρχονται αντιμέτωποι καθημερινά, δεν έχουν προταθεί μέθοδοι επεξεργασίας σήματος για την επίλυση του προβλήματος. Εδώ,
το πρόβλημα διατυπώνεται για πρώτη φορά στο πλαίσιο της επεξεργασίας σήματος. Αρχικά, διατυπώνεται στο πλαίσιο του τυφλού διαχωρισμού πηγών (blind source separation) και αναλύονται οι περιορισμοί
αυτής της προσέγγισης. Στην συνέχεια, το πρόβλημα επαναδιατυπώνεται σαν πρόβλημα σήματος υπό θόρυβο στα πλαίσια της καταστολής
θορύβου.
Ένα πρωτότυπο γενικευμένο πλαίσιο καταστολής διαρροής μικροφώνου εξάγεται βασιζόμενο σε ένα φίλτρο Wiener με πολυκαναλικό
όρο θορύβο, καθώς και την ευρέως χρησιμοποιούμενη τεχνική «κοντινού μικροφώνου». Το ακουστικό σύστημα που μοντελοποιεί την
διαδικασία μίξης και αλληλεπίδρασης των πηγών αναλύεται και γίνεται διαχωρισμός των σχετικών κρουστικών αποκρίσεων χώρου (room
impulse responses) σε απ' ευθείας ακουστικά μονοπάτια και ακουστικά
μονοπάτια διαρροής. Οι ιδιότητες του απ' ευθείας ακουστικού μονο-
πατιού, δηλαδή της απόκρισης «κοντινού μικροφώνου» αναλύονται
για πρώτη φορά από την προσέγγιση της επεξεργασίας σήματος και
της ακουστικής κλειστών χώρων για πρώτη φορά. Οι ιδιότητες του
ακουστικού μονοπατιού διαρροής αναλύονται επίσης για πρώτη φορά
με την χρήση ακουστικών παραμέτρων. Έχοντας καθορίσει τις βασικές ιδιότητες του ακουστικού συστήματος, μια μέθοδος για την καταστολή διαρροής μικροφώνου αναπτύσσεται για μια διάταξη δύο καναλιών, βασισμένη σε ένα φίλτρο Wiener και μια άμεση εκτίμηση των
σχετικών πυκνοτήτων φασματικής ενέργεiας (power spectral density).
Η απόδοση της μεθόδου για ηχογραφήσεις σε πραγματικούς χώρους
είναι πολύ ικανοποιητική και με βάση αυτά τα αποτελέσματα, η μέθοδος επεκτείνεται για περισσότερες από δύο πηγές και μικρόφωνα σε
αυθαίρετες διατάξεις.
Η ολοκληρωμένη μέθοδος είναι τυφλή και αυτόματη, καθώς δεν
απαιτεί την επέμβαση του χρήση. Δεν κάνει χρήση πρότερης γνώσης
ούτε απαιτεί εκπαίδευση και είναι υπολογιστικά απλή. Προτείνεται επίσης μια πρωτότυπη μέθοδος ανίχνευσης χρονικών διαστημάτων όπου
μόνο μια πηγή είναι ενεργή (χρονικά διαστήματα «σόλο»), η οποία επιτρέπει την εκτίμηση συντελεστών στάθμισης οι οποίοι αντιστοιχούν
στην σχετική μείωση της ηχητικής στάθμης που υφίσταται κάθε ηχητική πηγή καθώς το σήμα διαδίδεται προς τα μικρόφωνα. Αυτή η μέθοδος σε συνδυασμό με μια νεά, πρωτότυπη τεχνική εκτίμησης των πυκνοτήτων φασματικής ενέργεαις, η οποία βασίζεται στην αναγνώριση
των κυρίαρχων διακριτών συχνοτήτων, επιτρέπει την εκτίμηση όλων
των σχετικών ποσοτήτων σε μια πολυκαναλική ηχητική διάταξη. Από
αυτές υπολογίζεται ένα πολυκαναλικό φίλτρο Wiener για κάθε σήμα
μικροφώνου, το οποίο δίνει την εκτίμηση του αντίστοιχου σήματος
πηγής. / This thesis examines the problem of microphone leakage, that is the
interference between simultaneously active sound sources in multichannel audio applications.
Despite being a common problem with which sound engineers are confronted
every day, almost no signal processing methods have been proposed to address
this issue. In this work, the problem is formulated for the first time in a signal
processing framework. First, it formulated inside the blind source separation (BSS)
context and the limitations of related methods are analysed and reported. Since,
BSS methods seem to be inappropriate for this specific problem, it is reformulated
as a signal in noise problem inside the well-known noise suppression framework.
Based on the widely adopted close-microphone technique a novel, generalized
framework for leakage suppression is derived based on a multichannel Wiener filter.
The acoustic system that models the mixing process is analysed and the related room
impulse responses are discerned in direct and leakage acoustic paths. The properties
of the direct acoustic path, that is the close-microphone response are investigated
for the first time, from a signal processing point of view as well as a room acoustics
perspective. The properties of the leakage acoustic path are also analysed for the
first time using room acoustic parameters. After key properties of the acoustic paths
have been identified, a method for the suppression of microphone leakage in a two
channel audio setup is developed based on aWiener filter and a crude approximation
of the related power spectral densities (PSDs). The performance of this method for
actual recordings in real reverberant environments is more than adequate and based
on these results, the method is extended for more than two sources and microphones
in arbitrary arrangements.
The complete method is blind and automatic, since it does not require any user
input. It does not assume any prior knowledge or require training and is computationally
efficient. A novel solo detection method has been developed that allows
the estimation of weighting coefficients that correspond to the relative attenuation
experienced by sound sources as they travel to each microphone. Combined with a
new and advanced PSD estimation method based on the identification of dominant
frequency bins, the related PSDs in a multichannel audio application can be identified.
From these an appropriate multichannel Wiener filter for each microphone
signal can be calculated, which will provide the estimated source signal at its output.

Identiferoai:union.ndltd.org:upatras.gr/oai:nemertes:10889/5544
Date01 October 2012
CreatorsΚοκκίνης, Ηλίας
ContributorsΜουρτζόπουλος, Ιωάννης, Kokkinis, Elias, Μουστακίδης, Γεώργιος, Δερματάς, Ευάγγελος, Φακωτάκης, Νικόλαος, Μπερμπερίδης, Κωνσταντίνος, Σκαρλάτος, Δημήτριος, Φλώρος, Ανδρέας
Source SetsUniversity of Patras
Languagegr
Detected LanguageGreek
TypeThesis
Rights0
RelationΗ ΒΚΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της.

Page generated in 0.0031 seconds