Στο κεφάλαιο 1 παρουσιάζεται μία γενική επισκόπηση της αυτόματης αναγνώρισης
γενικευμένων ακουστικών γεγονότων. Επιπλέον συζητάμε τις εφαρμογές της τεχνολογίας αναγνώρισης ακουστικού σήματος και δίνουμε μία σύντομη περιγραφή του state of the art. Τέλος, αναφέρουμε τη συνεισφορά της διατριβής.
Στο κεφάλαιο 2 εισάγουμε τον αναγνώστη στο χώρο της επεξεργασίας ακουστικών
σημάτων που δε περιλαμβάνουν ομιλία. Παρουσιάζονται οι σύγχρονες προσεγγίσεις
όσον αφορά στις μεθοδολογίες εξαγωγής χαρακτηριστικών και αναγνώρισης προτύπων.
Στο κεφάλαιο 3 προτείνεται ένα καινοτόμο σύστημα αναγνώρισης ήχων ειδικά
σχεδιασμένο για το χώρο των ηχητικών γεγονότων αστικού περιβάλλοντος και αναλύεται
ο σχεδιασμός της αντίστοιχης βάσης δεδομένων. Δημιουργήθηκε μία ιεραρχική
πιθανοτική δομή μαζί με δύο ομάδες ακουστικών παραμέτρων που οδηγούν σε υψηλή
ακρίβεια αναγνώρισης.
Στο κεφάλαιο 4 ερευνάται η χρήση της τεχνικής πολλαπλών αναλύσεων όπως
εφαρμόζεται στο πρόβλημα της διάκρισης ομιλίας/μουσικής. Στη συνέχεια η τεχνική
αυτή χρησιμοποιήθηκε για τη δημιουργία ενός συστήματος το οποίο συνδυάζει
χαρακτηριστικά από διαφορετικά πεδία με στόχο την αποδοτική ανάλυση online
ραδιοφωνικών σημάτων.
Στο κεφάλαιο 5 προτείνεται ένα σύστημα το οποίο εντοπίζει μη-τυπικές καταστάσεις σε
περιβάλλον σταθμού μετρό με στόχο να βοηθήσει το εξουσιοδοτημένο προσωπικό στην
συνεχή επίβλεψη του χώρου.
Στο κεφάλαιο 6 προτείνεται ένα προσαρμοζόμενο σύστημα για ακουστική
παρακολούθηση εν δυνάμει καταστροφικών καταστάσεων ικανό να λειτουργεί κάτω
από διαφορετικά περιβάλλοντα. Δείχνουμε ότι το σύστημα επιτυγχάνει υψηλή απόδοση
και μπορεί να προσαρμόζεται αυτόνομα σε ετερογενείς ακουστικές συνθήκες.
Στο κεφάλαιο 7 ερευνάται η χρήση της μεθόδου ανίχνευσης καινοτομίας για ακουστική
επόπτευση κλειστών και ανοιχτών χώρων. Ηχογραφήθηκε μία βάση δεδομένων
πραγματικού κόσμου και προτείνονται τρεις πιθανοτικές τεχνικές.
Στο κεφάλαιο 8 παρουσιάζεται μία καινοτόμα μεθοδολογία για αναγνώριση
γενικευμένου ακουστικού σήματος που οδηγεί σε υψηλή ακρίβεια αναγνώρισης. Εκμεταλλευόμαστε τα πλεονεκτήματα της χρονικής συγχώνευσης χαρακτηριστικών σε
συνδυασμό με μία παραγωγική τεχνική κατηγοριοποίησης. / The dissertation is outlined as followed:
In chapter 1 we present a general overview of the task of automatic recognition of sound
events. Additionally we discuss the applications of the generalized audio signal
recognition technology and we give a brief description of the state of the art. Finally we mention the contribution of the thesis.
In chapter 2 we introduce the reader to the area of non speech audio processing. We
provide the current trend in the feature extraction methodologies as well as the pattern recognition techniques.
In chapter 3 we analyze a novel sound recognition system especially designed for
addressing the domain of urban environmental sound events. A hierarchical probabilistic
structure was constructed along with a combined set of sound parameters which lead to high accuracy.
chapter 4 is divided in the following two parts: a) we explore the usage of
multiresolution analysis as regards the speech/music discrimination problem and b) the previously acquired knowledge was used to build a system which combined features of
different domains towards efficient analysis of online radio signals.
In chapter 5 we exhaustively experiment on a new application of the sound recognition
technology, space monitoring based on the acoustic modality. We propose a system
which detects atypical situations under a metro station environment towards assisting the authorized personnel in the space monitoring task.
In chapter 6 we propose an adaptive framework for acoustic surveillance of potentially hazardous situations under environments of different acoustic properties. We show that the system achieves high performance and has the ability to adapt to heterogeneous environments in an unsupervised way.
In chapter 7 we investigate the usage of the novelty detection method to the task of
acoustic monitoring of indoor and outdoor spaces. A database with real-world data was
recorded and three probabilistic techniques are proposed.
In chapter 8 we present a novel methodology for generalized sound recognition that
leads to high recognition accuracy. The merits of temporal feature integration as well as multi domain descriptors are exploited in combination with a state of the art generative classification technique.
Identifer | oai:union.ndltd.org:upatras.gr/oai:nemertes:10889/3705 |
Date | 20 September 2010 |
Creators | Νταλαμπίρας, Σταύρος |
Contributors | Φακωτάκης, Νικόλαος, Ntalampiras, Stavros, Φακωτάκης, Νικόλαος, Μουρτζόπουλος, Ιωάννης, Δερματάς, Ευάγγελος, Ψαράκης, Εμμανουήλ, Αναστασόπουλος, Βασίλειος, Παλιουράς, Βασίλειος, Μπερμπερίδης, Κωνσταντίνος |
Source Sets | University of Patras |
Language | gr |
Detected Language | Greek |
Type | Thesis |
Rights | 0 |
Relation | Η ΒΚΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της. |
Page generated in 0.0024 seconds