Return to search

Εγκληματολογική αναγνώριση ομιλητή / Forensic speaker recognition

Σήμερα οι διωκτικές αρχές χρησιμοποιούν αυτόματα βιομετρικά συστήματα αναγνώρισης τα οποία αξιοποιούν βιομετρικά χαρακτηριστικά ατόμων προκειμένου να αναγνωριστούν δράστες εγκλημάτων.
Στην παρούσα εργασία έγινε προσπάθεια συσχέτισης αυτής με το αντικείμενο των εγκληματολογικών εργαστηρίων των διωκτικών αρχών. Έτσι δημιουργήθηκε βάση φωνητικών δειγμάτων και κατασκευάστηκε σύστημα αναγνώρισης ομιλητή σε περιβάλλον Matlab με στόχο την μελλοντική αύξηση της βάσης δεδομένων αλλά και την μελλοντική δυνατότητα συνδυασμού: α) εξαγομένων χαρακτηριστικών, β) μεθόδων σύγκρισης των κατανομών φωνητικών δειγμάτων και γ) μεθόδων ταξινόμησης έτσι ώστε να αυξηθεί η απόδοση και να γίνει περισσότερο αξιόπιστο το σύστημα. Το σύστημα που σχεδιάσαμε έχει τα εξής χαρακτηριστικά: α) full automatic, β) open set και γ) text dependent & text in dependent.
Από κάθε φωνητικό δείγμα εξάχθηκαν οι mel frequency coefficients με την εργαλειοθήκη Auditory Toolbox, Malcolm Slaney. Η σύγκριση των χαρακτηριστικών των δειγμάτων ομιλίας υλοποιήθηκε με δυο μεθόδους σύγκρισης : Α) Μια διαδικασία που την ονομάσαμε 3Μ (minimum-mean-maximum) η οποία χρησιμοποιεί την Ευκλείδεια απόσταση για την εύρεση αποστάσεων μεταξύ σημείων των κατανομών.
Β) Το Wald – Wolfowitz Test (WW-Test ), που στηρίζεται στην θεωρία των γράφων.
Τέλος για την ταξινόμηση χρησιμοποιήθηκε ο K-NN ταξινομητής (K – Nearest Neighbor Classifier).
Από τα εξαγόμενα αποτελέσματα των μετρήσεων καταλήξαμε στα ακόλουθα συμπεράσματα. Τα όποια σφάλματα προέκυψαν οφείλονται κυρίως στον τρόπο εξαγωγής των mfcc χαρακτηριστικών και λιγότερο στην μέθοδο ταξινόμησης και στον συγκριτή που χρησιμοποιήθηκε. Με την χρήση συνδυαστικά επιπλέον χαρακτηριστικών και ταξινομητών το σύστημα θα γίνει περισσότερο αξιόπιστο. Το σύστημα με μελλοντική αύξηση της βάσης θα μας δώσει ακόμη καλύτερα αποτελέσματα. / Today the law enforcement agencies use automatic biometric identification systems, which utilize human biometric features in order to identify criminals.
This thesis was correlated with the objective of forensic laboratories. Hence, a data base of human speech samples and a speaker identification system were developed using the Matlab software. The scope was to increase, in future, the number of the data base samples and to combine features, comparison and classification methods. The system is full automatic, open set, text depended and text independent.
From every speech sample, the mel frequency coefficients using the Malcolm Slaney Auditory Toolbox was extracted. The comparison of the speech samples was implemented with two methods: 3M and WW-Test which are based on the graph theory. Finally, the K-NN classifier was used for the classification of the speech samples.
From the system evaluation, we conclude that the feature extraction method has the main effect on the system performance. The combination of several features, comparison and classification methods improves the reliability of the system.

Identiferoai:union.ndltd.org:upatras.gr/oai:nemertes:10889/3048
Date18 May 2010
CreatorsΚουφογιάννης, Βασίλειος
ContributorsΦακωτάκης, Νικόλαος, Koufogiannis, Vasileios, Φωτόπουλος, Σπύρος, Φακωτάκης, Νικόλαος
Source SetsUniversity of Patras
Languagegr
Detected LanguageGreek
TypeThesis
Rights0
RelationΗ ΒΥΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της.

Page generated in 0.0204 seconds