Μελέτη και κατασκευή επεξεργαστή σημάτων ειδικού σκοπούΜαχαίρας, Δημήτρης 20 October 2009 (has links)
Σκοπός αυτής της διπλωματικής ήταν η μελέτη, σχεδίαση και υλοποίηση επεξεργαστή‐
ενισχυτή σήματος προερχόμενο από ηλεκτρική κιθάρα. Το σήμα αφού περάσει από αυτή την συσκευή, αποκτά κάποια ειδικά χαρακτηριστικά και είναι σε θέση να οδηγήσει το σύστημα μεγαφώνου ώστε να αναπαραχθεί. Η επεξεργασία του σήματος γίνεται σε 2 βασικά μέρη: τον αναλογικό προενισχυτή–ψαλιδιστή-ισοσταθμιστή και την μονάδα ψηφιακής επεξεργασίας σήματος.
Η σχεδίαση του πρώτου έγινε με έμφαση στα ηχητικά χαρακτηριστικά που προσέδιδε στο σήμα,
ενώ στη συνέχεια έγινε προσπάθεια να ερμηνευτούν αυτά με ηλεκτρονική-επιστημονική προσέγγιση. Για τη δεύτερη, χρησιμοποιήθηκαν γνωστοί αλγόριθμοι ενώ σχεδιάστηκε εκ νέου η διασύνδεση-επικοινωνία της μονάδας αυτής με τον χρήστη. Η ενίσχυση του σήματος σε επαρκή
για οδήγηση στάθμη έγινε μέσω του ενισχυτή ισχύος (P. A.) ενώ την αναπαραγωγή του αναλαμβάνει το σύστημα μεγαφώνου. / The goal of this project, was to study design and implementate a special purpose processor-amplifier
for guitar signals. After this fore‐mentioned processing, special sound attributes are
gained. Then in order to be propagated, the processed signal flows in the amplification stage to
get the adequate level for audio speaker driving. Processing, is divided into 2 main stages:the
analog preamp‐clipper‐equalizer and the digital signal processing stage. Design of the first one
focuses on subjective sound attributes gained, with respect to deliver wide range of guitar
sounds. Another effort was to testify these sound attributes with a common scientific approach.
For the making of the dsp stage, standard algorithms were used in order to achieve standard effects
such as delay, chorus, flanger and pitch shifter, while the control of the effects‘ parameters
by the user was a different special task requiring further experimentation. The amplification
stage design as well as the audio speaker design, followed classic techniques in order to achieve
their standard purpose.
Διαφορική υποκειμενική ακουστική κωδικοποίηση (ΔΥΑΚ) : μια βελτιωμένη τεχνική ηχητικής κωδικοποίησηςΠαρασκευάς, Μιχαήλ 23 November 2009 (has links)
- / -
Μελέτη και προγραμματισμός ψηφιακού επεξεργαστή σήματος για πολυκαναλική εφαρμογή ακουστικής ισοστάθμισης χαμηλών συχνοτήτωνΝάνος, Διονύσιος 03 May 2010 (has links)
Αυτή η εργασία ασχολείται και αναλύει τα χαρακτηριστικά του συστήματος Controlled Acoustical Bass System (C.A.B.S.), το οποίο είναι ένα σύστημα βελτίωσης της ακουστικής κλειστών χώρων σε χαμηλές συχνότητες, χρησιμοποιώντας πολλαπλά ηχεία και μια τεχνική διόρθωσης βασισμένη στην ανάλυση του ηχητικού πεδίου στο χρόνο. Πριν όμως προχωρήσουμε σε οποιαδήποτε ανάλυση, θα πρέπει πρώτα από όλα να ορίσουμε πιο ακριβώς είναι το πρόβλημα που δημιουργείται στις χαμηλές συχνότητες σε κλειστούς χώρους, καθώς και ποίες μέθοδοι χρησιμοποιούνται για να το αντιμετωπίσουν. / -
Τεχνικές προσανατολισμένης λήψης για μη στάσιμα ακουστικά σήματα : συγκριτική πειραματική αξιολόγηση σε πραγματικές συνθήκεςΠλατυπόδη, Μαρία 27 April 2015 (has links)
Οι τεχνικές προσανατολισμένης λήψης έχουν μελετηθεί εκτενώς τις τελευταίες δεκαετίες, καθώς βρίσκουν εφαρμογή σε διάφορους τομείς. Ωστόσο, για σήματα ευρείας ζώνης το πρόβλημα αυτό δεν έχει διερευνηθεί διεξοδικά. Σκοπός αυτής της εργασίας είναι να αναδείξει τις δυνατότητες και τους εγγενής περιορισμούς των τεχνικών προσανατολισμένης λήψης. Στα πρώτα κεφάλαια παρουσιάζονται οι θεμελιώδεις έννοιες της επεξεργασίας σημάτων σε διατάξεις μικροφώνων και οι πιο ευρέως χρησιμοποιούμενες τεχνικές προσανατολισμένης λήψης. Στο τελευταίο κεφάλαιο πραγματοποιούνται εξοικειώσεις πραγματικών ακουστικών συνθηκών σύμφωνα με το πρότυπο ETSI EG 202 396. Το μη-ανηχοϊκό μοντέλο υιοθετείται και πραγματικά ακουστικά σήματα λαμβάνονται από γραμμικές διατάξεις μικροφώνων. Ακόμη, η τεχνική ημίτονου εκθετικής σάρωσης χρησιμοποιείται για την εκτίμηση της κρουστικής απόκρισης των Ν-ακουστικών καναλιών. Τέλος, το μοντέλο 3-QUEST χρησιμοποιείται για την μέτρηση της ποιότητας ομιλίας σε θορυβώδη περιβάλλοντα. / Beamforming techniques have been studied extensively due to its applications in various areas. However, most of the efforts have been focused on the narrowband case. For wideband signals, this problem has not been thoroughly investigated. This thesis aims is to highlight potentials and the limitations of the conventional beamforming techniques. In the first chapters, the fundamental array processing theory and the most widely used beamforming techniques are presented. In the last chapter, different real-world acoustic scenarios are simulated according to ETSI EG 202 396-3 standard. In the simulations, the reverberant model is assumed and real audio signals are captured by a linear microphone array. The coefficients of the spatial filter are computed with the MVDR criterion. Moreover, acoustic impulse responses measurements are presented and performed for the construction of the steering vector. The speech quality in presence of background noise is measured by the 3-QUEST model.
Ανάπτυξη μεθόδων ψηφιακής ισοστάθμισης για ηλεκτρακουστικές εφαρμογές / Development of digital equalization methods for audio applicationsΧατζηαντωνίου, Παναγιώτης 25 June 2007 (has links)
H Διδακτορική Διατριβή μελετά το πρόβλημα της ψηφιακής ισοστάθμισης,σκοπεύοντας στην ανάπτυξη αποτελεσματικών μεθόδων εξάλειψης των ηχητικών παραμορφώσεων, που εισάγονται κατά την ηχητική αναπαραγωγή εξαιτίας της απόκρισης, είτε των ηχείων (ανηχωική ισοστάθμιση), είτε των χώρων ακρόασης (εξάλειψη αντήχησης). Αναπτύσσονται πρωτότυπες μέθοδοι που αφενός εξασφαλίζουν ακριβείς μετρήσεις των ανηχωικών ηλεκτρακουστικών αποκρίσεων μέσα σε μη ανηχωικούς χώρους, αφετέρου πετυχαίνουν κατάλληλη εξομάλυνση των πολύπλοκων αποκρίσεων των ακουστικών συστημάτων για χρήση στην ψηφιακή ισοστάθμιση αλλά και για χρήση σε άλλες εφαρμογές της ακουστικής χώρων που απαιτούν ανάλυση συγκεκριμένων ιδιοτήτων αυτών των συστημάτων. Η συστηματική μελέτη της μεθόδου εξάλειψης αντήχησης που βασίζεται στην ιδανική αντιστροφή των αποκρίσεων χώρων οδηγεί στο πρωτότυπο συμπέρασμα ότι τα ακουστά οφέλη από την εφαρμογή της μεθόδου σε πραγματικό χρόνο είναι σημαντικά υποδεέστερα από τα αναμενόμενα που προκύπτουν από τα αντίστοιχα πειράματα εξομοίωσης αυτής της μεθόδου. Το πρόβλημα της εξάλειψης αντήχησης αντιμετωπίζεται για πρώτη φορά με έναν πρακτικά βιώσιμο τρόπο, με την εισαγωγή πρωτότυπης μεθόδου ισοστάθμισης που βασίζεται στην Μιγαδική Εξομάλυνση των αποκρίσεων χώρων. / The dissertation studies the digital audio equalization problem, in order to develop methods that would effectively eliminate the audio distortions being introduced during the sound reproduction by either the loudspeakers(anechoic equalization) or the room response (dereverberation). Novel methods are introduced that ensure precise measurements of anechoic electracoustic responses inside reverberant enclosures and on the other hand, achieve appropriately smoothed acoustic responses, for use in digital equalization and also in other applications of room acoustics that require analysis of concrete properties of these systems. Novel conclusions have been drawn by the analytic study of the room acoustics dereverberation based on ideal inverse filtering, indicating that the application of such a method in real time yields a significantly degraded performance compared to that achieved by the corresponding simulated dereverberation experiments. The problem of dereverberation is faced with a practically viable solution, with the introduction of a novel method based on the room response Complex Smoothing.
Ψηφιακή επεξεργασία και αυτόματη κατηγοριοποίηση περιβαλλοντικών ήχωνΝταλαμπίρας, Σταύρος 20 September 2010 (has links)
Στο κεφάλαιο 1 παρουσιάζεται μία γενική επισκόπηση της αυτόματης αναγνώρισης
γενικευμένων ακουστικών γεγονότων. Επιπλέον συζητάμε τις εφαρμογές της τεχνολογίας αναγνώρισης ακουστικού σήματος και δίνουμε μία σύντομη περιγραφή του state of the art. Τέλος, αναφέρουμε τη συνεισφορά της διατριβής.
Στο κεφάλαιο 2 εισάγουμε τον αναγνώστη στο χώρο της επεξεργασίας ακουστικών
σημάτων που δε περιλαμβάνουν ομιλία. Παρουσιάζονται οι σύγχρονες προσεγγίσεις
όσον αφορά στις μεθοδολογίες εξαγωγής χαρακτηριστικών και αναγνώρισης προτύπων.
Στο κεφάλαιο 3 προτείνεται ένα καινοτόμο σύστημα αναγνώρισης ήχων ειδικά
σχεδιασμένο για το χώρο των ηχητικών γεγονότων αστικού περιβάλλοντος και αναλύεται
ο σχεδιασμός της αντίστοιχης βάσης δεδομένων. Δημιουργήθηκε μία ιεραρχική
πιθανοτική δομή μαζί με δύο ομάδες ακουστικών παραμέτρων που οδηγούν σε υψηλή
ακρίβεια αναγνώρισης.
Στο κεφάλαιο 4 ερευνάται η χρήση της τεχνικής πολλαπλών αναλύσεων όπως
εφαρμόζεται στο πρόβλημα της διάκρισης ομιλίας/μουσικής. Στη συνέχεια η τεχνική
αυτή χρησιμοποιήθηκε για τη δημιουργία ενός συστήματος το οποίο συνδυάζει
χαρακτηριστικά από διαφορετικά πεδία με στόχο την αποδοτική ανάλυση online
ραδιοφωνικών σημάτων.
Στο κεφάλαιο 5 προτείνεται ένα σύστημα το οποίο εντοπίζει μη-τυπικές καταστάσεις σε
περιβάλλον σταθμού μετρό με στόχο να βοηθήσει το εξουσιοδοτημένο προσωπικό στην
συνεχή επίβλεψη του χώρου.
Στο κεφάλαιο 6 προτείνεται ένα προσαρμοζόμενο σύστημα για ακουστική
παρακολούθηση εν δυνάμει καταστροφικών καταστάσεων ικανό να λειτουργεί κάτω
από διαφορετικά περιβάλλοντα. Δείχνουμε ότι το σύστημα επιτυγχάνει υψηλή απόδοση
και μπορεί να προσαρμόζεται αυτόνομα σε ετερογενείς ακουστικές συνθήκες.
Στο κεφάλαιο 7 ερευνάται η χρήση της μεθόδου ανίχνευσης καινοτομίας για ακουστική
επόπτευση κλειστών και ανοιχτών χώρων. Ηχογραφήθηκε μία βάση δεδομένων
πραγματικού κόσμου και προτείνονται τρεις πιθανοτικές τεχνικές.
Στο κεφάλαιο 8 παρουσιάζεται μία καινοτόμα μεθοδολογία για αναγνώριση
γενικευμένου ακουστικού σήματος που οδηγεί σε υψηλή ακρίβεια αναγνώρισης. Εκμεταλλευόμαστε τα πλεονεκτήματα της χρονικής συγχώνευσης χαρακτηριστικών σε
συνδυασμό με μία παραγωγική τεχνική κατηγοριοποίησης. / The dissertation is outlined as followed:
In chapter 1 we present a general overview of the task of automatic recognition of sound
events. Additionally we discuss the applications of the generalized audio signal
recognition technology and we give a brief description of the state of the art. Finally we mention the contribution of the thesis.
In chapter 2 we introduce the reader to the area of non speech audio processing. We
provide the current trend in the feature extraction methodologies as well as the pattern recognition techniques.
In chapter 3 we analyze a novel sound recognition system especially designed for
addressing the domain of urban environmental sound events. A hierarchical probabilistic
structure was constructed along with a combined set of sound parameters which lead to high accuracy.
chapter 4 is divided in the following two parts: a) we explore the usage of
multiresolution analysis as regards the speech/music discrimination problem and b) the previously acquired knowledge was used to build a system which combined features of
different domains towards efficient analysis of online radio signals.
In chapter 5 we exhaustively experiment on a new application of the sound recognition
technology, space monitoring based on the acoustic modality. We propose a system
which detects atypical situations under a metro station environment towards assisting the authorized personnel in the space monitoring task.
In chapter 6 we propose an adaptive framework for acoustic surveillance of potentially hazardous situations under environments of different acoustic properties. We show that the system achieves high performance and has the ability to adapt to heterogeneous environments in an unsupervised way.
In chapter 7 we investigate the usage of the novelty detection method to the task of
acoustic monitoring of indoor and outdoor spaces. A database with real-world data was
recorded and three probabilistic techniques are proposed.
In chapter 8 we present a novel methodology for generalized sound recognition that
leads to high recognition accuracy. The merits of temporal feature integration as well as multi domain descriptors are exploited in combination with a state of the art generative classification technique.
Évaluer l'apport du binaural dans une application mobile audiovisuelle / Assessing the quality of experience of audiovisual services in a context of mobility : contribution of sound immersionMoreira, Julian 10 July 2019 (has links)
Les terminaux mobiles offrent à ce jour des performances de plus en plus élevées (CPU, résolution de l’écran, capteurs optiques, etc.) Cela rehausse la qualité vidéo des services média, que ce soit pour le visionnage de contenu vidéo (streaming, TV, etc.) ou pour des applications interactives telles que le jeu vidéo. Mais cette évolution concernant l'image n'est pas ou peu suivie par l'intégration de systèmes de restitution audio de haute qualité dans ce type de terminal. Or, parallèlement à ces évolutions concernant l'image, des solutions de son spatialisé sur casque, à travers notamment la technique de restitution binaurale basée sur l'utilisation de filtres HRTF (Head Related Transfer Functions) voient le jour.Dans ce travail de thèse, nous nous proposons d’évaluer l’intérêt que peut présenter le son binaural lorsqu'il est utilisé sur une application mobile audiovisuelle. Une partie de notre travail a consisté à déterminer les différents sens que l’on pouvait donner au terme « application mobile audiovisuelle » et parmi ces sens ceux qui d’une part étaient pertinents et d’autre part pouvaient donner lieu à une évaluation comparative avec ou sans son binaural.Le couplage entre son binaural et visuel sur mobile occasionne en premier lieu une question d’ordre perceptive : comment peut-on organiser spatialement une scène virtuelle dont le son peut se déployer tout autour de l’utilisateur, et dont le visuel est restreint à un si petit écran ? La première partie de cette thèse est consacrée à cette question. Nous menons une expérience visant à étudier le découplage spatial possible entre un son binaural et un visuel rendus sur smartphone. Cette expérience révèle une forte tolérance de l’être humain face aux dégradations spatiales pouvant survenir entre les deux modalités. En particulier, l’absence d’individualisation des HRTF, ainsi qu’un très grand découplage en élévation ne semblent pas affecter la perception. Par ailleurs, les sujets semblent envisager la scène « comme si » ils y étaient eux-mêmes directement projetés, à la place de la caméra, et cela indépendamment de leur propre distance à l’écran. Tous ces résultats suggèrent la possibilité d’une association entre son binaural et visuel sur mobile dans des conditions d’utilisation proches du grand public.Dans la seconde partie de la thèse, nous tentons de répondre à la question de l’apport du binaural en déployant une expérience « hors les murs », dans un contexte plausible d’utilisation grand public. Trente sujets jouent dans leur vie quotidienne à un jeu vidéo de type Infinite Runner, développé pour l’occasion en deux versions, une avec du son binaural, et l’autre avec du son monophonique. L’expérience dure cinq semaines, à raison de deux sessions par jour. Ce protocole procède de la méthode dite "Experience Sampling Method", sur l’état de l’art de laquelle nous nous sommes appuyés. Nous calculons à chaque session des notes d’immersion, de mémorisation et de performance, et nous comparons les notes obtenues entre les deux versions sonores. Les résultats indiquent une immersion significativement meilleure pour le binaural. La mémorisation et la performance ne sont en revanche pas soumises à un effet statistiquement significatif du rendu sonore. Au-delà des résultats, cette expérience nous permet de discuter de la question de la validité des données en fonction de la méthode de déploiement, en confrontant notamment bien-fondé théorique et faisabilité pratique. / In recent years, smartphone and tablet global performances have been increased significantly (CPU, screen resolution, webcams, etc.). This can be particularly observed with video quality of mobile media services, such as video streaming applications, or interactive applications (e.g., video games). However, these evolutions barely go with the integration of high quality sound restitution systems. Beside these evolutions though, new technologies related to spatialized sound on headphones have been developed, namely the binaural restitution model, using HRTF (Head Related Transfer Functions) filters.In this thesis, we assess the potential contribution of the binaural technology to enhance the quality of experience of an audiovisual mobile application. A part of our work has been dedicated to define what is an “audiovisual mobile application”, what kind of application could be fruitfully experienced with a binaural sound, and among those applications which one could lead to a comparative experiment with and without binaural.In a first place, the coupling of a binaural sound with a mobile-rendered visual tackles a question related to perception: how to spatially arrange a virtual scene whose sound can be spread all around the user, while its visual is limited to a very small space? We propose an experiment in these conditions to study how far a sound and a visual can be moved apart without breaking their perceptual fusion. The results reveal a strong tolerance of subjects to spatial discrepancies between the two modalities. Notably, the absence or presence of individualization for the HRTF filters, and a large separation in elevation between sound and visual don’t seem to affect the perception. Besides, subjects consider the virtual scene as if they were projected inside, at the camera’s position, no matter what distance to the phone they sit. All these results suggest that an association between a binaural sound and a visual on a smartphone could be used by the general public.In the second part, we address the main question of the thesis, i.e., the contribution of binaural, and we conduct an experiment in a realistic context of use. Thirty subjects play an Infinite Runner video game in their daily lives. The game was developed for the occasion in two versions, a monophonic one and a binaural one. The experiment lasts five weeks, at a rate of two sessions per day, which relates to a protocol known as the “Experience Sampling Method”. We collect at each session notes of immersion, memorization and performance, and compare the notes between the monophonic sessions and the binaural ones. Results indicate a significantly better immersion in the binaural sessions. No effect of sound rendering was found for memorization and performance. Beyond the contribution of the binaural, we discuss about the protocol, the validity of the collected data, and oppose theoretical considerations to practical feasibility.
Μέθοδοι και διατάξεις απευθείας ηλεκτροακουστικής μετατροπής για ψηφιακό ήχο / Methods and implementations for direct electroacoustic transduction of digital audioΚοντομίχος, Φώτιος 06 October 2011 (has links)
Η παρούσα διδακτορική διατριβή εστιάστηκε στη μελέτη συστημάτων ακουστικής εκπομπής για απευθείας αναπαραγωγή ψηφιακού ήχου. Η ερευνητική διαδικασία βασίστηκε στον προσδιορισμό και βελτίωση των δυνατοτήτων δύο διαφορετικών υλοποιήσεων ακουστικής μετατροπής: i. Ένα υβριδικό πρωτότυπο θερμοακουστικό στοιχείο και ii. Μια συστοιχία 32 ηλεκτροδυναμικών μεγαφώνων σχεδιασμένη, ώστε να αναπαράγει ψηφιακά ηχητικά σήματα.
Η θερμοακουστική μετατροπή προσφέρει μια εναλλακτική τεχνική για υλοποιήσεις ακουστικών στοιχείων. Είναι βασισμένη στο μετασχηματισμό των διακυμάνσεων της θερμικής ενέργειας σε ακουστικό κύμα που προκαλούνται από τη ροή του ηλεκτρικού σήματος ήχου σε μια συσκευή στερεάς κατάστασης που λειτουργεί χωρίς τη χρήση οποιουδήποτε κινούμενου τμήματος ή μηχανισμού. Η υλοποίηση αυτής της τεχνικής ηχητικής αναπαραγωγής, μελετάται με τη χρήση ενός πρωτότυπου μετατροπέα ο οποίος αναπτύχθηκε πάνω σε πλακέτα κρυσταλλικού πυριτίου (silicon wafer). H απόδοση της συσκευής αυτής βελτιώνεται ιδίως όσον αφορά στις μη γραμμικές παραμορφώσεις που προσθέτει ο φυσικός μηχανισμός κατά την αναπαραγωγή των ακουστών συχνοτήτων. Για τις ανάγκες της ερευνητικής μελέτης κατασκευάσθηκε εξειδικευμένο στάδιο οδήγησης, ενώ επίσης αναπτύχθηκαν εργαλεία που προσομοιώνουν την απόδοση αυτών των συσκευών.
Οι ψηφιακές συστοιχίες μεγαφώνων (DLAs) σήμερα βασίζονται σε μικρούς μετατροπείς κινούμενου πηνίου για την ανακατασκευή ακουστικών σημάτων από ροές ψηφιακού ήχου. Τα σημαντικά ζητήματα απόδοσης για τα συστήματα αυτά αναλύονται από την παρούσα διατριβή, με στόχο να ερμηνευθεί η απόκριση συχνότητας και οι ρυθμοί των διακριτών (on/off) μεταβάσεων των μεγαφώνων, εξαιτίας των ψηφιακών σημάτων. Λεπτομερείς προσομοιώσεις που επιτρέπουν την πραγματοποίηση συγκρίσεων για μια πανομοιότυπη συστοιχία 32 μετατροπέων η οποία τροφοδοτείται από αναλογικά σήματα, σε παρόμοια τοποθέτηση και ενεργοποίηση των στοιχείων. Οι μελέτες αυτές παράγουν πρωτότυπα αποτελέσματα για τις απαιτήσεις σε ηλεκτρική ενέργεια και την ευαισθησία της συστοιχίας, καταλήγοντας στο συμπέρασμα ότι αυτά τα δύο συστήματα επιτυγχάνουν συγκρίσιμες επιδόσεις. / The present Phd Thesis is focused on the study of acoustic transduction systems for direct digital audio signal emission. The research process was based on the evaluation and optimization of the behavior of two different implementations: i. A novel hybrid thermoacoustic device and ii. A loudspeaker array consisting of 32 moving coil speakers designed for digital audio reproduction.
Thermoacoustic transduction offers an alternative technique for transducer implementations, based on the transformation of thermal energy fluctuations into sound after the direct application of the electrical audio signal on a solid state device which operates without the use of any moving/mechanical components. Here, an implementation of this sound generation technique is studied based on a prototype developed on silicon wafer and its performance is optimised, especially with respect to non-linear distortions within the audio band. For the purposes of the research study a specialised driving circuit was constructed and also the appropriate tools were developed to simulate the performance of these devices.
Digital loudspeaker arrays currently are based on small moving-coil speakers to reconstruct acoustic signals out of binary audio streams. An overview of significant performance issues for such systems is given here to explain frequency response and speaker discrete transition rates due to the digital data. Detailed simulations provided comparisons for a 32-speaker DLA with similar arrangements of speakers driven by analogue signals. These tests produce novel results for electrical power requirements and array sensitivity, concluding that these two systems achieve comparable performance.
