• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 124
  • 124
  • 124
  • 124
  • 124
  • 119
  • 114
  • 101
  • 45
  • 5
  • Tagged with
  • 436
  • 436
  • 436
  • 215
  • 215
  • 215
  • 215
  • 215
  • 75
  • 44
  • 44
  • 38
  • 38
  • 25
  • 23
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Graphical performance software in contexts: explorations with different strokes

Zadel, Mark January 2013 (has links)
This thesis proposes a novel approach to musical software analysis that prescribes testing a given software interface in a wide variety of hardware contexts, each providing unique insights into its design. This work is situated in the general context of graphical software performance, which we define as musical performance through manipulating an on-screen software interface to create music. The analysis strategy is investigated using the Different Strokes (DS) performance environment as a specific example. A series of software extensions to DS were undertaken to extend the application to new hardware contexts and use cases. These include extensions for the use of Different Strokes in an interdisciplinary performance work, d_verse; the adaptation of DS to work on a large multi-touch surface; the integration of a force-feedback input device; and the integration of the libmapper framework, allowing it to be easily interconnected with alternative input and output devices. The thesis also presents a historical overview of graphical software intended for live use, and a background on general issues in interface design for this usage context. An exploratory user test was performed with the force-feedback setup where participants used DS in the presence of simulated physical forces. While there was no clear preference for any of the haptic effects, the different physical forces present are demonstrated to have gestural implications. These kinds of implications should be taken into account when designing mappings from gesture to sound, and in the overall interaction design. / Cette thèse propose une nouvelle stratégie d'analyse de logiciels pour la musique par l'utilisation d'interfaces graphiques dans divers contextes matériels informatiques. Notre travail s'inscrit dans la perspective globale de « graphical software performance » définie ici comme la manipulation d'interfaces utilisateur lors de performances musicales. La stratégie d'analyse que nous proposons a été explorée à partir de Different Strokes (DS), un logiciel conçu pour la création musicale. Pour permettre l'utilisation de DS dans plusieurs contextes matériels et contextes d'utilisation nouveaux, nous avons développé un ensemble d'extensions. Ces extensions ont été élaborées, entre autres, pour l'utilisation de DS dans la série de performances interdisciplinaires d_verse. Nous avons également adapté DS pour qu'il soit compatible avec une surface « multi-touch » de grande taille, nous y avons intégré une interface haptique, et nous y avons ajouté libmapper, une bibliothèque logicielle facilitant l'interconnectivité d'interfaces d'acquisition et de restitution. Cette thèse présente, en outre, un survol de l'histoire des logiciels graphiques conçus pour l'usage en direct et une discussion des problèmes liés à la conception d'interfaces utilisateur dans ce contexte précis d'utilisation. Un test exploratoire a été effectué avec le système haptique intégré à DS. Lors du test, les participants ont utilisé Different Strokes en présence de différentes forces physiques simulées. Bien que nous n'ayons pas observé de préférence claire pour l'un ou l'autre des effets haptiques, nous démontrons que les différentes forces physiques présentes influencent néanmoins la gestuelle. Nous concluons que leur influence doit être prise en considération dans la conception de mappings entre le geste et le son et dans la conception d'interaction en général.
12

Pre-existing music in United States presidential campaigns, 1972-2012

Gorzelany-Mostak, Dana January 2013 (has links)
Over the past forty years, pre-existing popular music has played an increasingly significant role in the soundscapes of United States presidential campaigns—rallies, conventions, advertisements, and fundraising concerts have all featured such music—yet this phenomenon has received little attention in musicological circles. Drawing on various modes of analytical inquiry from the areas of cultural studies, political theory, media studies, and the semiology of music, this dissertation establishes a critical framework for the analysis of pre-existing popular songs within the context of campaigning, and then applies it to case studies that demonstrate how music factors in the formation of candidate identity, party identity, and American identity. In addition to examining the social, cultural, technological, and economic factors that precipitated the shift from newly composed to pre- existing music in campaigning, my work draws on documentary evidence to examine the cultural and institutional factors that engendered alliances between musicians and candidates. This work contributes to a burgeoning body of scholarship that seeks to re-evaluate the complex relationship between popular music and politics, and engages with recent scholarship in film and popular music studies that examines the use of pre-existing music in various contexts. / Depuis les 40 dernières années, la musique populaire préexistante a joué un rôle toujours grandissant dans le paysage sonore des campagnes présidentielles américaines – rassemblements, conventions, publicité, et concerts bénéfices ont tous mis en valeur ce genre de musique – pourtant ce phénomène a reçu peu d'attention dans les cercles musicologiques. En se basant sur divers modes d'analyses issus des études culturelles, théories politiques, études des médias, et sémiologie musicale, cette thèse établit un cadre théorique pour l'analyse de chansons populaires préexistantes dans le contexte d'une campagne présidentielle, et l'applique ensuite à des études de cas démontrant de quelle manière la musique peut être prise en compte dans la formation de l'identité du candidat, l'identité du parti, et l'identité américaine. En plus d'examiner les facteurs sociaux, culturels, technologiques et économiques ayant mené au passage de la musique nouvellement composée à de la musique préexistante lors de campagnes présidentielles, mes travaux se basent sur des preuves documentaires afin d'examiner les facteurs culturels et institutionnels ayant engendré des alliances entre des musiciens et des candidats. Ce travail apporte une contribution à un nombre croissant de recherches universitaires cherchant à réévaluer la relation complexe existant entre la musique populaire et la politique, et amorce un dialogue avec les recherches universitaires récentes dans les domaines du film et de la musique populaire examinant l'utilisation de la musique préexistante dans différents contextes.
13

"Toward Silence" for two flutes and ensemble

Codner, Kimberly January 2013 (has links)
Toward Silence (12 minutes) is a composition for two flutes and ensemble. The instrumentation consists of eight performers: two flutes, Bb clarinet, bassoon, horn in F, percussion (vibraphone, marimba, snare drum), piano, and violin. The spatial disposition of the instruments emphasizes the two flutes in the front and allows smaller groupings to emerge. The single-movement work is made up of numerous cycles of sound that differ in duration and consists of four parts: A) a gesture (motivic material) B) multiple "echoes" of that gesture (freely spaced repetitive notes, comparable to reverberations) C) the resonance of the echoes (no fresh attacks) and D) silence (the fade-out of the resonance). These cycles operate at numerous micro-levels and one macro-level of structure. Gradually, the whole piece moves toward silence. / Toward Silence est une composition de 12 minutes pour deux flûtes et un ensemble. L'œuvre est écrite pour huit interprètes : deux flûtes, une clarinette en si bémol, un basson, un cor en fa, un percussionniste (vibraphone, marimba, et caisse claire), un piano, et un violon. Les instruments sont disposés de façon à mettre en évidence les deux flûtes à l'avant et à permettre l'émergence de petites groupes. L'œuvre, en un seul mouvement, est constituée de nombreux épisodes sonores de différentes durées qui contiennent chacun quatre parties : A) un geste (matériel motivique); B) multiples « échos » de ce geste (notes répétitives librement espacées à la façon de réverbérations); C) la résonance des échos (aucune attaque nouvelle); et D) le silence (résonance en fondu). Ces cycles peuvent être entendus à des niveaux micro et macro de la structure. Progressivement, la pièce devient silencieuse.
14

Ersilias: form, movement and multiplicity in the composition of place

Rogers, Stephen Allan January 2013 (has links)
This study, consisting of the dissertation in hand and the accompanying multi-part composition entitled Ersilias, seeks to explore the relationship between art and place. Through a variety of parameters falling under the general themes of form, movement and multiplicity, the study questions what it means to compose and how the craft is inextricably connected to the human experience of place. Section 1 of the dissertation reviews the conceptual and theoretical framework of the composition and its relationship with place. While the work of several influential thinkers has a place in this framework, it is primarily in the work of Gilles Deleuze, Félix Guattari and Italo Calvino that Ersilias finds its strongest foundation. Building around metaphors derived from those writers, in particular, spiderweb, labyrinth, rhizome, plateau and territory, I argue that the composition, like place, must be understood as an active form in which there exists virtually endless possibility for movement and exchange. In particular, important opinions are presented on the way in which place can be understood as a multiplicitous forum expressed through the interplay of countless voices which, in turn, define the very place in which they interact. Section 2 of the dissertation consists of a number of analyses of various parts of the composition. These analyses illustrate the wide variety of ways in which the composition explores the concepts and theories discussed in Section 1. Particularly close attention is paid to the four musical works that are part of the composition. Each of these pieces illustrates a unique and rich approach to the relationship between the art work and place, approaches which combine ideas from various diverse musical traditions and philosophical fields of study. The analytical framework developed in the dissertation speaks in a language quite distinct from that present in most of the composition. As such, the reader is able to approach the relationship between art and place from two very different angles, one gradated and methodical, the other labyrinthine and manifold. Section 3 returns to the conceptual and theoretical fabric of the work, reemphasizing the importance of the person actively experiencing the work as the individual most responsible for the way in which it unfolds. This individual is revealed to be as much the composer of Ersilias as I am. While the section is ostensibly a summary of Chapter 1, several new and important ideas are revealed as one approaches the end of the dissertation. It is here that the final arguments linking the experiencing of art to the experiencing of place are made, arguments which through form, movement and multiplicity phrase art as the composition of place. / Ce projet, qui consiste en une thèse et en une composition multidisciplinaire intitulée Ersilias, vise à explorer la relation entre art et lieu. À l'aide d'une variété de paramètres relevant de thèmes généraux qui se rapportent aux notions de forme, de mouvement et de multiplicité, le projet questionne l'acte même de composer en démontrant comment l'artisanat du compositeur est inextricablement lié à l'expérience humaine du lieu. La section 1 de la thèse examine le cadre conceptuel et théorique de la composition et sa relation avec la notion de lieu. Bien que le travail de plusieurs penseurs influents se retrouve dans cette réflexion, c'est surtout dans l'œuvre de Gilles Deleuze, Félix Guattari et Italo Calvino qu' Ersilias trouve son principal point d'ancrage. À partir du jeu des métaphores tirées des œuvres de ces écrivains—en particulier les images évoquant la toile d'araignée, le labyrinthe, le rhizome, le plateau et le territoire—je soutiens que la composition, comme le lieu, doit être comprise comme une forme active dans laquelle il existe la possibilité pratiquement illimitée de mouvement et d'échanges. En particulier, d'importantes réflexions sont présentées sur la manière dont le concept de lieu peut être illustré en tant que forum multidimensionnel qui se défini par le jeu de voix innombrables qui, à leur tour, définissent le lieu même où ils interagissent. La section 2 de la thèse se compose d'un certain nombre d'analyses des différentes parties de la composition. Ces analyses illustrent la grande variété de façons dont la composition explore les concepts et les théories discutées dans la Section 1. Une attention toute particulière est portée aux quatre œuvres musicales qui font partie de cette composition. Chacune de ces pièces illustre de façon unique et riche la relation qui existe entre l'œuvre d'art et le lieu. Ces approches combinent des idées provenant de diverses traditions musicales et philosophiques. Le cadre analytique développé dans la thèse s'exprime dans une langue très différente de celle présente le plus souvent dans la composition. En tant que tel, le lecteur est en mesure d'aborder la relation entre art et lieu à partir de deux angles très différents, l'un graduée et méthodique, l'autre labyrinthiques et multiples. Section 3 revient au tissu conceptuel et théorique, soulignant à nouveau l'importance du lecteur/auditeur dans le déroulement de l'œuvre d'art.Cet individu peut tout aussi bien se révéler être le compositeur de Ersilias lui-même. Alors que la section est visiblement un résumé du chapitre 1, plusieurs idées nouvelles et importantes se révèlent lorsque l'on s'approche de la conclusion de la thèse. C'est ici que se déploient les dernières argumentations reliant l'expérience de l'art à l'expérience du lieu ; arguments qui, par la forme, le mouvement et la multiplicité présente l'art comme la composition du lieu.
15

Categorization and modeling of sound sources for sound analysis/synthesis

Lee, JungSuk January 2013 (has links)
In this thesis, various sound analysis/re-synthesis schemes are investigated in a source/filter model framework, with emphasis on the source component. This research provides improved methods and tools for sound designers, composersand musicians to flexibly analyze and synthesize sounds used for gaming, film or computer music, ranging from abstract, complex sounds to those of real musical instruments. First, an analysis-synthesis scheme for the reproduction of a rolling ball sound is presented. The proposed scheme is based on the assumption that the rolling sound is generated by a concatenation of micro-contacts between a ball and a surface, each having associated resonances. Contact timing information is extracted from the rolling sound using an onset detection process, allowing for segmentation of a rolling sound. Segmented sound snippets are presumed to correspond to micro-contacts between a ball and a surface; thus, subband based linear predictions (LP) are performed to model time-varying resonances and anti-resonances. The segments are then resynthesized and overlap-added to form a complete rolling sound. A "granular" analysis/synthesis approach is also applied to various kinds of environmental sounds (rain, fireworks, walking, clapping) as an additional investigation into how the source type influences the strategic choices for the analysis/synthesis of sounds. The proposed granular analysis/synthesis system allows for flexible analysis of complex sounds and re-synthesis with temporal modification. Lastly, a novel approach to extract a pluck excitation from a recorded plucked string sound is proposed within a source / filter context using physical models. A time domain windowing method and an inverse filtering-based method are devised based on the behavior of wave propagation on the string. In addition, a parametric model of the pluck excitation as well as a method to estimate its parameters are addressed. / Dans cette thèse, nous avons étudié plusieurs scéhmas d'analyse/synthèse dans le cadre des modèles source/filtre, avec un attention particulière portée sur la composante de source. Cette recherche améliore les méthodes ainsi que les outils fournis créateurs de sons, compositeurs et musiciens désirant analyser et synthétiser avec flexibilité des sons destinés aux jeux vidéos, au cinéma ou à la musique par ordinateur. Ces sons peuvent aller de sons abstraits et complexes à ceux provenant d'instruments de musique existants. En premier lieu, un schéma d'analyse-synthèse est introduit permettant la reproduction du son d'une balle en train de rouler. Ce schéma est fondé sur l'hypothèse que le son de ce roulement est généré par la concaténation de micro-contacts entre balle et surface, chacune d'elles possédant sa proper série de résonances. L'information relative aux temps de contact est extradite du son du roulement que l'on cherche à reproduire au moyen d'une procédure détectant le début du son afin de le segmenter. Les segments de son ainsi isolés sont supposés correspondre aux micro-contacts entre la balle et la surface. Ainsi un algorithme de prédiction linéaire est effectué par sous-bande, préalablement extraites afin de modéliser des résonances et des anti-résonances variants dans le temps. Les segments sont ensuite re-synthétisés, superposés et additionnés pour reproduire le son du roulement dans son entier. Cette approche d'analyse/synthèse "granulaire" est également appliquée à plusieurs sons de types environnementaux (pluie, feux d'artifice, marche, claquement) afin d'explorer plus avant l'influence du type de la source sur l'analyse/synthèse des sons. Le système proposé permet une analyse flexible de sons complexes et leur synthèse, avec la possibilité d'ajouter des modifications temporelles.Enfin, une approche novatrice pour extraire le signal d'excitation d'un son de corde pincée est présentée dans le contexte de schémas source/filtre sur une modèlisation physique. A cet effet, nous introduisons une méthode de type fenêtrage, et une méthode de filtrage inverse fondée sur le type de propagation selon laquelle l'onde se déplace le long de la corde. De plus, un modèle paramétrique de l'excitation par pincement ainsi qu'une méthode d'estimation de ces paramètres sont détaillés.
16

Sparse and structured atomic modelling of audio

Kereliuk, Corey January 2013 (has links)
Many natural signals of practical interest are inherently sparse (or at least highly compressible) in an appropriate basis. This is often true of Fourier and wavelet-based decompositions of images and audio, and the number of applications based on these transforms is a testament to this fact. These representations are important because a) they are typically parsimonious; and, b) they highlight the important signal information in terms of salient parameters. Interest in sparsity has steadily grown over the past several years, namely due to the large number of successful applications based on sparse signal processing, e.g., inpainting, denoising, and compressive sensing. In this dissertation we examine sparse time-frequency representations of musical audio based on overcomplete Gabor frames. In particular we focus on how to find representations that are well-adapted to the underlying structures in the signal. We approach this challenge in two ways. The first is to enforce certain relationships between model coefficients during the estimation. This leads to models with greater time-frequency persistence between adjacent coefficients, and improves the separation of audio in morphologically similar layers. The second approach is to adapt a set of waveforms to the sound through a content-based analysis. For example, we discuss how to adapt the window length and chirp rate in order to parsimoniously model the time-varying structures in musical audio. We also demonstrate that the work presented in this dissertation is applicable to a wide range of problems, and we show that performance improvements are often gained by following the strategies outlined in this thesis. / La plupart des signaux naturels d'intérêt pratique sont intrinsèquement parcimonieux (ou du moins hautement compressible) lorsque décomposés sur une base appropriée. Ceci est notamment vrai dans le cas de décompositions d'images ou de signaux audio sur des bases de Fourier ou d'ondelettes. Ainsi en atteste de manière indubitable le nombre d'applications fondées sur ces transformations. Ces représentations sont importantes car a) elles sont généralement parcimonieuses et b) révèlent de l'information fondamentale en termes de paramètres pertinents. L'intérêt pour la parcimonie n'a cessé de croître ces dernières années, en raison du succès grandissant d'applications fondées sur cette approche, telles que le débruitage, la restauration et l'échantillonnage compressif. Dans cette thèse, nous examinons des représentations temps fréquence de signaux audio et musicaux fondées sur des repères obliques de type Gabor. Plus spécifiquement nous nous concentrons sur la façon de trouver des représentations bien adaptées à la structure sousjacente des signaux. Nous abordons ce défi de deux manières. La première consiste à faire valoir certaines relations structurelles entre les coefficients du modèle lors de l'estimation. Cela conduit à des modèles dont la persistance temps-fréquence entre coefficients adjacents est accrue, et en conséquence, à l'amélioration de la séparation de signaux audio en différents niveaux regroupant des éléments morphologiquement semblables. La seconde consiste à optimiser un ensemble de formes d'onde en l'adaptant au contenu du signal sonore analysé. Par exemple, nous discutons de la façon d'adapter la longueur de la fenêtre ainsi que le taux de modulation fréquentiel des éléments du dictionnaire afin de renforcer la parcimonie de représentation des variations temporelles inhérentes aux signaux audio et musicaux. Nous démontrons également que le travail présenté dans cette thèse peut être utilisé pour résoudre un large éventail de problèmes, et que l'application des stratégies exposées dans ce document peut conduire à des améliorations sensibles de performance lors de décompositions.
17

Turning over, for 13 instruments, piano, electronic microtonal piano and electronics

Flanagan, Beavan January 2013 (has links)
Turning Over is a 13-minute composition for 13 instruments, piano, electronic piano and pre-recorded electronics. A strong emphasis on harmony, representing the result of two years of research into various intonation theories of the 17th, 18th and 20th centuries, is reflected in the subtle variations in intonation between the equal-tempered acoustic instruments and the just-intonation tuning of the electronics as well as the electronic piano. The musical discourse reflects philosophical concerns regarding the concept of essence in music and its illusive nature – this translates into a musical form that is in a constant state of transformation. / Turning Over ('ressasser') est une composition pour 13 instruments, piano, piano électronique et sons électroniques d'une durée de 13 minutes. Un fort accent sur l'harmonie, qui est le résultat de deux années de recherche sur les théories du tempérament musical du 17e, 18e et 20e siècle, est reflété dans les variations subtiles de tempérament entre les instruments acoustiques et les éléments électroniques. Le discours musical reflète des préoccupations philosophiques concernant le concept de l'essence dans la musique et de sa nature illusoire – ceci se traduit dans une forme musicale qui est toujours en état de transformation.
18

Charles Mingus, Jazz and Modernism

Latour, Philippe January 2013 (has links)
The purpose of this thesis is to explore the diverse discourses of modernism in jazz at mid-century in relation to the work of Charles Mingus. What was meant by modern jazz in Mingus' time? How was his music, as well as his life as a jazz musician and composer, affected by discourses of modernism? Modernism was used in the jazz field as a discourse to elevate jazz from its role as entertainment music into a legitimate art form. In its transfer from European art music to African-American jazz, the concept of aesthetic modernism retained most of its signification: it was associated with the notions of progress, of avant-gardism, and, eventually, of political militancy; and all these notions can be found in multiple forms in Mingus' work. This thesis defines the concept of modern jazz as it was used in the jazz press in the 1950s and 1960s in relation to the critical discourse around Afro-modernism as well as in relation with Mingus' conception of himself as a composer. / L'objectif de ce mémoire est d'explorer les différents discours sur le modernisme et le jazz des années 1950 et 1960 en relation avec l'œuvre de Charles Mingus. Que signifiait le terme modern jazz à l'époque de Mingus? Comment la musique de ce dernier, ainsi que sa carrière comme musicien de jazz et compositeur, furent affectées par les discours sur le modernisme? Ces discours furent utilisés dans le monde du jazz pour légitimer celui-ci en tant que forme artistique. Dans son passage de la musique « sérieuse » européenne au jazz afro-américain, la notion de modernisme artistique a conservé la majeure partie de sa signification : association avec les idées de progrès, d'avant-gardisme, et aussi de militantisme politique. Toutes ces idées se retrouvent sous différentes formes dans l'œuvre de Mingus. Ce mémoire définit le concept de modern jazz tel qu'il était utilisé dans le discours journalistique des années 1950 et 1960, et y relie le discours académique sur le modernisme afro-américain, afin d'évaluer comment Mingus interagit avec ceux-ci.
19

Automatic guitar tablature transcription online

Burlet, Gregory January 2013 (has links)
Manually transcribing guitar tablature from an audio recording is a difficult and time-consuming process, even for experienced guitarists. While several algorithms have been developed to automatically extract the notes occurring in an audio recording, and several algorithms have been developed to produce guitar tablature arrangements of notes occurring in a music score, no frameworks have been developed to facilitate the combination of these algorithms. This work presents a web-based guitar tablature transcription framework capable of generating guitar tablature arrangements directly from an audio recording. The implemented transcription framework, entitled Robotaba, facilitates the creation of web applications in which polyphonic transcription and guitar tablature arrangement algorithms can be embedded. Such a web application is implemented, resulting in a unified system that is capable of transcribing guitar tablature from a digital audio recording and displaying the resulting tablature in the web browser. The performance of the implemented polyphonic transcription and guitar tablature arrangement algorithms are evaluated using several metrics on a new dataset of manual transcriptions gathered from tablature websites. / Transcrire à la main une tablature pour guitare à partir d'un enregistrement audio est un processus difficile et long, même pour les guitaristes chevronnés. Bien que plusieurs algorithmes aient été créés pour extraire automatiquement les notes d'un enregistrement audio, et d'autres pour préparer des arrangements de notes de tablature pour guitare tels qu'on les retrouve dans la création musicale, aucun environnement n'a été mise en place pour faciliter l'association de ces algorithmes. Le travail qui suit présente un environnement accessible sur l'Internet, permettant la transcription et la préparation d'arrangements de tablatures de guitare, directement à partir d'un enregistrement audio. Cet environnement de transcription, nommée Robotaba, facilite la création d'applications Web, dans lesquelles la transcription polyphonique et les algorithmes d'arrangements de tablature pour guitare peuvent être intégrés. Une telle application Web permet d'obtenir un système unifié, capable de transcrire une tablature pour guitare à partir d'un enregistrement audio numérique, et d'afficher la tablature obtenue dans un navigateur Web. La performance de la transcription polyphonique mise en place et des algorithmes d'arrangements de tablature pour guitare est évaluée à l'aide de plusieurs paramètres et d'un nouvel ensemble de données, constitué de transcriptions manuelles recueillies dans des sites Web consacrés aux tablatures.
20

Evaluating musical fingerprinting systems

Porter, Alastair January 2013 (has links)
Audio fingerprinting is a process that uses computers to analyse small clips of music recordings to answer a common question that people who listen to music often ask : "What is the name of that song I hear ?" Audio fingerprinting systems identify musical content in audio and search a reference database for recordings that contain the same musical features. These systems can find matching recordings even when the query has been recorded in a public space and contains added noise. Different audio fingerprinting algorithms are better at identifying different types of queries, for example, queries that are short, or have a large amount of noise present in the signal. There are few comprehensive comparisons of fingerprinting systems available in the literature that compare the retrieval accuracy offingerprinting systems with a wide range of querys.This thesis presents an overview of the historical developments in audio fingerprinting, including an analysis of three state-of-the-art audio fingerprinting algorithms. The thesis introduces factors that must be considered when performing a comparative evaluation of many fingerprinting algorithms, and presents a new evaluation framework that has been developed to address these factors. The thesis contributes the results of a large-scale comparison between three audio fingerprinting algorithms, with an analysis recommending which algorithms should be used to identify music queries recorded in different situations. / Le système d'empreinte audio est un procédé qui analyse de courts extraits de musique avec un ordinateur pour répondre à une question courante: « Quelle est le nom de cette chanson que j'écoute? ». Les systèmes d'empreintes audio identifient le contenu musical d'un enregistrement et cherchent des documents sonores possédant les même traits musicaux au sein d'une base de données de référence. Ces systèmes sont capables de fonctionner même si les requêtes qui leur sont transmises sont enregistrées dans un espace public, avec de nombreuses sources de bruit extérieur. Les différents algorithmes d'empreinte audio se distinguent par le type de requête qu'ils peuvent traiter: certains se concentrent sur des requêtes de courte durée, d'autres sont optimisés pour pouvoir être performant même dans des conditions de bruit très défavorables. Dans la littérature, il existe peu d'études comparatives poussées traitant spécifiquement des performances des systèmes de reconnaissance par empreinte audio dans un large éventail de cas.Cette thèse présente une vue d'ensemble de l'histoire du développement des systèmes d'empreinte audio. Cette thèse introduit en suite des facteurs qui doivent être pris en compte lors de l'évaluation comparative de plusieurs algorithmes pour la reconnaissance par empreinte audio. De plus, ce travail présente un nouveau cadre d'évaluation développé afin d'incorporer ces facteurs. Cette thèse combine les résultats d'une comparaison à grande échelle de trois algorithmes d'identification d'empreinte audio avec une analyse recommandant lequel de ces algorithmes est le plus efficace pour identifier la plus grande variété d'extraits audio.

Page generated in 0.1554 seconds