L'objectif de cette thèse est la recherche d'outils de détection et de reconnaissance de la structure rythmique d'un morceau de musique. Il existe de nombreuses applications nécessitant l'information rythmique, parmi lesquelles la transcription musicale par ordinateur, l'alignement rythmique de plusieurs instruments, tâches de "music information retrieval". L'axe principal du travail de recherche a consisté en le développement de techniques pour l'estimation des paramètres rythmiques (cadences et localisation de beats à plusieurs niveaux). Parmi les originalités de ce travail de recherche, nous avons proposé de effectuer l'analyse rythmique de façon séparée sur la partie déterministe du signal musical (contenant les sons harmoniques) et sur la partie stochastique (contenant le signal résiduel après extraire la partie harmonique du son original). Dans le domaine du traitement des signaux audio, la détection robuste et efficace des attaques (onsets) des signaux musicaux est considérée comme un sujet difficile. A ce propos, nous utilisons le concept du flux énergétique spectral comme le taux auquel l'énergie du contenu fréquentiel du signal audio change à un instant donné. Et nous nous sommes servis de ce principe pour développer un détecteur d'attaques très performant qui améliore de façon considérable la méthode de calcule traditionnelle. Une autre originalité de ce travail consiste en l'utilisation d'un algorithme de programmation dynamique modifiée pour suivre simultanément plusieurs trajectoires rythmiques à l'intérieur d'un signal musical. L'efficacité de cette approche a été validé sur une base de données comportant 1435 morceaux musicaux appartenant à une dizaine de genres. Les algorithmes développés ont été soumis à évaluation dans le cadre du concours international "Music Information Retrieval Evaluation eXchange" (MIREX) dans la catégorie de "tempo extraction" et dans la l'édition 2005 un des algorithmes obtenu la première place parmi plus d'une dizaine de participants.
Identifer | oai:union.ndltd.org:CCSD/oai:pastel.archives-ouvertes.fr:pastel-00002244 |
Date | 11 1900 |
Creators | Alonso Arevalo, Miguel A. |
Publisher | Télécom ParisTech |
Source Sets | CCSD theses-EN-ligne, France |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0023 seconds