L'objet de cette thèse est l'étude du problème d'estimation de fréquences fondamentales multiples, pour des mélanges de parole et de musique dont le nombre de sources est inconnu. Dans le cadre de la parole, nous proposons une méthode itérative qui estime successivement les fréquences fondamentales. La nature «voisée/non-voisée» des mélanges est caractérisée par un modèle du type "sommes de sinusoïdes harmoniques + bruit autorégressif". L'estimation consiste à maximiser un terme de Vraisemblance pénalisée qui permet également d'estimer le nombre de sources. Dans le cadre musical, nous proposons trois nouvelles méthodes qui estiment simultanément les fréquences fondamentales. Basées sur une classification des pics spectraux du mélange, elles diffèrent par leur technique de classification. Toutes permettent d'estimer le nombre de sources. Elles permettent également de prendre en compte les recouvrements spectraux entre notes et sont ainsi applicables au traitement d'accords musicaux.
Identifer | oai:union.ndltd.org:CCSD/oai:pastel.archives-ouvertes.fr:pastel-00000723 |
Date | 12 1900 |
Creators | Rosier, Julie |
Publisher | Télécom ParisTech |
Source Sets | CCSD theses-EN-ligne, France |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0019 seconds