Nous étudions le problème général du traitement d'antennes de microphones dans des environnements contenant du bruit diffus. Ce problème a plusieurs applications incarnées par le rehaussement et la reconnaissance robuste de la parole. Du bruit diffus provenant de nombreuses directions à la fois est souvent rencontré dans les situations réelles et il forme un obstacle majeur à l'application des techniques existantes de localisation et de réhaussement de sources. Nous opérons dans le domaine temps-fréquence, où la cible et le bruit sont gaussiens de moyenne nulle et modélisés par leurs matrices de covariance. Premièrement, nous introduisons un modèle général de sous-espace linéaire de la matrice de covariance du bruit qui généralise trois modèles de l'état de l'art et nous proposons un quatrième modèle de covariance à valeur réelle plus flexible. Nous mesurons expérimentalement l'adéquation de ces modèles à des signaux de bruits réels. Deuxièmement, nous appliquons ce modèle général à la tâche de débruitage pour une cible de vecteur de direction connu. Dans l'approche de l'état de l'art par formation de voies et post-filtrage de Wiener, il est essentiel d'estimer précisément le spectre de puissance à court terme de la cible. Nous proposons un algorithme pour l'estimation de ce spectre basé sur la projection de la matrice de covariance observée sur le complément orthogonal du sous-espace de la matrice de covariance du bruit. La composante résultant de cette projection est idéalement non contaminée par le bruit, ce qui permet une estimation plus précise du spectre de puissance de la cible. Nous évaluons expérimentalement la performance de débruitage avec des signaux de bruits réels. Troisièmement, nous étudions la tâche de localisation de sources multiples. Afin d'atténuer la dégradation de performance de l'algorithme de l'état de l'art MUltiple SIgnal Classification (MUSIC) en présence de bruit diffus, nous estimons la matrice de covariance de la cible et appliquons MUSIC à cette matrice. Cette estimation repose sur la composante non bruitée de la matrice de covariance de la cible estimée ci-dessus par projection et sur la reconstruction de la composante manquante par des techniques de complétion de matrice. Nous proposons deux algorithmes alternatifs basés sur une approximation de rang faible et sur la minimisation de la norme trace en exploitant le faible rang et la nature hermitienne définie semi-positive de la matrice de covariance du signal. Nous comparons la performance de ces deux algorithmes pour les quatre modèles de bruit sur un corpus que nous avons créé. Enfin, nous présentons un algorithme général pour le débruitage d'une source cible dont le vecteur de direction est inconnu. Cette tâche est importante dans un environnement réel, car le vecteur de direction n'est généralement pas connu précisément en pratique. Nous estimons conjointement le vecteur de direction et le spectre de puissance à court terme de la cible pour effectuer la formation de voies et le post-filtrage de Wiener. L'estimation repose sur une complétion de matrice de rang 1 et sur une analyse en composantes principales (ACP). L'algorithme proposé améliore la rapport signal-à-bruit (RSB) de 7 dB environ par rapport à l'algorithme de l'état de l'art d'analyse en vecteurs indépendants (AVI).
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00691931 |
Date | 24 January 2012 |
Creators | Ito, Nobutaka |
Source Sets | CCSD theses-EN-ligne, France |
Language | English |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0024 seconds