Cette thèse développe plusieurs contributions pour le traitement du signal et des images ainsi que pour la vision par ordinateur. La première partie inclut un nouvel algorithme de débruitage des sons et un algorithme de super-résolution pour l'agrandissement des images. Ces algorithmes sont basés sur de nouvelles représentations parcimonieuses par blocs. Une procédure de seuillage par bloc temps-fréquence est introduite pour le débruitage audio, qui permet de réduire le bruit sans introduire d'artefacts, avec des résultats perceptuels et numériques nettement supérieurs à l'état de l'art. Cette première partie introduit aussi un nouveau cadre mathématique et algorithmique pour des problèmes inverses, avec une régularisation non-linéaire sur des dictionnaires de blocs géométriques dans une représentation parcimonieuse. Une approche générale pour la super-résolution d'images est introduite et des résultats numériques améliorant l'état de l'art sont obtenus. La deuxième partie de la thèse introduit un algorithme (ASIFT) de mise en correspondance d'images, qui est invariant relativement à des transformations affines. Il est démontré que cet algorithme satisfait les contraintes d'invariance et qu'il peut effectuer des correspondances entre des objets observés sous des angles arbitraires. Sa complexité numérique est du même ordre que les algorithmes les plus efficaces, avec une robustesse bien supérieure grâce à son invariance affine. La troisième partie de la thèse introduit une implémentation biologiquement plausible de groupements visuels. Inspiré par les mécanismes de synchronisation neuronale en groupement perceptuel, un algorithme général basé sur des oscillateurs neuronaux est proposé pour effectuer des groupements visuels. Cet algorithme permet d'obtenir des résultats prometteurs sur plusieurs problèmes, dont le groupement de points, l'intégration de contours, et la segmentation d'images.
Identifer | oai:union.ndltd.org:CCSD/oai:pastel.archives-ouvertes.fr:pastel-00005513 |
Date | 30 June 2009 |
Creators | Yu, Guoshen |
Publisher | Ecole Polytechnique X |
Source Sets | CCSD theses-EN-ligne, France |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0017 seconds