361 |
Mouvement et vidéo : estimation, compression et filtrage morphologiqueLaveau, Nicolas 12 December 2005 (has links) (PDF)
Le travail de thèse développé dans ce mémoire porte sur le traitement des séquences vidéos. Ceci inclut la compression pour une grande partie de la thèse, mais également le filtrage spatio-temporel et la segmentation vidéo. Un des outils d'analyse récurrent dans chacune de ces applications est la mesure du mouvement, c'est-à-dire la description de la cohérence temporelle d'une séquence vidéo. Un système de compression vidéo comprend généralement les trois composantes suivantes : estimation du mouvement, transformations temporelle et spatiale, quantification et codage des coefficients. Nous nous intéressons successivement à chacune de ces composantes. Dans un premier temps, nous essayons d'adapter une méthode d'estimation par projection du flot optique sur une base d'ondelettes à valeur complexe à la compression vidéo. Le champ obtenu étant dense et sensible au bruit, nous introduisons dans la résolution un élément de régularisation afin de diminuer son coût de codage. En dépit d'une nette amélioration apportée par nos modifications, la technique d'estimation par projection sur une base d'ondelettes n'est pas compétitive face au block-matching qui constitue l'algorithme de référence pour la compression vidéo. Cela illustre bien le fait que le choix et la conception d'une méthode sont étroitement liés à l'usage qui en est fait : des mé- thodes d'estimation de mouvement optimisées pour des applications aussi diverses que la compression vidéo, le filtrage et la segmentation, ou encore l'analyse de scènes 3D ont peu de chances d'être les mêmes. Dans ces expériences, nous avons utilisé une méthode visant à satisfaire un critère qui est équivalent à un critère d'appariement optimal pour la compression sous des conditions théoriques qui ne sont en général pas vérifiées. Une telle approche est donc visiblement sous-optimale. Forts de cette observation, nous avons ensuite développé une méthode de mesure de mouvement qui repose sur une paramétrisation du champ bilinéaire par morceaux, et qui minimise cette fois directement l'erreur quadratique moyenne qui est notre critère d'évaluation. Nous montrons qu'il est possible d'obtenir de bons résultats quand les paramètres du champ sont épars. Un codage vidéo avec une prédiction temporelle suppose de coder des données aussi hétérogènes que des champs de mouvement ou des images d'erreur. Nous avons travaillé sur l'allocation de débit entre images d'erreur et de manière moins approfondie entre image d'erreur et champ de mouvement. Nous avons adapté un modèle de planification de débit introduit par Mallat et Falzon qui a été initialement conçu pour des images statiques et qui est actuellement utilisé pour la compression au ot d'images satellitales. Cette approche se révèle meilleure que des approches plus classiquement utilisées en compression vidéo. Pour pouvoir effectuer un codage par transformée du champ et des images d'erreur, nous avons cherché à concevoir de nouvelles transformations en sous-bandes non-linéaires. Pour cela, nous avons utilisé le schéma de lifting, qui garantit l'inversibilité formelle des transformations qu'il peut réaliser, que celles-ci soient linéaires ou non. Nous avons construit deux nouvelles décompositions non-linéaires. La première vise à réduire un artéfact communément appelé e et de Gibbs. Cette première décomposition consiste à utiliser un prédicteur de Deslauriers-Dubuc modifié de manière à réduire ces artéfacts. La modification introduite permet effectivement de réduire les oscillations autour de discontinuités en échange d'un surcoût modeste en terme d'efficacité de représentation dans les sections régulières du signal représenté. La formulation évite le mécanisme de transition d'un filtre à l'autre relativement habituel dans ce genre d'approche en recourant à des opérateurs continus de type min et max, qui permettent de garantir la continuité de la transformation et donc sa stabilité après quantification. L'autre se propose d'améliorer la décomposition en ondelettes du champ de mouvement en utilisant l'information qu'apporte chacune de ses composantes sur l'autre. En effet, l'intuition nous incite à penser que les discontinuités sont présentes au même endroit dans chacune des composantes du mouvement. Nous nous servons de cette co-occurrence des discontinuités pour choisir le filltre de prédiction. Dans les deux cas, les méthodes mises au point donnent des résultats positifs sur des signaux de synthèse mais perdent en efficacité sur des signaux réels. Une des grandes difficultés est de mettre au point un étage de mise-à-jour dans le schéma de lifting. Par ailleurs, le schéma linéaire le plus efficace est un schéma à 4 étages pour lequel il est difficile de concevoir un concurrent non-linéaire dans la mesure où ses propriétés sont difficilement lisibles sur les étages individuels du schéma de lifting. Nfin transposé des idées rencontrées en compression vidéo pour dé nir des opérations de filtrage morphologique vidéo intégrant la mesure du mouvement, utilisant des éléments structurants qui suivent le mouvement. L'application de ces idées donne des résultants probants en filltrage et en segmentation, en particulier grâce à une forte cohérence spatio-temporelle introduite dans les voisinages : cette approche donne des résultats de segmentation plus stables puisqu'elle impose une cohérence temporelle beaucoup plus forte aux frontières des régions que les méthodes itératives en temps. Nous discutons ensuite des possibilités d'utilisation de champs de mouvement à précision sous-pixellique.
|
362 |
Transcription des signaux percussifs : application à l'analyse de scènes musicales audiovisuelles /Gillet, Olivier, January 1900 (has links)
Thèse de doctorat--Signal et images--Paris--ENST, 2007. / Bibliogr. et webliogr. p. 263-280. Index. Résumé.
|
363 |
Quantification de la progression virale dans les rétinopathies à CMV par des techniques d'analyse d'images fondées sur des méthodes d'apprentissage par l'exempleBrahmi, Djamel. Fertil, Bernard. January 2001 (has links)
Thèse doctorat : Médecine : Paris 5 : 2001. / Bibliogr. p. 171-176.
|
364 |
Application de techniques de séparation de sources à la spectroscopie Raman et à la spectroscopie de fluorescenceGobinet, Cyril Manfait, Michel. January 2006 (has links) (PDF)
Reproduction de : Thèse de doctorat : Génie informatique, automatique et traitement du signal : Reims : 2006. / Titre provenant de l'écran titre. Bibliogr. f. 189-199.
|
365 |
Décomposition modale empirique contribution à la modélisation mathématique et application en traitement du signal et de l'image /Niang, Oumar Lemoine, Jacques Niane, Mary Teuw. January 2007 (has links) (PDF)
Thèse de doctorat : Sciences de l'ingénieur. Mathématiques et informatique appliquées au traitement du signal et de l'image : Paris 12 : 2007. / Titre provenant de l'écran-titre. Pagination : 210 p. Bibliogr. : 122 réf.
|
366 |
Répondre à des questions à réponses multiples sur le WebFalco, Mathieu-Henri 22 May 2014 (has links) (PDF)
Les systèmes de question-réponse renvoient une réponse précise à une question formulée en langue naturelle. Les systèmes de question-réponse actuels, ainsi que les campagnes d'évaluation les évaluant, font en général l'hypothèse qu'une seule réponse est attendue pour une question. Or nous avons constaté que, souvent, ce n'était pas le cas, surtout quand on cherche les réponses sur le Web et non dans une collection finie de documents.Nous nous sommes donc intéressés au traitement des questions attendant plusieurs réponses à travers un système de question-réponse sur le Web en français. Pour cela, nous avons développé le système Citron capable d'extraire des réponses multiples différentes à des questions factuelles en domaine ouvert, ainsi que de repérer et d'extraire le critère variant (date, lieu) source de la multiplicité des réponses. Nous avons montré grâce à notre étude de différents corpus que les réponses à de telles questions se trouvaient souvent dans des tableaux ou des listes mais que ces structures sont difficilement analysables automatiquement sans prétraitement. C'est pourquoi, nous avons également développé l'outil Kitten qui permet d'extraire le contenu des documents HTML sous forme de texte et aussi de repérer, analyser et formater ces structures. Enfin, nous avons réalisé deux expériences avec des utilisateurs. La première expérience évaluait Citron et les êtres humains sur la tâche d'extraction de réponse multiples : les résultats ont montré que Citron était plus rapide que les êtres humains et que l'écart entre la qualité des réponses de Citron et celle des utilisateurs était raisonnable. La seconde expérience a évalué la satisfaction des utilisateurs concernant la présentation de réponses multiples : les résultats ont montré que les utilisateurs préféraient la présentation de Citron agrégeant les réponses et y ajoutant un critère variant (lorsqu'il existe) par rapport à la présentation utilisée lors des campagnes d'évaluation.
|
367 |
Analyse multiéchelle d'images radar: Application au filtrage, à la classification et à la fusion d'images radar et optiquesFoucher, Samuel, January 2001 (has links)
Thèses (Ph.D.)--Université de Sherbrooke (Canada), 2001. / Titre de l'écran-titre (visionné le 18 juillet 2006). Publié aussi en version papier.
|
368 |
Étude et réalisation d'un extracteur rapide de caractéristiques d'image vidéo.Rakhodai, Issa, January 1900 (has links)
Th. doct.-ing.--Électronique, électrotechn., autom.--Toulouse--I.N.P., 1979. N°: 68.
|
369 |
L'utilisation spatio-temporelle de l'information visuelle en reconnaissance de mots / par Caroline BlaisBlais, Caroline January 2006 (has links)
No description available.
|
370 |
Traitement musical dans les troubles du spectre autistique : déficit du traitement global ou surfonctionnement des traitements perceptifs ? / Musical processing in autism spectrum disorder : global processing deficit or enhanced perceptual processing?Bouvet, Lucie 30 January 2012 (has links)
Ces travaux ont pour but d'explorer le traitement musical chez les personnes présentant un trouble du spectre autistique (TSA). Cette question a été abordée sous l'angle des traitements global et local dans le cadre des deux théories cognitives dominantes de l'autisme : i) la faiblesse de cohérence centrale et ii) la théorie du surfonctionnement perceptif. Ces deux théories postulent la présence d'un biais de traitement envers l'information locale dans l'autisme provenant, soit i) d'un déficit du traitement global, soit ii) d'une capacité perceptive supérieure. A travers une dizaine d'études, nous avons confronté ces deux théories manipulant les traitements global et local dans la musique. Nous avons aussi questionné la perception auditive chez ces personnes ainsi que son impact sur des traitements de plus haut niveau. Dans l'ensemble, nos travaux mettent en évidence une plus grande implication des processus perceptifs dans le traitement musical chez ces personnes, allant dans le sens de la théorie du surfonctionnement perceptif. Par ailleurs, certains de nos résultats pointent un mécanisme cognitif central chez les personnes autistes : le mécanisme de cartographie véridique. / This research aimed to explore musical processing in individuals with an autistic spectrum disorder. This question has been tackled by exploring global and local processing in the framework of the two main cognitive theories of autism: i) the weak central coherence theory and ii) the enhanced perceptual processing theory. These two theories postulate a bias toward local processing in autism which originates either from i) a global processing deficit or ii) enhanced perceptual capacities. Through ten studies, we confronted these two theories by manipulating global and local processing of music. We also explored auditory perception in autistic people and its impact on higher musical processing. Globally, our research highlights a greater implication of perceptual processes in musical processing, giving support to the enhanced perceptual processing theory. In addition, some of our results point to a central cognitive mechanism in autism: the mechanism of veridical mapping.
|
Page generated in 0.0262 seconds