Return to search

Estimation automatique de la profondeur de champ dans les images

Tableau d'honneur de la Faculté des études supérieures et postdoctorales, 2023 / La profondeur de champ est un concept essentiel en photographie, qui permet de contrôler la mise au point et le flou dans les images. Généralement utilisé pour mettre l'accent sur un sujet dans une image, cet effet optique fait que les objets situés à une certaine distance du sujet apparaissent flous. Les photographes peuvent contrôler la profondeur de champ en ajustant des paramètres de caméra, tels que l'ouverture du diaphragme, la distance focale et la distance de mise au point. Or, peu de travaux ont été faits pour estimer la profondeur de champ dans les images, et la plupart des algorithmes en vision numérique ignorent donc complètement ce concept. Les méthodes existantes permettent seulement d'estimer la quantité de flou dans les images de façon locale, en générant des cartes de défocalisation par pixel. Nous proposons d'aller plus loin et d'estimer globalement la profondeur de champ dans une image, en se basant sur une modélisation optique. Notre méthode permet d'obtenir, à partir d'une seule image, les paramètres de caméras modélisant la profondeur de champ. Ces paramètres peuvent être utilisés pour améliorer certaines applications en vision numérique et en infographie, telle que l'insertion d'objets virtuels dans les images. Nous générons d'abord deux nouveaux jeux de données synthétiques et semi-synthétiques d'images réalistes à faible profondeur de champ, *BokehMe* et *SynthWorld*. Nous utilisons ces images pour entraîner des réseaux de neurones profonds à estimer des cartes de profondeur et de défocalisation à partir d'une seule image, et nous démontrons leur performance de pointe. Enfin, nous développons une méthode pour estimer les paramètres de caméra à partir des cartes de profondeur et de défocalisation, à l'aide d'un réseau de neurones de pondération novateur permettant de concentrer l'estimation sur les régions les plus pertinentes de l'image. Nous démontrons que notre méthode peut être utilisée pour améliorer la qualité de l'insertion d'objets virtuels dans les images, et a le potentiel d'être utilisée pour démocratiser plusieurs applications de réalité augmentée et de retouche d'image.

Identiferoai:union.ndltd.org:LAVAL/oai:corpus.ulaval.ca:20.500.11794/153347
Date05 November 2024
CreatorsPiché-Meunier, Dominique
ContributorsLalonde, Jean-François, Hold-Geoffroy, Yannick
Source SetsUniversité Laval
LanguageFrench
Detected LanguageFrench
TypeCOAR1_1::Texte::Thèse::Mémoire de maîtrise
Format1 ressource en ligne (vii, 49 pages), application/pdf
Rightshttp://purl.org/coar/access_right/c_abf2

Page generated in 0.0023 seconds