Spelling suggestions: "subject:"sitt,"" "subject:"sit,""
41 |
Construção automática de mosaicos de imagens digitais aéreas agrícolas utilizando transformada SIFT e processamento paralelo / Automatic construction of mosaics from aerial digital images agricultural using SIFT transform and parallel processingAndré de Souza Tarallo 26 August 2013 (has links)
A construção automática de grandes mosaicos a partir de imagens digitais de alta resolução é uma área de grande importância, encontrando aplicações em diferentes áreas, como agricultura, meteorologia, sensoriamento remoto e biológicas. Na agricultura, a eficiência no processo de tomada de decisão para controle de pragas, doenças ou queimadas está relacionada com a obtenção rápida de informações. Até o presente momento este controle vem sendo feito de maneira semiautomática, necessitando obter o modelo digital do terreno, fazer a ortorretificação de imagens, inserir marcações manualmente no solo, para que um software possa construir um mosaico de maneira convencional. Para automatizar este processo, o presente projeto propõe três metodologias (1, 2, 3) baseadas em algoritmos já consolidados na literatura (SIFT, BBF e RANSAC) e processamento paralelo (OpenMP), utilizando imagens aéreas agrícolas de alta resolução, de pastagens e plantações de diversas culturas. As metodologias diferem na maneira como os cálculos são realizados para a construção dos mosaicos. Construir mosaicos com este padrão de imagem não é uma tarefa trivial, pois requer alto esforço computacional para processamento destas imagens. As metodologias incluem um pré-processamento das imagens para minimizar possíveis distorções que surgem no processo de aquisição de imagens e contém também algoritmos para suavização das emendas das imagens no mosaico. A base de imagens, denominada base de imagens sem redimensionamento, foi construída a partir de imagens com dimensão de 2336 x 3504 pixels (100 imagens divididas em 10 grupos de 10 imagens), obtidas na região de Santa Rita do Sapucaí - MG, as quais foram utilizadas para validar a metodologia. Outra base de imagens, referida como base de imagens redimensionada, contêm 200 imagens de 533 x 800 pixels (10 grupos de 20 imagens) e foi utilizada para avaliação de distorção para comparação com os softwares livres Autostitch e PTGui, os quais possuem parâmetros pré-definidos para a resolução de 533 x 800 pixels. Os resultados do tempo de processamento sequencial para as três metodologias evidenciaram a metodologia 3 com o menor tempo, sendo esta 63,5% mais rápida que a metodologia 1 e 44,5% do que a metodologia 2. O processamento paralelo foi avaliado para um computador com 2, 4 e 8 threads (4 núcleos físicos e 4 núcleos virtuais), reduzindo em 60% o tempo para a construção dos mosaicos de imagens para a metodologia 1. Verificou-se que um computador com 4 threads (núcleos físicos) é o mais adequado em tempo de execução e Speedup, uma vez que quando se utilizam 8 threads são incluídos as threads virtuais. Os resultados dos testes de distorção obtidos evidenciam que os mosaicos gerados com a metodologia 1 apresentam menores distorções para 7 grupos de imagens em um total de 10. Foram também avaliadas as distorções nas junções de cinco mosaicos constituídos apenas por pares de imagens utilizando a metodologia 3, evidenciando que a metodologia 3 apresenta menor distorção para 4 mosaicos, em um total de 5. O presente trabalho contribui com a metodologia 2 e 3, com a minimização das distorções das junções do mosaico, com o paralelismo em OpenMP e com a avaliação de paralelismo com MPI. / The automatic construction of large mosaics from high resolution digital images is an area of great importance, which finds applications in different areas, especially agriculture, meteorology, biology and remote sensing. In agriculture, the efficiency of decision making is linked to obtaining faster and more accurate information, especially in the control of pests, diseases or fire control. So far this has been done semiautomatically and it is necessary to obtain the digital terrain model, do the orthorectification of images, insert markings on the ground by manual labor, so that software can build a mosaic in the conventional way. To automate this process, this project proposes three methodologies (1, 2, 3) based on algorithms already well-established in the literature (SIFT, BBF e RANSAC) and parallel processing (OpenMP), using high resolution/size aerial images agricultural of pasture and diverse cultures. The methodologies differ in how the calculations are performed for the construction of mosaics. Build mosaics with this kind of picture isn´t a trivial task, as it requires high computational effort for processing these images. The methodologies include a pre-processing of images to minimize possible distortions that arise in the process of image acquisition and also contain algorithms for smoothing the seams of the images in the mosaic. The image database, called image database without scaling, was constructed from images with dimensions of 2336 x 3504 pixels (100 images divided into 10 groups of 10 pictures), obtained in the region of Santa Rita do Sapucaí - MG, which were used to validate the methodology. Another image database, referred to as base images resize, contains 200 images of 533 x 800 pixels (10 groups of 20 pictures). It was used for evaluation of distortion compared to the free softwares Autostitch and PTGui, which have pre-defined parameters for the resolution of 533 x 800 pixels. The results of sequential processing time for the three methodologies showed the methodology 3 with the shortest time, which is 63.5% faster than the methodology 1 and 44.5% faster than the methodology 2. Parallel processing was evaluated for a computer with 2, 4 and 8 threads (4 physical cores and 4 virtual cores), reducing by 60% the time to build the mosaics of images for the methodology 1. It was found that a computer with 4 threads (physical cores) is most appropriate in execution time and Speedup, since when using 8 threads, threads virtual are included. The test results of distortion show that the mosaics generated with the methodology 1 have lower distortion for 7 groups of images in a total of 10. Distortions at the junctions of five mosaics consisting only of pairs of images were also evaluate utilizing the methodology 3, indicating that the methodology 3 has less distortion for 4 mosaics, for a total of 5. Contributions of this work have been the methodologies 2 and 3, with the distortions minimization of the mosaic junction, the parallelism in OpenMP and the assessment of parallelism with MPI.
|
42 |
Aplicação da técnica SIFT na identificação de olhos humanos / SIFT technique applied on human eyes identificationBernardo Fernandes Cruz 29 August 2008 (has links)
Foi desenvolvido nesta pesquisa um estudo sobre a utilização de imagens de olhos humanos em um sistema biométricos de identificação. Este trabalho apresenta os resultados obtidos na
comparação de olhos humanos utilizando a técnica Scale Invariant Feature Transform (SIFT). A técnica SIFT é uma ferramenta capaz de identificar objetos, tendo como principais características: a invariância as transformações de rotação, translação, escala e oclusão do objeto dentro da imagem. Uma pesquisa sobre os principais sistemas biométricos de identificação existentes foi realizada. Para as comparações entre as imagens utilizou-se um
banco de imagens de olhos humanos denominado, UBIRIS, obtendo resultados muito interessantes. / This research developed a study about the use of images of human eyes in a biometric identification system. This work presents the results of the comparison of human eyes using
the technique Scale Invariant Feature Transform (SIFT). The SIFT technique is a tool capable of identify objects, with the main features: the alteration of rotation invariance, translation,
scale and occlusion of the object within the picture. A search on the main systems of biometric identification was made. For the comparisons between the images we used a bank of images of human eyes called UBIRIS, getting very interesting results.
|
43 |
Analyse et interprétation de scènes visuelles par approches collaboratives / Analysis and interpretation of visual scenes through collaborative approaches / Analiza si interpretarea scenelor vizuale prin abordari colaborativeStrat, Sabin Tiberius 04 December 2013 (has links)
Les dernières années, la taille des collections vidéo a connu une forte augmentation. La recherche et la navigation efficaces dans des telles collections demande une indexation avec des termes pertinents, ce qui nous amène au sujet de cette thèse, l’indexation sémantique des vidéos. Dans ce contexte, le modèle Sac de Mots (BoW), utilisant souvent des caractéristiques SIFT ou SURF, donne de bons résultats sur les images statiques. Notre première contribution est d’améliorer les résultats des descripteurs SIFT/SURF BoW sur les vidéos en pré-traitant les vidéos avec un modèle de rétine humaine, ce qui rend les descripteurs SIFT/SURF BoW plus robustes aux dégradations vidéo et qui leurs donne une sensitivité à l’information spatio-temporelle. Notre deuxième contribution est un ensemble de descripteurs BoW basés sur les trajectoires. Ceux-ci apportent une information de mouvement et contribuent vers une description plus riche des vidéos. Notre troisième contribution, motivée par la disponibilité de descripteurs complémentaires, est une fusion tardive qui détermine automatiquement comment combiner un grand ensemble de descripteurs et améliore significativement la précision moyenne des concepts détectés. Toutes ces approches sont validées sur les bases vidéo du challenge TRECVid, dont le but est la détection de concepts sémantiques visuels dans un contenu multimédia très riche et non contrôlé. / During the last years, we have witnessed a great increase in the size of digital video collections. Efficient searching and browsing through such collections requires an indexing according to various meaningful terms, bringing us to the focus of this thesis, the automatic semantic indexing of videos. Within this topic, the Bag of Words (BoW) model, often employing SIFT or SURF features, has shown good performance especially on static images. As our first contribution, we propose to improve the results of SIFT/SURF BoW descriptors on videos by pre-processing the videos with a model of the human retina, thereby making these descriptors more robust to video degradations and sensitivite to spatio-temporal information. Our second contribution is a set of BoW descriptors based on trajectories. These give additional motion information, leading to a richer description of the video. Our third contribution, motivated by the availability of complementary descriptors, is a late fusion approach that automatically determines how to combine a large set of descriptors, giving a high increase in the average precision of detected concepts. All the proposed approaches are validated on the TRECVid challenge datasets which focus on visual concept detection in very large and uncontrolled multimedia content.
|
44 |
Aplicação da técnica SIFT na identificação de olhos humanos / SIFT technique applied on human eyes identificationBernardo Fernandes Cruz 29 August 2008 (has links)
Foi desenvolvido nesta pesquisa um estudo sobre a utilização de imagens de olhos humanos em um sistema biométricos de identificação. Este trabalho apresenta os resultados obtidos na
comparação de olhos humanos utilizando a técnica Scale Invariant Feature Transform (SIFT). A técnica SIFT é uma ferramenta capaz de identificar objetos, tendo como principais características: a invariância as transformações de rotação, translação, escala e oclusão do objeto dentro da imagem. Uma pesquisa sobre os principais sistemas biométricos de identificação existentes foi realizada. Para as comparações entre as imagens utilizou-se um
banco de imagens de olhos humanos denominado, UBIRIS, obtendo resultados muito interessantes. / This research developed a study about the use of images of human eyes in a biometric identification system. This work presents the results of the comparison of human eyes using
the technique Scale Invariant Feature Transform (SIFT). The SIFT technique is a tool capable of identify objects, with the main features: the alteration of rotation invariance, translation,
scale and occlusion of the object within the picture. A search on the main systems of biometric identification was made. For the comparisons between the images we used a bank of images of human eyes called UBIRIS, getting very interesting results.
|
45 |
Anatomy of the SIFT method / L'Anatomie de la méthode SIFTRey Otero, Ives 26 September 2015 (has links)
Cette thèse est une analyse approfondie de la méthode SIFT, la méthode de comparaison d'images la plus populaire. En proposant un échantillonnage du scale-space Gaussien, elle est aussi la première méthode à mettre en pratique la théorie scale-space et faire usage de ses propriétés d'invariance aux changements d'échelles.SIFT associe à une image un ensemble de descripteurs invariants aux changements d'échelle, invariants à la rotation et à la translation. Les descripteurs de différentes images peuvent être comparés afin de mettre en correspondance les images. Compte tenu de ses nombreuses applications et ses innombrables variantes, étudier un algorithme publié il y a une décennie pourrait surprendre. Il apparaît néanmoins que peu a été fait pour réellement comprendre cet algorithme majeur et établir de façon rigoureuse dans quelle mesure il peut être amélioré pour des applications de haute précision. Cette étude se découpe en quatre parties. Le calcul exact du scale-space Gaussien, qui est au cœur de la méthode SIFT et de la plupart de ses compétiteurs, est l'objet de la première partie.La deuxième partie est une dissection méticuleuse de la longue chaîne de transformations qui constitue la méthode SIFT. Chaque paramètre y est documenté et son influence analysée. Cette dissection est aussi associé à une publication en ligne de l'algorithme. La description détaillée s'accompagne d'un code en C ainsi que d'une plateforme de démonstration permettant l'analyse par le lecteur de l'influence de chaque paramètre. Dans la troisième partie, nous définissons un cadre d'analyse expérimental exact dans le but de vérifier que la méthode SIFT détecte de façon fiable et stable les extrema du scale-space continue à partir de la grille discrète. En découlent des conclusions pratiques sur le bon échantillonnage du scale-space Gaussien ainsi que sur les stratégies de filtrage de points instables. Ce même cadre expérimental est utilisé dans l'analyse de l'influence de perturbations dans l'image (aliasing, bruit, flou). Cette analyse démontre que la marge d'amélioration est réduite pour la méthode SIFT ainsi que pour toutes ses variantes s'appuyant sur le scale-space pour extraire des points d'intérêt. L'analyse démontre qu'un suréchantillonnage du scale-space permet d'améliorer l'extraction d'extrema et que se restreindre aux échelles élevées améliore la robustesse aux perturbations de l'image.La dernière partie porte sur l'évaluation des performances de détecteurs de points. La métrique de performance la plus généralement utilisée est la répétabilité. Nous démontrons que cette métrique souffre pourtant d'un biais et qu'elle favorise les méthodes générant des détections redondantes. Afin d'éliminer ce biais, nous proposons une variante qui prend en considération la répartition spatiale des détections. A l'aide de cette correction nous réévaluons l'état de l'art et montrons que, une fois la redondance des détections prise en compte, la méthode SIFT est meilleure que nombre de ses variantes les plus modernes. / This dissertation contributes to an in-depth analysis of the SIFT method. SIFT is the most popular and the first efficient image comparison model. SIFT is also the first method to propose a practical scale-space sampling and to put in practice the theoretical scale invariance in scale space. It associates with each image a list of scale invariant (also rotation and translation invariant) features which can be used for comparison with other images. Because after SIFT feature detectors have been used in countless image processing applications, and because of an intimidating number of variants, studying an algorithm that was published more than a decade ago may be surprising. It seems however that not much has been done to really understand this central algorithm and to find out exactly what improvements we can hope for on the matter of reliable image matching methods. Our analysis of the SIFT algorithm is organized as follows. We focus first on the exact computation of the Gaussian scale-space which is at the heart of SIFT as well as most of its competitors. We provide a meticulous dissection of the complex chain of transformations that form the SIFT method and a presentation of every design parameter from the extraction of invariant keypoints to the computation of feature vectors. Using this documented implementation permitting to vary all of its own parameters, we define a rigorous simulation framework to find out if the scale-space features are indeed correctly detected by SIFT, and which sampling parameters influence the stability of extracted keypoints. This analysis is extended to see the influence of other crucial perturbations, such as errors on the amount of blur, aliasing and noise. This analysis demonstrates that, despite the fact that numerous methods claim to outperform the SIFT method, there is in fact limited room for improvement in methods that extract keypoints from a scale-space. The comparison of many detectors proposed in SIFT competitors is the subject of the last part of this thesis. The performance analysis of local feature detectors has been mainly based on the repeatability criterion. We show that this popular criterion is biased toward methods producing redundant (overlapping) descriptors. We therefore propose an amended evaluation metric and use it to revisit a classic benchmark. For the amended repeatability criterion, SIFT is shown to outperform most of its more recent competitors. This last fact corroborates the unabating interest in SIFT and the necessity of a thorough scrutiny of this method.
|
46 |
Étude et développement d'un procédé de traitement des odeurs par oxydation à l'ozone : application aux effluents gazeux d'usines de production de superphosphate / Study and development of an odor treatment process by ozone oxidation : application to gaseous effluents from superphosphate production plantsVitola Pasetto, Leticia 18 July 2019 (has links)
Dans le procédé de production d’engrais à base de superphosphate, l’attaque de la roche phosphatée par l’acide sulfurique génère des sous-produits gazeux odorants. Bien que leurs émissions se situent dans les limites réglementaires, les usines d’engrais à base de superphosphate sont susceptibles de causer des nuisances olfactives pour les riverains. Cette thèse propose d’étudier la faisabilité d’un procédé de traitement des odeurs par l’ozonation en phase gazeuse homogène. Une première étape de priorisation des composés chimiques ayant le potentiel odorant le plus important a été réalisée. Ce classement a été effectué à partir d’un rapport technique fourni par notre partenaire industriel basé sur une campagne de mesure olfactométrique et de caractérisation chimique des gaz émis par la cheminée d’une usine de production des engrais superphosphate. À partir du calcul de la valeur d’activité odorante (OAV), deux familles de composés ont été ciblées : les composés soufrés – représentés par le sulfure d’hydrogène (H2S), le sulfure d’éthylméthyle (MES) et le disulfure de diméthyle (DMDS) – et les aldéhydes (représentés par le propanal et le butanal). Deux techniques analytiques (GC/FID et SIFT/MS) ont été mises en œuvre afin d’évaluer les performances d’élimination de ces composés, la difficulté d'analyser une matrice gazeuse contenant de l'ozone ayant été mise en évidence. Ainsi, une interférence de l'ozone sur l'analyse des aldéhydes par GC/FID a été identifiée. La technique SIFT/MS a, quant à elle, nécessité un développement important. L’ozonation d’effluents gazeux modèles a été réalisée en suivant l’élimination des composés cibles dans différentes conditions de fonctionnement (temps de résidence, température du réacteur, concentration en ozone et taux d’humidité) dans un domaine expérimental compatible avec les contraintes industrielles. Les composés soufrés ont présenté des taux d’élimination élevés, particulièrement dans le cas de H2S, dont les conversions ont atteint environ 80%. Les monosulfures (MES) et disulfures organiques (DMDS) se sont montrés moins réactifs à l’ozone, puisque les conversions sont restées assez faibles (de l’ordre de 30% pour un ratio O3/soufrés similaire). Dans la gamme de conditions opératoires utilisées, ni l'humidité, ni le temps de résidence dans le réacteur n’ont montré d'influence considérable. La concentration d'ozone s’avère être le paramètre du procédé le plus influant, ayant un effet positif sur les taux de conversion des trois composés soufrés étudiés. Parallèlement, pour le DMDS, une augmentation de la température du réacteur a aussi amélioré la conversion. De manière globale, les taux de conversion les plus importants ont été obtenus pour les ratio O3/soufrés et la température du réacteur les plus élevés. A l’inverse, même lorsque les conditions de réaction les plus favorables ont été appliquées (température et concentration d’ozone les plus élevées), les aldéhydes se sont montrés non réactifs vis-à-vis de l’ozone. Malgré les faibles conversions obtenues, l’utilisation du SIFT/MS a permis d’identifier les principaux sousproduits de la réaction ozone-composés soufrés en phase gazeuse comme étant le méthyléthylsulfoxyde (MESO), le méthyléthylsulfone (MESO2), le diméthyl thiosulfinate (DMSOS), les isomères de diméthyl thiosulfonate (DMSO2S), le diméthyldisulfoxyde (DM(SO)2) et également le dioxyde (SO2) et le trioxyde de soufre (SO3). Le procédé de traitement des odeurs par ozonation directe des gaz en sortie de cheminée industrielle apparaît donc difficilement envisageable en raison de la faible efficacité d’élimination des composés malodorants démontrée dans nos essais. En revanche, cette technique couplée avec une absorption chimique pourrait s’avérer intéressante pour éliminer les nuisances olfactives avec une bonne efficacité / In the superphosphate-based fertilizers production process, the attack of phosphate rock by sulfuric acid generates odorous gaseous by-products. Although their emissions are within regulatory limits, superphosphate fertilizer plants are likely to cause odor nuisance to residents. This thesis proposes to study the feasibility of a process of odor treatment by ozonation in homogeneous gas phase. A first step of prioritization of the chemical compounds with the most important odorous potential has been realized. This ranking was established from a technical report provided by our industrial partner based on a campaign of olfactometric measurement and chemical characterization of the gases emitted by the chimney of a superphosphate fertilizer production plant. From the calculation of the odor activity value (OAV), two families of compounds were targeted: sulfur compounds - represented by hydrogen sulphide (H2S), ethylmethyl sulphide (MES) and dimethyl disulfide (DMDS) - and aldehydes (represented by propanal and butanal). Two analytical techniques (GC/FID and SIFT/MS) were applied in order to evaluate the elimination performance of these compounds, the difficulty of analyzing a gaseous matrix containing ozone having been demonstrated. Thus, ozone interference on GC/FID analysis of aldehydes has been identified. The SIFT/MS technique, in turn, required significant development. The ozonation of model gaseous effluents was carried out following the elimination of the target compounds under different operating conditions (residence time, reactor temperature, ozone concentration and moisture) in an experimental field compatible with the industrial constraints. The sulfur compounds exhibited high removal rates, particularly in the case of H2S, whose conversions reached about 80%. Organic monosulfides (MES) and disulfides (DMDS) were less reactive to ozone, as conversions remained quite low (around 30% for the same level of O3/sulfur ratio). In the range of operating conditions used, neither the moisture nor the residence time in the reactor showed considerable influence. The ozone concentration is the most influential process parameter, having a positive effect on the conversion rates of the three sulfur compounds studied. Meanwhile, for DMDS, an increase in reactor temperature also improved the conversion. Overall, the highest conversion rates were obtained for the highest O3/sulfur ratios and reactor temperature. Conversely, even when the most favorable reaction conditions have been applied (highest temperature and ozone concentration), the aldehydes have been inert to ozone. Despite the low conversions obtained, the use of SIFT/MS has identified the main by-products of the ozone-sulfur compounds gas phase reaction as methylethylsulfoxide (MESO), methylethylsulfone (MESO2), dimethyl thiosulfinate (DMSOS), isomers of dimethyl thiosulfonate (DMSO2S), dimethyldisulfoxide (DM(SO)2) and also sulfur dioxide (SO2) and trioxide (SO3). The odors treatment process by direct ozonation of the gases at the outlet of industrial chimney thus appears difficult to envisage because of the low efficiency of malodorous compounds elimination demonstrated in our tests. On the other hand, this technique coupled with chemical absorption could be interesting to eliminate the olfactory nuisances with a good efficiency
|
47 |
Méthodes pour l'interprétation automatique d'images en milieu urbain / Methods for automatic interpretation of images in urban environmentHascoët, Nicolas 27 June 2017 (has links)
Cette thèse présente une étude pour l'interprétation automatique d'images en milieu urbain. Nous proposons une application permettant de reconnaître différents monuments au sein d'images représentant des scènes complexes. La problématique principale est ici de différencier l'information locale extraite des points d'intérêt du bâtiment recherché parmi tous les points extraits de l'image. En effet, la particularité d'une image en milieu urbain vient de la nature publique de la scène. L'objet que l'on cherche à identifier est au milieu de divers autres objets pouvant interférer avec ce dernier. Nous présentons dans une première partie un état de l'art des méthodes de reconnaissance d’images en se concentrant sur l'utilisation de points d'intérêts locaux ainsi que des bases de données pouvant être employées lors des phases d'expérimentation. Nous retenons au final le modèle de sac de mots (BOW) appliqué aux descripteurs locaux SIFT (Scale-Invariant Feature Transform). Dans un second temps nous proposons une approche de classification des données locales faisant intervenir le modèle de machine à vecteurs de support (SVM). L'intérêt présenté dans cette approche proposée est le faible nombre de données requises lors de la phase d'entraînement des modèles. Différentes stratégies d'entraînement et de classification sont exposées ici. Une troisième partie suggère l'ajout d'une correction géométrique de la classification obtenue précédemment. Nous obtenons ainsi une classification non seulement de l'information locale mais aussi visuelle permettant ainsi une cohérence géométrique de la distribution des points d'intérêt. Enfin, un dernier chapitre présente les résultats expérimentaux obtenus, notamment sur des bâtiments de Paris et d'Oxford / This thesis presents a study for an automatic interpretation of urban images. We propose an application for the retrieval of different landmarks in images representing complex scenes. The main issue here is to differentiate the local information extracted from the key-points of the desired building from all the points extracted within the entire image. Indeed, an urban area image is specific by the public nature of the scene depicted. The object sought to be identified is fused within various other objects that can interfere. First of all, we present a state of the art about image recognition and retrieval methods focusing on local points of interest. Databases that can be used during the phases of experimentation are also exposed in a second chapter. We finally retain the Bag of Words modèle applied to local SIFT descriptors. In a second part, we propose a local data classification approach involving the Support Vector Machine model. The interest shown with this proposed approach is the low number of data required during the training phase of the models. Different training and classification strategies are also discussed. A third step suggests the addition of a geometric correction on the classification obtained previously. We thus obtain a classification not only for the local information but also for the visual information allowing thereby a geometric consistency of the points of interest. Finally, a last chapter presents the experimental results obtained, in particular involving images of buildings in Paris and Oxford
|
48 |
Descripteurs locaux pour l'imagerie radar et applications / Local features for SAR images and applicationsDellinger, Flora 01 July 2014 (has links)
Nous étudions ici l’intérêt des descripteurs locaux pour les images satellites optiques et radar. Ces descripteurs, par leurs invariances et leur représentation compacte, offrent un intérêt pour la comparaison d’images acquises dans des conditions différentes. Facilement applicables aux images optiques, ils offrent des performances limitées sur les images radar, en raison de leur fort bruit multiplicatif. Nous proposons ici un descripteur original pour la comparaison d’images radar. Cet algorithme, appelé SAR-SIFT, repose sur la même structure que l’algorithme SIFT (détection de points-clés et extraction de descripteurs) et offre des performances supérieures pour les images radar. Pour adapter ces étapes au bruit multiplicatif, nous avons développé un opérateur différentiel, le Gradient par Ratio, permettant de calculer une norme et une orientation du gradient robustes à ce type de bruit. Cet opérateur nous a permis de modifier les étapes de l’algorithme SIFT. Nous présentons aussi deux applications pour la télédétection basées sur les descripteurs. En premier, nous estimons une transformation globale entre deux images radar à l’aide de SAR-SIFT. L’estimation est réalisée à l’aide d’un algorithme RANSAC et en utilisant comme points homologues les points-clés mis en correspondance. Enfin nous avons mené une étude prospective sur l’utilisation des descripteurs pour la détection de changements en télédétection. La méthode proposée compare les densités de points-clés mis en correspondance aux densités de points-clés détectés pour mettre en évidence les zones de changement. / We study here the interest of local features for optical and SAR images. These features, because of their invariances and their dense representation, offer a real interest for the comparison of satellite images acquired under different conditions. While it is easy to apply them to optical images, they offer limited performances on SAR images, because of their multiplicative noise. We propose here an original feature for the comparison of SAR images. This algorithm, called SAR-SIFT, relies on the same structure as the SIFT algorithm (detection of keypoints and extraction of features) and offers better performances for SAR images. To adapt these steps to multiplicative noise, we have developed a differential operator, the Gradient by Ratio, allowing to compute a magnitude and an orientation of the gradient robust to this type of noise. This operator allows us to modify the steps of the SIFT algorithm. We present also two applications for remote sensing based on local features. First, we estimate a global transformation between two SAR images with help of SAR-SIFT. The estimation is realized with help of a RANSAC algorithm and by using the matched keypoints as tie points. Finally, we have led a prospective study on the use of local features for change detection in remote sensing. The proposed method consists in comparing the densities of matched keypoints to the densities of detected keypoints, in order to point out changed areas.
|
49 |
Desarrollo e implementación de un sistema de detección automatica de publicidad en prensa escritaRamírez Mellado, Maximiliano January 2014 (has links)
Ingeniero Civil Eléctrico / La revisión sistemática de la prensa es una importante herramienta para el análisis de presencia de marcas y desarrollo de estrategias publicitarias, el monitoreo de estos medios tradicionalmente es realizado por operadores que manualmente extraen la información.
Este trabajo tiene como objetivo presentar un novedoso sistema de detección automática de publicidad sobre imágenes procedentes de diarios y revistas, dentro del marco del proyecto IntelliMEDIA, llevado a cabo por el startup chileno CPDLabs.
La metodología para detectar anuncios publicitarios se basa en un modelamiento específico de la estructura de la prensa escrita, permitiendo llegar a obtener una estimación del costo de los anuncios detectados. Para ello se separa el problema en 4 bloques: Preprocesamiento que separa el texto de las imágenes dentro de la página.
Detección de logos que busca logos dentro de la página. Detección de publicidad que identifica el anuncio publicitario al que pertenece el logo y finalmente una etapa de tarificación que entrega una estimación del costo asociado al espacio publicitario.
El problema es abordado principalmente mediante tres estrategias: Primero la representación de la imagen en descriptores locales, que permite calzar características similares entre imágenes. Segundo, la estrategia de detección de objetos Viola-Jones, algoritmo de machine learning que genera un clasificador en base a un conjunto de imágenes de entrenamiento. La última estrategia es comparar histogramas de color permitiendo integrar información de color a la clasificación.
Para medir el desempeño de dichas estrategias se desarrolla un marco de evaluación, que consiste en una base de validación de 20.000 páginas de diario con 27 logos marcados, para así medir el desempeño de las distintas estrategias y configuraciones de parámetros, encontrar una solución eficaz para el problema y analizar las fortalezas y debilidades de los distintos métodos.
Los resultados demuestran que la solución es viable y es posible detectar logos mediante descriptores locales y Viola-Jones, logrando desempeños mayores al 90%. Por lo tanto IntelliMediA puede llegar a ser una manera eficaz y eficiente de extraer información publicitaria automáticamente de prensa escrita.
|
50 |
Image classification with dense SIFT sampling: an exploration of optimal parametersChavez, Aaron J. January 1900 (has links)
Doctor of Philosophy / Department of Computer Science / David A. Gustafson / In this paper we evaluate a general form of image classification algorithm based on dense SIFT sampling. This algorithm is present in some form in most state-of-the-art classification systems. However, in this algorithm, numerous parameters must be tuned, and current research provides little insight into effective parameter tuning. We explore the relationship between various parameters and classification performance. Many of our results suggest that there are basic modifications which would improve state-of-the-art algorithms. Additionally, we develop two novel concepts, sampling redundancy and semantic capacity, to explain our data. These concepts provide additional insight into the limitations and potential improvements of state-of-the-art algorithms.
|
Page generated in 0.0859 seconds