Global ETD Search

1	Compact features for mobile visual search = Descritores compactos para busca visual em dispositivos móveis / Paul Joseph Hidalgo Flores Hidalgo Flores, Paul Joseph, 1986- 27 August 2018 (has links) Orientador: Eduardo Alves do Valle Junior / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-27T09:45:59Z (GMT). No. of bitstreams: 1 HidalgoFlores_PaulJoseph_M.pdf: 28047685 bytes, checksum: 055aafb9f31fc0ba5c1cfac1cc7a79b3 (MD5) Previous issue date: 2015 / Resumo: Aplicações de busca visual em aparelhos móveis (Mobile Visual Search ¿ MVS) tornaram-se possíveis devido ao alto poder computacional e a multiplicidade de sensores dos novos dispositivos móveis (smart-phones, tablets). Além disso, o estado da arte em recuperação de informação multimídia baseada no conteúdo (Content Based Image Retrieval - CBIR) alcançou uma maturidade que permite realizar estas tarefas de forma eficiente. Nesta dissertação, apresentamos um estudo das principais técnicas em CBIR visual das imagens. Uma vasta investigação da literatura foi realizada, que inclui desde os descritores baseados em gradiente mais comuns aos mais recentes descritores binários e compactos. Como resultado da análise comparativa entre as principais técnicas no contexto de MVS, apresentamos as alternativas mais apropriadas para serem utilizadas em tais aplicações / Abstract: Mobile Visual Search (MVS) applications became possible due to the computational power and multiple sensors on current mobile devices (smart-phones, tablets). In addition, the state-of-the-art in content based image retrieval (CBIR) has reached a maturity to perform these tasks efficiently. In this dissertation, we present a study of the major techniques in CBIR. An extensive study of literature, including the most common descriptors based on gradients and the recently proposed binary descriptors. As a result of comparative analysis between the main techniques in the context of MVS, we present the most appropriate alternatives to use in such applications / Mestrado / Engenharia de Computação / Mestre em Engenharia Elétrica Descritor de imagem Dispositivos móveis Image descriptor Mobile devices
2	Descritores de imagens baseados em assinatura textual Santos, Joyce Miranda dos 04 November 2016 (has links) Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-03-16T15:20:14Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese -Joyce M. Santos.pdf: 4727514 bytes, checksum: 2021a89c93fd642be27fb6d2d9719f78 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-03-16T15:20:40Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese -Joyce M. Santos.pdf: 4727514 bytes, checksum: 2021a89c93fd642be27fb6d2d9719f78 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-03-16T15:23:03Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese -Joyce M. Santos.pdf: 4727514 bytes, checksum: 2021a89c93fd642be27fb6d2d9719f78 (MD5) / Made available in DSpace on 2017-03-16T15:23:03Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese -Joyce M. Santos.pdf: 4727514 bytes, checksum: 2021a89c93fd642be27fb6d2d9719f78 (MD5) Previous issue date: 2016-11-04 / The technique of representing images by a set of visual words, known as bag of visual words, has been successfully applied to content-based image retrieval. In this work, it is proposed the paradigm Signature-based Bag of Visual Words (S-BoVW), a formal defini-tion for methods that describe images by visual words, without the previous construction of a visual vocabulary. Methods based on this paradigm not require the use of cluste-ring algorithms, which allows to reduce the cost associated with the images description step. The coding and combination of features such as color and texture were explored in this work in order to define new descriptors of images based on the S-BoVW paradigm. Experiments were carried out in order to propose effective and efficient ways to apply the concept proposed by S-BoVW paradigm in the definition of new methods of content-based image retrieval. The results obtained demonstrate that proper choice of query pro-cessing technique and the similarity function ensures obtaining optimized performance by S-BoVW methods and also ensures their competitiveness compared to baselines in many scenarios. / A técnica de representar imagens por meio de um conjunto de palavras visuais, conhecida como bag of visual words, tem sido aplicada com sucesso em tarefas de recuperação de imagens baseada em conteúdo. Neste trabalho, é proposto o paradigma Signature based Bag of Visual Words (S-BoVW), uma definição formal para métodos que descrevem ima-gens por meio de palavras visuais, sem que para isso seja necessária a construção prévia de um vocabulário visual. Métodos baseados nesse paradigma dispensam o uso de algo-ritmos de agrupamento, o que permite reduzir de forma significativa o custo associado à etapa de descrição das imagens. A codificação e a combinação de características, como cor e textura, foram investigadas neste trabalho com o intuito de definir novos descritores de imagens baseados no paradigma S-BoVW. Experimentos foram realizados com o objetivo de propor formas eficazes e eficientes de aplicar o conceito proposto pelo paradigma S-BoVW. Os resultados obtidos a partir deste trabalho demonstram que a escolha adequada da técnica de processamento de consulta e da função de cálculo de similaridade garante a obtenção de um desempenho otimizado por parte dos métodos S-BoVW, como também assegura a competitividade destes em relação aos baselines em diversos cenários. Descritor de imagem Palavra visual Assinatura textual Recuperação por conteúdo Recuperação de imagens
3	Um descritor de imagens baseado em particionamento extremo para busca em bases grandes e heterogêneas Vidal, Márcio Luiz Assis 25 October 2013 (has links) Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-06-22T14:59:26Z No. of bitstreams: 1 Tese- Márcio Luiz Assis Vidal.pdf: 6102842 bytes, checksum: 12c4e5a330ea91e55788a8d2d6b46898 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-24T15:29:04Z (GMT) No. of bitstreams: 1 Tese- Márcio Luiz Assis Vidal.pdf: 6102842 bytes, checksum: 12c4e5a330ea91e55788a8d2d6b46898 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-24T16:06:25Z (GMT) No. of bitstreams: 1 Tese- Márcio Luiz Assis Vidal.pdf: 6102842 bytes, checksum: 12c4e5a330ea91e55788a8d2d6b46898 (MD5) / Made available in DSpace on 2015-06-24T16:06:25Z (GMT). No. of bitstreams: 1 Tese- Márcio Luiz Assis Vidal.pdf: 6102842 bytes, checksum: 12c4e5a330ea91e55788a8d2d6b46898 (MD5) Previous issue date: 2013-10-25 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / In this thesis we propose a new image descriptor that address the problem of image search in large and heterogeneous databases. This approach uses the idea of extreme partitioning to obtain the visual properties of images that will be converted into a textual description. Once the textual description is appropriately generated, traditional text-based information retrieval techniques can be used. The key point of the proposed work is escalability, given that text-based search techniques can deal with databases with millions of documents. We have carried out experiments in order to con rm the viability of our proposal. The experimental results showed that our technique reaches higher precision levels compared to other content-based image retrieval techniques in a database with more than 100,000 images. / Neste trabalho é proposto um novo descritor de imagens que lida com o problema de busca de imagens em bases grandes e heterogêneas. Esta abordagem utiliza a idéia de um particionamento extremo para obter detalhes da imagem que são convertidos em uma descrição textual. Uma vez que a descrição textual é devidamente gerada, utiliza-se as técnicas de Recuperação de Informação (RI) tradicionais. O ponto chave do trabalho proposto é a representação textual das propriedades visuais das partições de uma imagem. Isto permite uma grande escalabilidade desta técnica, visto a existências de técnicas eficientes de busca baseada em texto para bases da ordem de milhões de documentos. Nossos experimentos comprovaram a viabilidade da técnica proposta, atingindo graus de precisão superiores às técnicas de busca de imagens tradicionais em uma base com mais de 100.000 imagens. Representação textual Recuperação de informação Descritor de imagem CBIR Information Retrieval Image descriptor Text representation
4	Identificação de manipulações de cópia-colagem em imagens digitais / Copy-move forgery identification in digital images Silva, Ewerton Almeida, 1988- 07 December 2012 (has links) Orientador: Anderson de Rezende Rocha / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-23T03:37:08Z (GMT). No. of bitstreams: 1 Silva_EwertonAlmeida_M.pdf: 20654769 bytes, checksum: cd66fa66dedc48d34c5feb0fa0311759 (MD5) Previous issue date: 2012 / Resumo: Neste trabalho, nós investigamos duas abordagens para detecção de manipulações de Cópia-colagem (Copy-move Forgery) em imagens digitais. A primeira abordagem é baseada no algoritmo PatchMatch Generalizado [4], cuja proposta é encontrar correspondências de patches (blocos de pixels de tamanho definido) em uma ou mais imagens. A nossa abordagem consiste na aplicação do PatchMatch Generalizado em uma dada imagem com o propósito de encontrar, para cada patch desta, um conjunto de patches similares com base nas distâncias de seus histogramas. Em seguida, nós verificamos as correspondências de cada patch para decidir se eles são segmentos de uma região duplicada. A segunda abordagem, que consiste em nossa principal contribuição, é baseada em um processo de Votação e Análise Multiescala da imagem. Dada uma imagem suspeita, extraímos pontos de interesse robustos a operações de escala e rotação, encontramos correspondências entre eles e os agrupamos em regiões com base em certas restrições geométricas, tais como a distância física e a inclinação da reta que os liga. Após a aplicação das restrições geométricas, criamos uma pirâmide multiescala que representará o espaço de escalas da imagem. Nós examinamos, em cada imagem, os grupos criados usando um descritor robusto a rotações, redimensionamentos e compressões. Este processo diminui o domínio de busca de regiões duplicadas e gera um mapa de detecção para cada escala. A decisão final é dada a partir de uma votação entre todos os mapas, na qual um segmento é considerado duplicado se este assim o é na maioria das escalas. Nós validamos ambos os métodos em uma base de imagens que construímos. A base _e composta por 108 clonagens originais e com elevado grau de realismo. Comparamos os métodos propostos com outros do estado da arte nessa mesma base de imagens / Abstract: In this work, we investigate two approaches toward Copy-move Forgery detection in digital images. The first approach relies on the Generalized PatchMatch algorithm [4], which aims at finding patch correspondences in one or more images. Our approach consists in applying the Generalized PatchMatch algorithm in a certain image in order to obtain, for each of its patches, a set of similar patches based on their histogram distances. Next, we check the correspondences of each patch to decide whether or not they are portions of a duplicated region. Our second approach is based on a Voting and Multiscale Analysis process of an image. Given a suspicious image, we extract its interest points robust to scale and rotation transformations and we find possible correspondences among them. Next, we group the correspondent points into regions considering some geometric constraints, such as physical distance and inclination of the line between points of interest. After that, we construct a multiscale pyramid to represent the image scale-space. In each image, we examine the created groups using a descriptor robust to rotation, scaling and compression. This process decreases the search space of duplicated regions and yields a detection map. The final decision depends on a voting among all the detected maps, in which a pixel is considered as part of a manipulation if it is marked as so in the majority of the pyramid scales. We validate both methods using a dataset we have built comprising 108 original and realistic clonings. We compare the proposed methods to others from the state-of-the-art using such cloning dataset / Mestrado / Ciência da Computação / Mestre em Ciência da Computação Análise forense de imagem Análise de imagem Visão por computador Descritor de imagem Forensic image analysis Image analysis Vision computer Image descriptor
5	Reconhecimento de texto e rastreamento de objetos 2D/3D / Text recognition and 2D/3D object tracking Minetto, Rodrigo, 1983- 20 August 2018 (has links) Orientadores: Jorge Stolfi, Neucimar Jerônimo Leite / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-20T03:12:07Z (GMT). No. of bitstreams: 1 Minetto_Rodrigo_D.pdf: 35894128 bytes, checksum: 8a0e453fba7e6a9a02fb17a52fdbf878 (MD5) Previous issue date: 2012 / Resumo: Nesta tese abordamos três problemas de visão computacional: (1) detecção e reconhecimento de objetos de texto planos em imagens de cenas reais; (2) rastreamento destes objetos de texto em vídeos digitais; e (3) o rastreamento de um objeto tridimensional rígido arbitrário com marcas conhecidas em um vídeo digital. Nós desenvolvemos, para cada um dos problemas, algoritmos inovadores, que são pelo menos tão precisos e robustos quanto outros algoritmos estado-da-arte. Especificamente, para reconhecimento de texto nós desenvolvemos (e validamos extensivamente) um novo descritor de imagem baseado em HOG especializado para escrita romana, que denominamos T-HOG, e mostramos sua contribuição como um filtro em um detector de texto (SNOOPERTEXT). Nós também melhoramos o algoritmo SNOOPERTEXT através do uso da técnica multiescala para tratar caracteres de tamanhos bastante variados e limitar a sensibilidade do algoritmo a vários artefatos. Para rastreamento de texto, nós descrevemos quatro estratégias básicas para combinar a detecção e o rastreamento de texto, e desenvolvemos também um rastreador específico baseado em filtro de partículas que explora o uso do reconhecedor T-HOG. Para o rastreamento de objetos rígidos, nós desenvolvemos um novo algoritmo preciso e robusto (AFFTRACK) que combina rastreamento de características por KLT com uma calibração de câmera melhorada. Nós testamos extensivamente nossos algoritmos com diversas bases de dados descritas na literatura. Nós também desenvolvemos algumas bases de dados (publicamente disponíveis) para a validação de algoritmos de detecção e rastreamento de texto e de rastreamento de objetos rígidos em vídeos / Abstract: In this thesis we address three computer vision problems: (1) the detection and recognition of flat text objects in images of real scenes; (2) the tracking of such text objects in a digital video; and (3) the tracking an arbitrary three-dimensional rigid object with known markings in a digital video. For each problem we developed innovative algorithms, which are at least as accurate and robust as other state-of-the-art algorithms. Specifically, for text classification we developed (and extensively evaluated) a new HOG-based descriptor specialized for Roman script, which we call T-HOG, and showed its value as a post-filter for an existing text detector (SNOOPERTEXT). We also improved the SNOOPERTEXT algorithm by using the multi-scale technique to handle widely different letter sizes while limiting the sensitivity of the algorithm to various artifacts. For text tracking, we describe four basic ways of combining a text detector and a text tracker, and we developed a specific tracker based on a particle-filter which exploits the T-HOG recognizer. For rigid object tracking we developed a new accurate and robust algorithm (AFFTRACK) that combines the KLT feature tracker with an improved camera calibration procedure. We extensively tested our algorithms on several benchmarks well-known in the literature. We also created benchmarks (publicly available) for the evaluation of text detection and tracking and rigid object tracking algorithms / Doutorado / Ciência da Computação / Doutor em Ciência da Computação Reconhecimento de texto Detecção de texto Descritor de imagem Rastreamento de texto Rastreamento tridimensional Text recognition Text detection Image descriptor Text tracking Three-dimensional tracking

1

Page generated in 0.0454 seconds