Spelling suggestions: "subject:"imagens - recuperação"" "subject:"imagens - recuperaçãoe""
1 |
Detecção de cantos em formas binárias planares e aplicação em recuperação de formas / Corner Detection in Planar Binary Shapes and its application in Shape RetrievalPaula Júnior, Iális Cavalcante de 06 June 2013 (has links)
PAULA JÚNIOR, I. C. Detecção de cantos em formas binárias planares e aplicação em recuperação de formas. 2013. 70 f. Tese (Doutorado em Engenharia de Teleinformática) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2013. / Submitted by Marlene Sousa (mmarlene@ufc.br) on 2014-04-02T12:30:40Z
No. of bitstreams: 1
2013_tese_icpaulajunior.pdf: 1612788 bytes, checksum: c990093693b47d41a5d73682aea1e0b0 (MD5) / Approved for entry into archive by Marlene Sousa(mmarlene@ufc.br) on 2014-04-02T18:58:58Z (GMT) No. of bitstreams: 1
2013_tese_icpaulajunior.pdf: 1612788 bytes, checksum: c990093693b47d41a5d73682aea1e0b0 (MD5) / Made available in DSpace on 2014-04-02T18:58:58Z (GMT). No. of bitstreams: 1
2013_tese_icpaulajunior.pdf: 1612788 bytes, checksum: c990093693b47d41a5d73682aea1e0b0 (MD5)
Previous issue date: 2013-06-06 / Content-based image retrieval (CBIR) applied to large scale datasets is a relevant and challenging problem present in medicine, biology, computer science, general cataloging etc. Image indexing can be done using visual information such as colors, textures and shapes (the visual translation of objects in a scene). Automated tasks in industrial inspection, trademark registration, biostatistics and image description use shape attributes, e.g. corners, to generate descriptors for representation, analysis and recognition; allowing those descriptors to be used in image retrieval systems. This thesis explores the problem of extracting information from binary planar shapes from corners, by proposing a multiscale corner detector and its use in a CBIR system. The proposed corner detection method combines an angulation function of the shape contour, its non-decimated decomposition using the Mexican hat wavelet and the spatial correlation among scales of the decomposed angulation signal. Using the information provided by our corner detection algorithm, we made experiments with the proposed CBIR. Local and global information extracted from the corners detected on shapes was used in a Dynamic Space Warping technique in order to analyze the similarity among shapes of different sizes. We also devised a strategy for searching and refining the multiscale parameters of the corner detector by maximizing an objective function. For performance evaluation of the proposed methodology and other techniques, we employed the Precision and Recall measures. These measures proved the good performance of our method in detecting true corners on shapes from a public image dataset with ground truth information. To assess the image retrieval experiments, we used the Bull’s eye score in three public databases. Our experiments showed our method performed well when compared to the existing approaches in the literature. / Sistemas de recuperação de imagens baseada em conteúdo (do termo em inglês, Content-Based Image Retrieval - CBIR) que operam em bases com grande volume de dados constituem um problema relevante e desafiador em diferentes áreas do conhecimento, a saber, medicina, biologia, computação, catalogação em geral, etc. A indexação das imagens nestas bases pode ser realizada através de conteúdo visual como cor, textura e forma, sendo esta última característica a tradução visual dos objetos em uma cena. Tarefas automatizadas em inspeção industrial, registro de marca, biometria e descrição de imagens utilizam atributos da forma, como os cantos, na geração de descritores para representação, análise e reconhecimento da mesma, possibilitando ainda que estes descritores se adequem ao uso em sistemas de recuperação. Esta tese aborda o problema da extração de características de formas planares binárias a partir de cantos, na proposta de um detector multiescala de cantos e sua aplicação em um sistema CBIR. O método de detecção de cantos proposto combina uma função de angulação do contorno da forma, a sua decomposição não decimada por transformada wavelet Chapéu Mexicano e a correlação espacial entre as escalas do sinal de angulação decomposto. A partir dos resultados de detecção de cantos, foi realizado um experimento com o sistema CBIR proposto, em que informações locais e globais extraídas dos cantos detectados da forma foram combinadas à técnica Deformação Espacial Dinâmica (do termo em inglês, Dynamic Space Warping), para fins de análise de similaridade formas com tamanhos distintos. Ainda com este experimento foi traçada uma estratégia de busca e ajuste dos parâmetros multiescala de detectores de cantos, segundo a maximização de uma função de custo. Na avaliação de desempenho da metodologia proposta, e outras técnicas de detecção de cantos, foram empregadas as medidas Precisão e Revocação. Estas medidas atestaram o bom desempenho da metodologia proposta na detecção de cantos verdadeiros das formas, em uma base pública de imagens cujas verdades terrestres estão disponíveis. Para a avaliação do experimento de recuperação de imagens, utilizamos a taxa Bull’s eye em três bases públicas. Os valores alcançados desta taxa mostraram que o experimento proposto foi bem sucedido na descrição e recuperação das formas, dentre os demais métodos avaliados.
|
2 |
Técnicas de visualização para sistemas de recuperação de imagens por conteúdo / Visualization techniques for content-based image retrievalCáceres, Sheila Maricela Pinto 17 August 2018 (has links)
Orientador: Ricardo da Silva Torres / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-17T03:09:27Z (GMT). No. of bitstreams: 1
Caceres_SheilaMaricelaPinto_M.pdf: 5019224 bytes, checksum: cf87ae15c741c8322d4d398124abee74 (MD5)
Previous issue date: 2010 / Resumo: Um sistema de Recuperação de Imagens por Conteúdo (CBIR) oferece mecanismos necessários para busca e recuperação de imagens baseando-se em propriedades visuais como cor, textura, forma, etc. Em um processo de busca de imagens, a apresentação de resultados é um componente essencial, na medida em que a obtenção desses resultados é o motivo da existência do sistema. Consequentemente, o uso de técnicas de visualização apropriadas pode determinar o sucesso ou o fracasso de um sistema CBIR. Técnicas de visualização são valiosas ferramentas na exploração de grandes quantidades de dados, como coleções de imagens. Contudo, técnicas para visualizar imagens retornadas por sistemas CBIR têm sido pobremente exploradas. Este trabalho apresenta um estudo comparativo e avaliação de várias técnicas de visualização para sistemas CBIR. Como resultado desse estudo, propõe-se um conjunto de técnicas originais que tentam suprir algumas das limitações identificadas em métodos da literatura. Dentre as características das técnicas propostas, destacam-se o enfoque baseado no centro e o uso de técnicas de agrupamento de dados para representar a similaridade intrínseca entre as imagens retornadas. Resultados experimentais mostram que os métodos propostos superam outras estratégias de visualização, considerando-se diversos critérios, como adequação para mostrar resultados em sistemas CBIR, quantidade de informação oferecida, satisfação de usuário, etc. As principais contribuições deste trabalho são: (i) estudo comparativo e análise de sete técnicas de visualização, quatro delas existentes na literatura e três técnicas novas propostas; (ii) avaliação de duas técnicas da literatura nunca antes avaliadas: anéis concêntricos e espiral; (iii) especificação e implementação de três novas técnicas de visualização baseadas em agrupamento; (iv) especificação e implementação de um framework para desenvolvimento de novas estruturas visuais para sistemas CBIR no qual foram implementadas as técnicas de visualização estudadas / Abstract: A Content-Based Image Retrieval (CBIR) system offers mechanisms needed to search and retrieve images based on visual properties such as color, texture, shape, etc. In an image search process, the presentation of results is an essential component as the retrieval of relevant images is the reason of the system existence. Consequently, the use of appropriate visualization techniques may determine the success of a CBIR system. Visualization techniques are valuable tools for the exploration of a great quantity of data, such as images collections. However, techniques for visualizing images in CBIR systems have been poorly explored. This work presents a comparative study of several visualization techniques for CBIR systems. As a result of this study, several original techniques were proposed trying to fulfill some of the absent characteristics in existing methods, such as the central-based focus and the use of clustering approaches to represent the intrinsic similarity between retrieved images. Experimental results show that the proposed methods overcome other visualization strategies by considering several criteria such as adaptation to show CBIR results, information load, user satisfaction, etc. The main contributions of this work are: (i) comparative study and analysis of seven visualization techniques, four of them from the literature and three new ones; (ii) validation of two techniques never evaluated before: concentric rings and spiral; (iii) specification and implementation of three new techniques of visualization based on clustering; (iv) specification and implementation of a framework for developing new visual structures for content-based image retrieval systems. The studied techniques were implemented by using this framework / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
|
3 |
Uso de técnicas de recuperação de imagens para o problema de reidentificação de pessoas / Content-based image retrieval techniques applied to the person reidentification problemRocca Layza, Vladimir Jaime, 1987- 27 August 2018 (has links)
Orientadores: Ricardo da Silva Torres, Hélio Pedrini / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-27T11:52:06Z (GMT). No. of bitstreams: 1
RoccaLayza_VladimirJaime_M.pdf: 7769260 bytes, checksum: a60ae46083facfc74cd79a4ab0c83c23 (MD5)
Previous issue date: 2015 / Resumo: Vários sistemas de vigilância baseados no uso de múltiplas câmeras têm sido propostos recentemente. No entanto, a identificação de pessoas em sequências de vídeos obtidas por várias câmeras com vistas não sobrepostas, comumente conhecida como reidentificação de pessoas, é um problema em aberto. As razões para que este problema seja considerado desafiador referem-se principalmente às restrições nas quais o problema deve ser resolvido. Estas restrições são definidas a partir das características do cenário e dos objetos de interesse (as pessoas): primeiro, as características biométricas de pessoas não podem ser utilizadas como características discriminantes; segundo, a aparência das pessoas muda drasticamente em virtude de variações na posição, iluminação e parâmetros de câmera. Tais restrições fazem com que uma mesma pessoa possa ser observada por múltiplas câmeras como uma pessoa diferente para cada uma delas. Nesta pesquisa, busca-se investigar alternativas para a criação de sistemas de vigilância visando à reidentificação de pessoas. Foram empregadas técnicas de recuperação de imagens por conteúdo tais como descritores de imagens tradicionais e propostos recentemente, análise multiescala, e técnicas de rank aggregation. Os experimentos realizados consideram a utilização de quatro bases de dados comumente utilizadas na avaliação de sistemas de reidentificação de pessoas. Os resultados obtidos mostraram que as técnicas de recuperação de imagens por conteúdo são promissoras para a reidentificação de pessoas, obtendo resultados comparáveis aos métodos do estado da arte / Abstract: Several surveillance systems based on the use of multiple cameras have been proposed recently. However, the identification of people in video sequences obtained from several cameras with non-overlapping views, commonly known as the person reidentification problem, is still an open problem. Person reidentification is a challenging problem due to the constraints under which the problem should be solved. These constraints come from the characteristics of the scenario and the objects of interest (people): first, biometric features may not be used as discriminant information; second, appearance is dramatically modified by changes in position, lighting conditions, and camera parameters. Therefore, in these conditions a unique person can be ''seen'' as a distinct person by different cameras. This research is focused on the investigation of alternatives for the creation of surveillance systems aiming at person reidentification. We intend to use content-based image retrieval techniques, such as traditional and recently proposed image descriptors, multiscale analysis, and rank aggregation approaches. Conducted experiments considered the use of four different datasets, commonly used in the evaluation of person reidentification systems. Obtained results show that the content-based image retrieval techniques are promising to reidentify people, producing equivalent results to the state-of-the-art methods / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
|
4 |
Recuperação de imagens multiescala intervalar / Image retrieval by interval multiscaleZampieri, Carlos Elias Arminio 16 August 2018 (has links)
Orientador: Jorge Stolfi / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-16T21:27:57Z (GMT). No. of bitstreams: 1
Zampieri_CarlosEliasArminio_M.pdf: 4003666 bytes, checksum: a730c8935e9f68bc9c1cd9a6e9d68c8c (MD5)
Previous issue date: 2010 / Resumo: Neste trabalho apresentamos um método geral para busca de imagem por conteúdo (BIPC, CBIR) em grandes coleções de imagens, usando estimação intervalar multiescala de distância. Consideramos especificamente buscas por exemplo, em que o objetivo é encontrar a imagem da coleção que é mais próxima a uma imagem dada, segundo alguma função de distância de imagens. Neste trabalho não procuramos desenvolver métricas que melhor atendem as intenções do usuário; em vez disso, supondo que a métrica está escolhida, apresentamos um algoritmo genérico (que denominamos MuSIS, de Multiscale Image Search) para realizar a busca de maneira eficiente usando aritmética intervalar. Estimativas intervalares das distâncias entre imagens são usadas para eliminar rapidamente imagens candidatas, considerando apenas versões reduzidas das mesmas, de maneira semelhante ao paradigma de otimização branch-and-bound. Como parte deste trabalho, desenvolvemos estimadores intervalares eficazes para distância euclidiana e algumas variantes da mesma, incluindo métricas sensíveis ao gradiente em escalas variadas. Experimentos indicaram que o método promove significativa redução de custos em relação à busca exaustiva. Apesar de menos eficiente do que outros métodos comumente usados para BIPC, o algoritmo MuSIS sempre retorna a resposta exata - isto é, a imagem mais próxima na métrica escolhida - e não apenas uma aproximação. A abordagem MuSIS é compatível com uma ampla variedade de funções de distância, sem a necessidade de pré-calcular ou armazenar descritores específicos para cada função / Abstract: We present a general method for content-based image retrieval (CBIR) in large image collections, using multiscale interval distance estimation. We consider specifically queries by example, where the goal is to find the image in the collection that is closest to a given image, according to some image distance function. In this work we do not aim to develop metrics that best meet the user's intentions; instead, assuming that the metric is chosen, we describe an algorithm (wich we call MuSIS, for MultiScale Image Search) to perform the search efficiently using interval arithmetic. Interval estimates of the image distances are used to quickly discard candidate images after examining only small versions of them, in a manner similar to the branch-and-bound optimization paradigm. As part of this work, we developed effective interval estimators for the Euclidean distance and for some variations of it, including metrics that are sensitive to the gradient at various scales. Experiments indicate that the method yields significant cost savings over exhaustive search. Although less efficient than other methods commonly used for CBIR, the MuSIS algorithm always returns the exact answer - that is, the nearest image in metric chosen - and not just an approximation thereof. The MuSIS approach is compatible with a wide variety of distance functions without the need to pre-compute or store specific descriptors for each function / Mestrado / Processamento de Imagens / Mestre em Ciência da Computação
|
5 |
Busca multimodal para apoio à pesquisa em biodiversidade / Multimodal search to support research on biodiversityFedel, Gabriel de Souza 18 August 2018 (has links)
Orientador: Cláudia Maria Bauzer Medeiros / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-18T07:07:49Z (GMT). No. of bitstreams: 1
Fedel_GabrieldeSouza_M.pdf: 14390093 bytes, checksum: 63058da33a22121e927f1cdbaff297d3 (MD5)
Previous issue date: 2011 / Resumo: A pesquisa em computação aplicada à biodiversidade apresenta muitos desafios, que vão desde o grande volume de dados altamente heterogêneos até a variedade de tipos de usuários. Isto gera a necessidade de ferramentas versáteis de recuperação. As ferramentas disponíveis ainda são limitadas e normalmente só consideram dados textuais, deixando de explorar a potencialidade da busca por dados de outra natureza, como imagens ou sons. Esta dissertação analisa os problemas de realizar consultas multimodais a partir de predicados que envolvem texto e imagem para o domínio de biodiversidade, especificando e implementando um conjunto de ferramentas para processar tais consultas. As contribuições do trabalho, validado com dados reais, incluem a construção de uma ontologia taxonômica associada a nomes vulgares e a possibilidade de apoiar dois perfis de usuários (especialistas e leigos). Estas características estendem o escopo da consultas atualmente disponíveis em sistemas de biodiversidade. Este trabalho está inserido no projeto Bio-CORE, uma parceria entre pesquisadores de computação e biologia para criar ferramentas computacionais para dar apoio à pesquisa em biodiversidade / Abstract: Research on Computing applied to biodiversity present several challenges, ranging from the massive volumes of highly heterogeneous data to the variety in user profiles. This kind of scenario requires versatile data retrieval and management tools. Available tools are still limited. Most often, they only consider textual data and do not take advantage of the multiple data types available, such as images or sounds. This dissertation discusses issues concerning multimodal queries that involve both text and images as search parameters, for the domanin of biodiversity. It presents the specification and implementation of a set of tools to process such queries, which were validate with real data from Unicamp's Zoology Museum. The aim contributions also include the construction of a taxonomic ontology that includes species common names, and support to both researchers and non-experts in queries. Such features extend the scop of queries available in biodiversity information systems. This research is associated with the Biocore project, jointly conducted by researchers in computing and biology, to design and develop computational tools to support research in biodiversity / Mestrado / Banco de Dados / Mestre em Ciência da Computação
|
6 |
Exploiting contextual information for image re-ranking and rank aggregation in image retrieval tasks = Explorando informações contextuais para reclassificação de imagens e agregação de listas em tarefas de recuperação de imagens / Explorando informações contextuais para reclassificação de imagens e agregação de listas em tarefas de recuperação de imagensPedronette, Daniel Carlos Guimarães, 1983- 20 August 2018 (has links)
Orientador: Ricardo da Silva Torres / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-20T17:07:45Z (GMT). No. of bitstreams: 1
Pedronette_DanielCarlosGuimaraes_D.pdf: 10238688 bytes, checksum: d7f661effb8fc3ce49cc7d4b11f6480e (MD5)
Previous issue date: 2012 / Resumo: Sistemas de Recuperação de Images baseados no Conteúdo (Content-Based Image Retrieval - CBIR) têm como objetivo satisfazer as necessidades dos usuários a partir de especificações de consulta. Dado um padrão de consulta (e.g., uma imagem de consulta) como entrada, um sistema CBIR recupera as imagens mais similares em uma coleção considerando suas propriedades visuais. Como o maior interesse dos usuários diz respeito às primeiras posições da lista de imagens retornadas, a eficácia desses sistemas é extremamente dependente da acurácia da função de distância adotada...Observação: O resumo, na íntegra, poderá ser visualizado no texto completo da tese digital / Abstract: Content-Based Image Retrieval (CBIR) systems aims at meeting the user needs expressed in query specifications. Given a query pattern (e.g., query image) as input, a CBIR system retrieves the most similar images in a collection by taking into account image visual properties. Since users are interested in the images placed at the first positions of the returned ranked lists, accurately ranking collection images is of great relevance...Note: The complete abstract is available with the full electronic document / Doutorado / Ciência da Computação / Doutor em Ciência da Computação
|
7 |
Searching for people through textual and visual attributes = Busca de pessoas a partir de atributos visuais e textuais / Busca de pessoas a partir de atributos visuais e textuaisFabián Arteaga, Junior John, 1987- 24 August 2018 (has links)
Orientador: Anderson de Rezende Rocha / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-24T07:58:15Z (GMT). No. of bitstreams: 1
FabianArteaga_JuniorJohn_M.pdf: 5046344 bytes, checksum: 42a497d56da6118f1f860730ea66f81d (MD5)
Previous issue date: 2013 / Resumo: Utilizar características pessoais para procurar pessoas é fundamental em diversas áreas de aplicação e nos últimos anos tem atraído uma atenção crescente por parte da comunidade científica com aplicações no campo da forense digital e vigilância tais como: localização de suspeitos ou de pessoas desaparecidas em espaços públicos. Neste trabalho, objetivamos utilizar atributos visuais descritíveis (por exemplo, homens brancos com bochechas em destaque usando óculos e com franja) como rótulos nas imagens para descrever sua aparência e, dessa forma, realizar buscas visuais por conteúdo sem depender de anotações nas imagens durante os testes. Para isso, criamos representações robustas para imagens de faces baseadas em dicionários visuais, vinculando as propriedades visuais das imagens aos atributos descritíveis. Primeiro, propomos duas abordagens de caracterização das imagens, uma de escala única e outra de múltiplas escalas para resolver consultas simples (somente um atributo). Em ambos os métodos, obtemos as características de baixo nível das imagens utilizando amostragens esparsas ou densas. Em seguida, selecionamos as características de maior repetibilidade para a criação de representações de médio nível baseadas em dicionários visuais. Posteriormente, treinamos classificadores binários para cada atributo visual os quais atribuem, para cada imagem, uma pontuação de decisão utilizada para obter sua classificação. Também propomos diferentes formas de fusão para o método de descrição de múltiplas escalas. Para consultas mais complexas (mais de dois atributos), avaliamos três abordagens presentes na literatura para combinar ordens (rankings): produto de probabilidades, rank aggregation e rank position. Além disso, propomos uma extensão do método de combinação baseado em rank aggregation para levar em conta informações complementares produzidas pelos diferentes métodos. Consideramos quinze classificadores de atributos e, consequentemente, seus negativos, permitindo, teoricamente, 32 768 diferentes consultas combinadas. Os experimentos mostram que a abordagem de descrição em múltiplas escalas melhora a precisão de recuperação para a maior parte dos atributos em comparação com outros métodos. Finalmente, para consultas mais complexas, a abordagem de descrição em múltiplas escalas em conjunto com versão estendida do rank aggregation melhoram a precisão em comparação com outros métodos de fusão como o produto de probabilidades e o rank positionUtilizar características pessoais para procurar pessoas é fundamental em diversas áreas de aplicação e nos últimos anos tem atraído uma atenção crescente por parte da comunidade científica com aplicações no campo da forense digital e vigilância tais como: localização de suspeitos ou de pessoas desaparecidas em espaços públicos. Neste trabalho, objetivamos utilizar atributos visuais descritíveis (por exemplo, homens brancos com bochechas em destaque usando óculos e com franja) como rótulos nas imagens para descrever sua aparência e, dessa forma, realizar buscas visuais por conteúdo sem depender de anotações nas imagens durante os testes. Para isso, criamos representações robustas para imagens de faces baseadas em dicionários visuais, vinculando as propriedades visuais das imagens aos atributos descritíveis. Primeiro, propomos duas abordagens de caracterização das imagens, uma de escala única e outra de múltiplas escalas para resolver consultas simples (somente um atributo). Em ambos os métodos, obtemos as características de baixo nível das imagens utilizando amostragens esparsas ou densas. Em seguida, selecionamos as características de maior repetibilidade para a criação de representações de médio nível baseadas em dicionários visuais. Posteriormente, treinamos classificadores binários para cada atributo visual os quais atribuem, para cada imagem, uma pontuação de decisão utilizada para obter sua classificação. Também propomos diferentes formas de fusão para o método de descrição de múltiplas escalas. Para consultas mais complexas (mais de dois atributos), avaliamos três abordagens presentes na literatura para combinar ordens (rankings): produto de probabilidades, rank aggregation e rank position. Além disso, propomos uma extensão do método de combinação baseado em rank aggregation para levar em conta informações complementares produzidas pelos diferentes métodos. Consideramos quinze classificadores de atributos e, consequentemente, seus negativos, permitindo, teoricamente, 32 768 diferentes consultas combinadas. Os experimentos mostram que a abordagem de descrição em múltiplas escalas melhora a precisão de recuperação para a maior parte dos atributos em comparação com outros métodos. Finalmente, para consultas mais complexas, a abordagem de descrição em múltiplas escalas em conjunto com versão estendida do rank aggregation melhoram a precisão em comparação com outros métodos de fusão como o produto de probabilidades e o rank position / Abstract: Using personal traits for searching people is paramount in several application areas and has attracted an ever-growing attention from the scientific community over the past years. Some practical applications in the realm of digital forensics and surveillance include locating a suspect or finding missing people in a public space. In this work, we aim at assigning describable visual attributes (e.g., white chubby male wearing glasses and with bangs) as labels to images to describe their appearance and performing visual searches without relying on image annotations during testing. For that, we create mid-level image representations for face images based on visual dictionaries linking visual properties in the images to describable attributes. First, we propose one single-level and one multilevel approaches to solve simple queries (queries containing only one attribute). For both methods, the first step consists of obtaining image low-level features either using a sparse or a dense-sampling scheme. The characterization is followed by the visual dictionary creation step in which we assess both a random selection and a clustering algorithm for selecting the most important features collected in the first stage. Such features then feed 2-class classifiers for the describable visual attributes of interest which assign to each image a decision score used to obtain its ranking. As the multi-level image characterization involves combining the answers of different levels, we also propose some fusion methods in this regard. For more complex queries (2+ attributes), we use three state-of-the-art approaches for combining the rankings: product of probabilities, rank aggregation and rank position. We also extend upon the rank aggregation method in order to take advantage of complementary information produced by the different characterization schemes. We have considered fifteen attribute classifiers and, consequently, their direct counterparts theoretically allowing 32 768 different combined queries (the actual number is smaller since some attributes are contradictory or mutually exclusive). Experimental results show that the multilevel approach improves retrieval precision for most of the attributes in comparison with other methods. Finally, for combined attributes, the multilevel characterization approach along with the modified rank aggregation scheme boosts the precision performance when compared to other methods such as product of probabilities and rank position / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
|
Page generated in 0.0577 seconds