Return to search

Formalização do domínio imagem para buscas por conteúdo em SGBDs relacionais / A formal approach for content-based image in relational database management systems

Sistemas de Recuperação de Imagens por Conteúdo (SiRICs) têm como objetivo realizar buscas em grandes coleções de imagens, recuperando aquelas cujos conteúdos são mais similares à uma imagem fornecida como parte do predicado de busca. A similaridade é expressada por uma função de distância (dissimilaridade) que calcula a relação entre um par de imagens para permitir que ambas sejam comparadas. Funções de distância usam características extraídas de cada imagem por um conjunto de algoritmos chamados extratores de características. Para melhorar o desempenho do processo de buscas, as características selecionadas são extraídas de cada imagem no momento em cada uma é armazenada na base de dados, criando um vetor de características para cada imagem. As operações subsequentes da busca são realizadas usando os vetores de características no0 lugar das imagens. Antes de extrair as características, outros algoritmos de processamento de imagem são utilizados para pré-processar cada imagem, de forma a prepará-la para os extratores. Adicionalmente, é comum a existência de vários critérios que podem ser considerados no processo de cálculo da similaridade de duas imagens. Nos SiRICs atuais, para comparar imagens, é preciso definir (1) o critério de comparação, (2) os pré-processamentos necessários para execução dos extratores, (3) quais são os extratores utilizados, (4) quais características devem ser consideradas, (5) e qual função de distância deve ser aplicada. Todas essas definições têm de ser configuradas antes da comparação ser realizada. A complexidade desse processo levou ao desenvolvimento de SiRICs com poucas opções para configuração das operações de comparação. Além disso, não existe nenhuma representação formal do processo SiRIC como uni todo. Este trabalho apresenta uma representação formal do conjunto completo de operações que compõem o processo de buscas por conteúdo em imagens, objetivando consultas por similaridade em grandes bases de dados relacionais. A aplicação desse formalismo é apresentada com os resultados experimentais gerados sobre imagens médicas de urna base de dados hospitalar. / Content-Based Image Retrieval Systems (CBIR) aims at searching in large collections of images, retrieving those whose contents are similar to an image given as part of the search predicate. Similarity is a relationship between a pair of images that enables their comparison, which is expressed by a distance (dissimilarity) function. Distance functions usnally rely on a set of features extracted from each image by a set of image processing algorithms called featurc extractors. To speed up the search process, selected features are extracted from each image when each one is stored in a image database creating a feature vector for each image. Further image searching operations are performed using the feature vectors in place of the images. Before extracting features, other image processing algorithms are usually employed to pre-process each image, preparing it for the extractors. Moreover, usually there are several criteria that can be considered when measuring how much two images are similar. In current CBIR, environments, to compare images, one must define (1) the criteria, (2) the pre-processing needed before the extractors can be executed, (3) which are those extractors, (4) which features must be considered, (5) and which distance function must be used. Ali of these definitions must have been set before a comparison can be performed. The complexity of defining how to comparei images has lead to the development, of systems aiming CBIR that allow relatively few options to configure the image comparison operations. Moreover, no formal representation of the entire CBIR process exists. This work presents a formal representation of the complete set. of operations composing the CBIR process, aiming to search images in large relational databases, using similarity queries. It is also reported a system developed using this formalism that enables the content-based retrieval of medicai images from a hospital database, thus showing results of applying the presented formalism in a practical way.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-14112014-084849
Date27 June 2005
CreatorsFigueiredo, Josiel Maimone de
ContributorsTraina Junior, Caetano
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeTese de Doutorado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.0011 seconds