Spelling suggestions: "subject:"realimentação dde relevância"" "subject:"realimentação dee relevância""
1 |
"Realimentação de relevância para recuperação por conteúdo de imagens médicas visando diminuir a descontinuidade semântica" / Relevance Feedback to content-based image retrieval to minimize semantic gapMarques, Joselene 03 April 2006 (has links)
O objetivo deste projeto de Mestrado foi o estudo, a análise e o desenvolvimento de técnicas de Realimentação de Relevância (RR) para melhorar a respostas de consultas por similaridade que empregam técnicas de recuperação de imagens por conteúdo (do inglês content-based image retrieval - CBIR). A motivação para o desenvolvimento deste projeto veio do iRIS (internet Retrieval of Images System), que é um protótipo de servidor Web para o processamento de consultas por similaridade, em construção no GBdI (Grupo de Bases de Dados e Imagens) do ICMC-USP. O iRIS pode ser integrado a PACS (Picture and Archiving and Communication System) permitindo que estes possam recuperar imagens por semelhança. A principal restrição do uso de sistemas que incorporam CBIR é a descontinuidade semântica (semantic gap), que credita-se principalmente à utilização de características de baixo nível para descrever as imagens. As características mais utilizadas são baseadas em cor, textura e forma, e geralmente não conseguem mapear o que o usuário deseja/esperar recuperar, gerando um descontentamento do usuário em relação ao sistema. Entretanto, se sistema permitir a iteração do usuário na classificação do conjunto resposta e usar estas informações no processo de refinamento, as consultas podem ser re-processadas e os resultados tendem a atender a expectativa do usuário. Esse é o propósito das técnicas de realimentação de relevância. Este projeto desenvolveu duas técnicas de realimentação de relevância (RR): o RF Projection e o RF Multiple Point Projection. O ganho com a aplicação dessas técnicas foi expressivo, alcançando 29% a mais de precisão sobre a consulta original já na primeira iteração e 42% após 5 iterações. Os experimentos realizados com usuários mostraram que em média são executadas 3 iterações para chegar a um resultado satisfatório. Pelos resultados apresentados nos experimentos, podemos afirmar que RR é uma poderosa ferramenta para impulsionar o uso dos sistemas CBIR e aprimorar as consultas por similaridade. / This Master project aimed at studying, analyzing and developing relevance feedback (RF) techniques to enhance similarity queries that employ the content-based image retrieval (CBIR) approach. The motivation to develop this project came from the iRIS (internet Retrieval of Images System), which is a Web server prototype to process similarity queries. The iRIS can be integrated to a PACS (Picture and Archiving and Communication System) adding the functionality of retrieval images comparing their inherent alikeliness. The main reservation about using CBIR techniques is the semantic gap, because the general use of low level features to describe the images. The low level features, such as color, texture and shape, mostly cannot bridge the gap between what the users expect/want to what they get, generating disappointment and refusal of employing the system. However, if the user is allowed to interact with the system, classifying the query results and using such information on refinement steps, the queries can be reprocessed and the results tend to comply with the users expectation. This is just the core of the relevance feedback techniques. Looking at this scenario, this project developed two relevance feedback (RF) techniques: the RF Projection and the RF Multiple Point Projection. The improvements on the similarity queries were expressive going to up 29% with only one interaction, and to 42% on the fifth interaction, when compared to the original query. Experiments performed with users, have shown us that in average they run 3 iterations before get satisfactory results. By the results given by the experiment, one can claim that RF is a powerful approach to improve the use of CBIR systems and enhance similarity queries.
|
2 |
"Realimentação de relevância para recuperação por conteúdo de imagens médicas visando diminuir a descontinuidade semântica" / Relevance Feedback to content-based image retrieval to minimize semantic gapJoselene Marques 03 April 2006 (has links)
O objetivo deste projeto de Mestrado foi o estudo, a análise e o desenvolvimento de técnicas de Realimentação de Relevância (RR) para melhorar a respostas de consultas por similaridade que empregam técnicas de recuperação de imagens por conteúdo (do inglês content-based image retrieval - CBIR). A motivação para o desenvolvimento deste projeto veio do iRIS (internet Retrieval of Images System), que é um protótipo de servidor Web para o processamento de consultas por similaridade, em construção no GBdI (Grupo de Bases de Dados e Imagens) do ICMC-USP. O iRIS pode ser integrado a PACS (Picture and Archiving and Communication System) permitindo que estes possam recuperar imagens por semelhança. A principal restrição do uso de sistemas que incorporam CBIR é a descontinuidade semântica (semantic gap), que credita-se principalmente à utilização de características de baixo nível para descrever as imagens. As características mais utilizadas são baseadas em cor, textura e forma, e geralmente não conseguem mapear o que o usuário deseja/esperar recuperar, gerando um descontentamento do usuário em relação ao sistema. Entretanto, se sistema permitir a iteração do usuário na classificação do conjunto resposta e usar estas informações no processo de refinamento, as consultas podem ser re-processadas e os resultados tendem a atender a expectativa do usuário. Esse é o propósito das técnicas de realimentação de relevância. Este projeto desenvolveu duas técnicas de realimentação de relevância (RR): o RF Projection e o RF Multiple Point Projection. O ganho com a aplicação dessas técnicas foi expressivo, alcançando 29% a mais de precisão sobre a consulta original já na primeira iteração e 42% após 5 iterações. Os experimentos realizados com usuários mostraram que em média são executadas 3 iterações para chegar a um resultado satisfatório. Pelos resultados apresentados nos experimentos, podemos afirmar que RR é uma poderosa ferramenta para impulsionar o uso dos sistemas CBIR e aprimorar as consultas por similaridade. / This Master project aimed at studying, analyzing and developing relevance feedback (RF) techniques to enhance similarity queries that employ the content-based image retrieval (CBIR) approach. The motivation to develop this project came from the iRIS (internet Retrieval of Images System), which is a Web server prototype to process similarity queries. The iRIS can be integrated to a PACS (Picture and Archiving and Communication System) adding the functionality of retrieval images comparing their inherent alikeliness. The main reservation about using CBIR techniques is the semantic gap, because the general use of low level features to describe the images. The low level features, such as color, texture and shape, mostly cannot bridge the gap between what the users expect/want to what they get, generating disappointment and refusal of employing the system. However, if the user is allowed to interact with the system, classifying the query results and using such information on refinement steps, the queries can be reprocessed and the results tend to comply with the users expectation. This is just the core of the relevance feedback techniques. Looking at this scenario, this project developed two relevance feedback (RF) techniques: the RF Projection and the RF Multiple Point Projection. The improvements on the similarity queries were expressive going to up 29% with only one interaction, and to 42% on the fifth interaction, when compared to the original query. Experiments performed with users, have shown us that in average they run 3 iterations before get satisfactory results. By the results given by the experiment, one can claim that RF is a powerful approach to improve the use of CBIR systems and enhance similarity queries.
|
3 |
Arquitetura para recuperação de objetos de aprendizagem – uma abordagem baseada em agentes inteligentes e relevance feedback / Architecture for learning object retrieval – intelligent agents and relevance feedback based approachPöttker, Luciana Maria Vieira [UNESP] 16 March 2017 (has links)
Submitted by LUCIANA MARIA VIEIRA PÖTTKER null (lucianamvp@yahoo.com.br) on 2017-04-04T01:43:01Z
No. of bitstreams: 1
TeseFinal_LucianaPottker.pdf: 5401363 bytes, checksum: 3523880a95ba6b047b73fd0769dc3e39 (MD5) / Rejected by LUIZA DE MENEZES ROMANETTO (luizamenezes@reitoria.unesp.br), reason: Solicitamos que realize uma nova submissão seguindo a orientação abaixo:
O arquivo submetido está sem a ficha catalográfica.
A versão submetida por você é considerada a versão final da dissertação/tese, portanto não poderá ocorrer qualquer alteração em seu conteúdo após a aprovação.
Corrija esta informação e realize uma nova submissão com o arquivo correto.
Agradecemos a compreensão. on 2017-04-07T18:48:27Z (GMT) / Submitted by LUCIANA MARIA VIEIRA PÖTTKER null (lucianamvp@yahoo.com.br) on 2017-04-07T18:55:56Z
No. of bitstreams: 1
TeseFinal_LucianaPottkerComFicha.pdf: 5404315 bytes, checksum: 2efd4fb1a1ddc2f487503369eb1bd0b0 (MD5) / Approved for entry into archive by Juliano Benedito Ferreira (julianoferreira@reitoria.unesp.br) on 2017-04-07T19:04:45Z (GMT) No. of bitstreams: 1
pottker_lmv_dr_mar.pdf: 5404315 bytes, checksum: 2efd4fb1a1ddc2f487503369eb1bd0b0 (MD5) / Made available in DSpace on 2017-04-07T19:04:45Z (GMT). No. of bitstreams: 1
pottker_lmv_dr_mar.pdf: 5404315 bytes, checksum: 2efd4fb1a1ddc2f487503369eb1bd0b0 (MD5)
Previous issue date: 2017-03-16 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Desde a sua criação, a Web tem crescido a um ritmo sem precedentes, situação esta que exigiu mudanças na forma como a sociedade busca e tem acesso à informação. O incremento informacional foi observado em todas as áreas do conhecimento e, desde então, problemas relacionados à recuperação de informação são investigados. No escopo dessa investigação, são pesquisados objetos de aprendizagem que estejam descritos, em um padrão de metadados educacional, e mantidos em repositórios específicos para este fim. Todos os problemas e dificuldades relacionados à recuperação de informação são refletidos no contexto particular dos objetos de aprendizagem. Devido à natureza (multimídia) dos objetos de aprendizagem, a complexidade em recuperá-los se torna mais perceptível. Nesta tese, propõe-se um modelo de arquitetura para recuperação de objetos de aprendizagem baseado em uma integração de tecnologias de sistemas de recuperação de informação, metadados, relevance feedback e agentes inteligentes. O propósito fundamental da arquitetura para recuperação de objetos de aprendizagem é unificar a representação desses recursos educacionais que são disponibilizados em diferentes repositórios e permitir que o usuário realize buscas qualificadas para localizar os objetos de aprendizagem mais adequados para sua necessidade de informação. Esta pesquisa é classificada como qualitativa e de natureza aplicada, uma vez que se relaciona com o problema prático de recuperação de objetos de aprendizagem disponíveis em repositórios da Web. O principal diferencial desta proposta foi de valorizar a inferência do usuário no processo de recuperação de informação, por meio do processo de relevance feedback. Neste processo, o usuário estabelece um diálogo com o sistema de recuperação de informação realizando refinamentos nos resultados que lhe foram retornados. Como esse processo é cíclico, ele pode ser executado até que o usuário esteja satisfeito com os resultados que lhe foram retornados. Conclui-se que um sistema de recuperação de informação é mais eficiente quando amplia seu escopo de recuperação a partir de diferentes fontes de dados e permite a inferência do usuário no julgamento da informação que lhe foi retornada. / The Web has been growing in a record speed since its creation and, therefore, such prospect has demanded changes in the way society seeks for and accesses information. Informational increment was evident in all fields of knowledge and since then, the relevant information retrieval issues have been investigated. In the scope of this investigation, we find researches in learning objects classified into an educational metadata pattern and kept in a specific repository. All the problems and complications related to such retrieval reflect in the learning objects particular context. The complexity in retrieving these learning objects becomes evident given their (multimedia) nature. Here, we suggest an architecture model to retrieve the aforementioned objects that is based on a combination of information retrieval system, metadata, relevance feedback, and intelligent agents. The main purpose of this architecture model is to unify the representation of these educational resources – that are available in a heterogeneous repository – and allow users to perform efficient searches in order to find the most suitable learning objects to their information needs. This is a qualitative and Applied research once it relates to the practical problem of learning objects retrieval available on the Web. The main difference of this suggestion was to value – via relevance feedback – the importance of the user‟s inference in the process of such retrieval, in which the user establishes a dialog with the information retrieval system as to enhance the obtained results, and thus – being a cyclical process – it can be executed until he is pleased them. The conclusion is that an information retrieval system more efficient when its scope is enlarged from the different sources of data and allows the inference of the user when judging what he was presented with.
|
4 |
Recuperação de informação com realimentação de relevância apoiada em visualização / Information retrieval with relevance feedback on supported displayMelo, Diogo Oliveira de 16 April 2014 (has links)
A mineração de grandes coleções de textos, imagens e outros tipos de documentos tem se mostrado uma forma efetiva para exploração e interação com grandes quantidades de informações disponíveis, principalmente na World Wide Web. Neste contexto, diversos trabalhos têm tratado de mineração tanto de coleções estáticas quanto de coleções dinâmicas de objetos. Adicionalmente, técnicas de visualização têm sido propostas para auxiliar o processo de entendimento e de exploração dessas coleções, permitindo que a interação do usuário melhore o processo de mineração (user in the loop). No caso específico de dados dinâmicos, foi desenvolvido por Roberto Pinho e colegas uma técnica incremental (IncBoard) com o objetivo de visualizar coleções dinâmicas de elementos. Tal técnica posiciona os elementos em um grid bidimensional baseado na similaridade de conteúdo entre os elementos. Procura-se manter elementos similares próximos no grid. A técnica foi avaliada em um processo que simulava a chegada de novos dados, apresentando iterativamente novos elementos a serem posicionados no mapa corrente. Observa-se, entretanto, que um aspecto importante de tal ferramenta seria a possibilidade de novos elementos - a serem exibidos no mapa, mantendo coerência com o mapa corrente - serem selecionados a partir do interesse demonstrado pelo usuário. Realimentação de relevância tem se mostrado muito efetiva na melhoria da acurácia do processo de recuperação. Entretanto, um problema ainda em aberto é como utilizar técnicas de realimentação de relevância em conjunto com exploração visual no processo de recuperação de informação. Neste trabalho, é investigado o desenvolvimento de técnicas de exploração visual utilizando realimentação de relevância para sistemas de recuperação de informação de domínio específico. O Amuzi, um sistema de busca de músicas, foi desenvolvido como uma prova de conceito para a abordagem investigada. Dados coletados da utilização do Amuzi, por usuários, sugerem que a combinação de tais técnicas oferece vantagens, quando utilizadas em determinados domínios. Nesta dissertação, a recuperação de informação com realimentação de relevância apoiada em visualização, bem como o sistema Amuzi são descritos. Também são analisados os registros de utilização dos usuários / The mining of large text collections, images and other types of digital objects has shown to be a very effective way to explore and interact with big data, specially on the World Wide Web. On that subject, many researchers have been done on data mining of static and dynamic collections. Moreover, data visualization techniques have been proposed to aid on the understanding and exploration of such data collections, also allowing users to interact with data, user in the loop. On the speciific subject of dynamic data, Roberto Pinho and colleagues have developed an incremental technique, called Inc-Board, which aims to visualize dynamic data collections. IncBoard displays the documents on a two dimensional grid in a way that similar elements tends to be close to each other. This technique was evaluated in a process that simulated the arrival of new data elements, iteratively inserting new elements on the grid. Nonetheless, it would be useful if the user could interact with such documents to point out which are relevant and which are not relevant to his/her search. Relevance Feedback has also shown to be effective on improving the accuracy of Information Retrieval techniques. An issue that still open is how to combine data visualization and Relevance Feedback to improve Information Retrieval. On this dissertation, the development of techniques with data visualization and Relevance Feedback are investigated to aid on the Information Retrieval task, for specific domains. Amuzi is an Information Retrieval system, built to be a proof of concept for the investigated approach. Data collected from the usage of the system suggests that combining such techniques may outperform traditional Information Retrieval systems when applied for specifc domains. This dissertation has the description the information retrieval process with feedback relevance supported by visualization and the Amuzi system. Usage log are processed and analyzed to evaluate the investigated approach
|
5 |
Estudo e desenvolvimento de técnicas de detecção de agrupamentos semi-supervisionadasMarcelino, Alessandra Monteiro Rosalém January 2012 (has links)
Orientador: Maria Camila Nardini Barioni / Dissertação (mestrado) - Universidade Federal do ABC. Programa de Programa de Pós-Graduação em Engenharia da Informação, 2012
|
6 |
Realimentação de relevância em buscas de imagem usando programação GenéticaSilva, Gregory Oliveira da 09 May 2016 (has links)
Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-11-24T15:38:04Z
No. of bitstreams: 1
Dissertação - Gregory O. Silva.pdf: 1124819 bytes, checksum: 1da0563076b91fe78ae0ec2096e8fcf5 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-11-24T15:39:50Z (GMT) No. of bitstreams: 1
Dissertação - Gregory O. Silva.pdf: 1124819 bytes, checksum: 1da0563076b91fe78ae0ec2096e8fcf5 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-11-24T15:40:29Z (GMT) No. of bitstreams: 1
Dissertação - Gregory O. Silva.pdf: 1124819 bytes, checksum: 1da0563076b91fe78ae0ec2096e8fcf5 (MD5) / Made available in DSpace on 2016-11-24T15:40:29Z (GMT). No. of bitstreams: 1
Dissertação - Gregory O. Silva.pdf: 1124819 bytes, checksum: 1da0563076b91fe78ae0ec2096e8fcf5 (MD5)
Previous issue date: 2016-05-09 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Fashion products are difficult items to be annotated and described by text, making it necessary
to use images to perform searches on web sites of e-commerce. Such products
hold great visual appeal, in other words the presentation of images relating to them are
factors that directly influence the buying decision of a customer. These facts justify the
study of the use of CBIR (Content Based Image Retrieval) in this context, an area already
well studied in the scientific community, but that still has several shortcomings, the main
one being the problem of Semantic Gap . The use of features extracted from the image
by an algorithm is still not effective enough in associate it with its meaning, which is
reflected in the results of a search, affecting the customer satisfaction with the store. This
study seeks to address the problem of Semantic Gap through Genetic Programming and
Relevance Feedback, motivated by the good results reported in the literature concerning
the use of such techniques. Experiments were performed with an image base extracted
from web sites e-commerce, and we used two subsets of images as queries, where one
has images with a uniform background (as do the images of the data set), and the other
has images with noisy backgrouns (photography in general). We compared the use of Relevance
Feedback for both subsets, and for each subset we compared the use of ranking
functions learned with and without using feedback. As the result, the best cenery for both
subsets is to use the ranking function learned without usinf RF. Using RF on the learning
process of GP makes the individuals dependent of the feedback, worsening the answers of
searches before the first interaction with the user, and making the learned function unable
to capture the semantic of the original query. / Produtos de moda são itens difíceis de ser anotados e descritos por texto, fazendo-se
necessário o uso de imagens para a realização de buscas em web sites de e-commerce.
Tais produtos detém grande apelo visual, ou seja, a apresentação de imagens referentes
aos mesmos são fatores que influenciam diretamente a decisão de compra de um cliente.
Estes fatos justificam o estudo do uso de CBIR (Content Based Image Retrieval) neste
contexto, uma área já bastante estudada na comunidade científica, mas que ainda possui
diversas lacunas, sendo a principal o problema do Gap Semântico. O uso de características
extraídas da imagem por um algoritmo ainda não é eficaz o suficiente em associá-la ao
seu significado, o que se reflete nos resultados de uma busca, afetando a satisfação do
cliente com a loja. Este trabalho busca abordar o problema do Gap Semântico através
do uso de Programação Genética e Relevance Feedback, motivado pelos bons resultados
relatados na literatura referentes ao uso de tais técnicas. Foram realizados experimentos
com uma base de imagens extraídas de web sites de e-commerce, e foram usados dois
subconjuntos de imagens como consultas, sendo um formado por imagens com plano
de fundo uniforme (semelhantes às presentes na base), e outro por imagens com ruído
no fundo (fotografias em geral). Foram comparados o uso de Relevance Feedback para
os dois subconjuntos de consultas, e para cada subconjunto foram comparados o uso de
funções de ranking aprendidas com e sem o uso de feedback. Como resultado temos que
o melhor cenário para ambos os subconjuntos é o uso da função de ranking aprendida sem
RF. O uso de RF durante a aprendizagem torna os indivíduos dependentes do feedback,
piorando as respostas em buscas antes da primeira interação de RF, e fazendo com que a
função aprendida não seja capaz de captar a semântica da consulta original.
|
7 |
Recuperação de informação com realimentação de relevância apoiada em visualização / Information retrieval with relevance feedback on supported displayDiogo Oliveira de Melo 16 April 2014 (has links)
A mineração de grandes coleções de textos, imagens e outros tipos de documentos tem se mostrado uma forma efetiva para exploração e interação com grandes quantidades de informações disponíveis, principalmente na World Wide Web. Neste contexto, diversos trabalhos têm tratado de mineração tanto de coleções estáticas quanto de coleções dinâmicas de objetos. Adicionalmente, técnicas de visualização têm sido propostas para auxiliar o processo de entendimento e de exploração dessas coleções, permitindo que a interação do usuário melhore o processo de mineração (user in the loop). No caso específico de dados dinâmicos, foi desenvolvido por Roberto Pinho e colegas uma técnica incremental (IncBoard) com o objetivo de visualizar coleções dinâmicas de elementos. Tal técnica posiciona os elementos em um grid bidimensional baseado na similaridade de conteúdo entre os elementos. Procura-se manter elementos similares próximos no grid. A técnica foi avaliada em um processo que simulava a chegada de novos dados, apresentando iterativamente novos elementos a serem posicionados no mapa corrente. Observa-se, entretanto, que um aspecto importante de tal ferramenta seria a possibilidade de novos elementos - a serem exibidos no mapa, mantendo coerência com o mapa corrente - serem selecionados a partir do interesse demonstrado pelo usuário. Realimentação de relevância tem se mostrado muito efetiva na melhoria da acurácia do processo de recuperação. Entretanto, um problema ainda em aberto é como utilizar técnicas de realimentação de relevância em conjunto com exploração visual no processo de recuperação de informação. Neste trabalho, é investigado o desenvolvimento de técnicas de exploração visual utilizando realimentação de relevância para sistemas de recuperação de informação de domínio específico. O Amuzi, um sistema de busca de músicas, foi desenvolvido como uma prova de conceito para a abordagem investigada. Dados coletados da utilização do Amuzi, por usuários, sugerem que a combinação de tais técnicas oferece vantagens, quando utilizadas em determinados domínios. Nesta dissertação, a recuperação de informação com realimentação de relevância apoiada em visualização, bem como o sistema Amuzi são descritos. Também são analisados os registros de utilização dos usuários / The mining of large text collections, images and other types of digital objects has shown to be a very effective way to explore and interact with big data, specially on the World Wide Web. On that subject, many researchers have been done on data mining of static and dynamic collections. Moreover, data visualization techniques have been proposed to aid on the understanding and exploration of such data collections, also allowing users to interact with data, user in the loop. On the speciific subject of dynamic data, Roberto Pinho and colleagues have developed an incremental technique, called Inc-Board, which aims to visualize dynamic data collections. IncBoard displays the documents on a two dimensional grid in a way that similar elements tends to be close to each other. This technique was evaluated in a process that simulated the arrival of new data elements, iteratively inserting new elements on the grid. Nonetheless, it would be useful if the user could interact with such documents to point out which are relevant and which are not relevant to his/her search. Relevance Feedback has also shown to be effective on improving the accuracy of Information Retrieval techniques. An issue that still open is how to combine data visualization and Relevance Feedback to improve Information Retrieval. On this dissertation, the development of techniques with data visualization and Relevance Feedback are investigated to aid on the Information Retrieval task, for specific domains. Amuzi is an Information Retrieval system, built to be a proof of concept for the investigated approach. Data collected from the usage of the system suggests that combining such techniques may outperform traditional Information Retrieval systems when applied for specifc domains. This dissertation has the description the information retrieval process with feedback relevance supported by visualization and the Amuzi system. Usage log are processed and analyzed to evaluate the investigated approach
|
8 |
Recuperação de imagens por conteúdo: uma abordagem multidimensional de modelagem de similaridade e realimentação de relevânciaBarcelos, Emílio Zorzo 10 July 2009 (has links)
This work presents a multi-dimensional similarity modeling strategy and relevance feedback technique for minimizing the semantic gap intrinsic problem of CBIR systems by allowing users to customize their queries according to their requirements and preferences. We propose a composite strategy using a multi-dimensional, vectorial, spatially clustered, and relevance-ordered approach. Given a set of k features which represents the elements in an image database, the similarity measure between a query image and another from the image collection is analyzed in k components, and the images are ranked on a k dimensional space according to their projections over the axis xn, where n = 1, 2, ... k. System experimentation was executed thoroughly using a test image database containing up to 20,000 pictures. The experimental results have shown that the presented approach can substantially improve the outcome in image retrieval systems. / Este trabalho apresenta uma estratégia multidimensional de modelagem de similaridade e técnica de realimentação de relevância para a minimização do problema do salto semântico, intrínseco dos sistemas CBIR, permitindo aos usuários a customização de suas pesquisas de acordo com seus requisitos e preferências. Propõe-se uma estratégia composta, utilizando uma abordagem multidimensional, vetorial, com agrupamento espacial e ordenada por relevância. Considerando um grupo de k características que representam os elementos em um banco de dados de imagens, a medida de similaridade entre a imagem de consulta e outra da coleção de imagens é analisada em um espaço k dimensional de acordo com suas projeções sobre os eixos xn, onde n = 1, 2, ... k. Vários testes foram realizados com o sistema proposto utilizando um banco de imagens de testes contendo até 20.000 figuras. Os resultados obtidos mostraram que a abordagem apresentada pode aprimorar substancialmente o resultado em sistemas de recuperação de imagens. / Mestre em Ciências
|
9 |
Transformação de espaços métricos otimizando a recuperação de imagens por conteúdo e avaliação por análise visual / Metric space transformation optimizing content-based image retrieval and visual analysis evaluationAvalhais, Letrícia Pereira Soares 30 January 2012 (has links)
O problema da descontinuidade semântica tem sido um dos principais focos de pesquisa no desenvolvimento de sistemas de recuperação de imagens baseada em conteúdo (CBIR). Neste contexto, as pesquisas mais promissoras focam principalmente na inferência de pesos de características contínuos e na seleção de características. Entretanto, os processos tradicionais de inferência de pesos contínuos são computacionalmente caros e a seleção de características equivale a uma ponderação binária. Visando tratar adequadamente o problema de lacuna semântica, este trabalho propõe dois métodos de transformação de espaço de características métricos baseados na inferência de funções de transformação por meio de algoritmo genético. O método WF infere funções de ponderação para ajustar a função de dissimilaridade e o método TF infere funções para transformação das características. Comparados às abordagens de inferência de pesos contínuos da literatura, ambos os métodos propostos proporcionam uma redução drástica do espaço de busca ao limitar a busca à escolha de um conjunto ordenado de funções de transformação. Análises visuais do espaço transformado e de gráficos de precisão vs. revocação confirmam que TF e WF superam a abordagem tradicional de ponderação de características. Adicionalmente, foi verificado que TF supera significativamente WF em termos de precisão dos resultados de consultas por similaridade por permitir transformação não lineares no espaço de característica, conforme constatado por análise visual. / The semantic gap problem has been a major focus of research in the development of content-based image retrieval (CBIR) systems. In this context, the most promising research focus primarily on the inference of continuous feature weights and feature selection. However, the traditional processes of continuous feature weighting are computationally expensive and feature selection is equivalent to a binary weighting. Aiming at alleviating the semantic gap problem, this master dissertation proposes two methods for the transformation of metric feature spaces based on the inference of transformation functions using Genetic Algorithms. The WF method infers weighting functions and the TF method infers transformation functions for the features. Compared to the existing methods, both proposed methods provide a drastic searching space reduction by limiting the search to the choice of an ordered set of transformation functions. Visual analysis of the transformed space and precision. vs. recall graphics confirm that both TF and WF outperform the traditional feature eighting methods. Additionally, we found that TF method significantly outperforms WF regarding the query similarity accuracy by performing non linear feature space transformation, as found in the visual analysis.
|
10 |
Realimentação de relevância via algoritmos genéticos aplicada à recuperação de imagensSilva, Sérgio Francisco da 11 January 2007 (has links)
The principal objective of an image retrieval system is to obtain images which are as similar
as possible to the user´s requirements, from all the images in the reference collection. Such an
objective is difficult to reach due principally to the subjectivity of the image similarities. This
is due to the fact the images can be interpreted in different ways by different people. With the
aim of resolving this problem the content-based image retrieval systems explore the features of
color, shape and texture. These are nearly always associated to the regions and use relevance
feedback mechanisms to adjust a search to the user s criterions. Various approaches have been
used in relevance feedback from those genetic algorithms have become quite popular due to their
adaptive abilities. In this work we presented an image retrieval system based on the similarity
of local patterns, working with the features of color, shape and texture as well as relevance
feedback via a genetic algorithm. The task of this algorithm is infer weights to the features of
color, shape, texture and regions which better adjust to the similarity found between images
through the user s search criterions, thus producing a final ranking which is in accordance with
the criterions expressed in the relevance feedback. The genetic algorithms theory states that
the fitness measure applies an essential role upon the performance of these algorithms, once
the fitness measure directs the search path for the evaluation of each individuals aptitude. Due
to the lack of consensus about the best fitness measure in the ranking evaluation problem we
present a performance analysis of ten fitness functions. The fitness functions are classified in
two groups: order-based and non-order based. Some of these functions are adapted from textbased
information retrieval systems and others are proposed in this work. The experimental
results show that the order based fitness functions are more compatible to the user s interests,
once they present superior rankings in terms of precision for low recall rates and conduct the
quickest genetic algorithm in the search for an optimal heuristic solution. The results obtained
are superior to those of the works of Stejic et al., which served as our inspiration. / O principal objetivo de um sistema de recuperação de imagens é obter imagens que são o
mais similar possível à requisição do usuário, de todas as imagens de uma coleção de referência.
Tal objetivo é difícil de ser alcançado devido principalmente à subjetividade do conceito de
similaridade entre imagens, visto que uma mesma imagem poder ser interpretada de diferentes
maneiras por diferentes pessoas. Na tentativa de resolver este problema os sistemas de recuperação de imagens por conteúdo exploram as características de cor, forma e textura, quase
sempre associadas à regiões e usam de mecanismos de realimentação de relevantes para ajustar
uma busca aos critérios do usuário. Várias abordagens têm sido usadas em realimentação de
relevância entre as quais os algoritmos genéticos têm se tornado bastante populares devido às
suas habilidades adaptativas. Neste trabalho apresentamos um sistema de recuperação de imagens
com base na similaridade de padrões locais, empregando as características de cor, forma
e textura e com realimentação de relevância via algoritmo genético. A tarefa do algoritmo
genético é inferir pesos para as características de cor, forma, textura e regiões que melhor ajustam
a medida de similaridade entre imagens aos critérios de busca do usuário, fazendo com
que o ranking final esteja de acordo com os critérios expressos na realimentação. Da teoria dos
algoritmos genéticos é conhecido que a medida de aptidão exerce um papel essencial na performance
destes algoritmos, uma vez que ela direciona o caminho da busca, por avaliar a aptidão
dos indivíduos. Devido à falta de consenso acerca da medida de aptidão ideal na avaliação
de rankings apresentamos uma análise de performance de dez medidas de aptidão. As funções
de aptidão são classificadas em dois grupos: baseadas em ordem e não baseadas em ordem.
Algumas destas funções são adaptadas do contexto de sistemas de recuperação de informação
e outras são propostas neste trabalho. Os resultados experimentais mostram que as funções de
aptidão baseadas em ordem são mais compatíveis aos interesses dos usuários uma vez que elas
apresentam rankings superiores em precisão para baixos níveis de revocação e, conduzem mais
rapidamente o AG na busca por uma solução heurísticamente ótima. Os resultados obtidos são
superiores aos dos trabalhos de Stejic et al. que nos serviram de inspiração. / Mestre em Ciência da Computação
|
Page generated in 0.1188 seconds