1 |
Utilização de condições de contorno para combinação de múltiplos descritores em consultas por similaridadeBarroso, Rodrigo Fernandes 14 March 2014 (has links)
Made available in DSpace on 2016-06-02T19:06:16Z (GMT). No. of bitstreams: 1
6270.pdf: 1934927 bytes, checksum: f1e2441b9a2d898dfdbfdefc98c82a23 (MD5)
Previous issue date: 2014-03-14 / Universidade Federal de Sao Carlos / Complex data, like images, face semantic problems in your queries that might compromise results quality. Such problems have their source on the differences found between the semantic interpretation of the data and its low level machine language. In this representation are utilized feature vectors that describe intrinsic characteristics (like color, shape and texture) into qualifying attributes. Analyzing the similarity in complex data, perceives that these intrinsic characteristics complemented the representation of data, as well as is carried out by human perception and for this reason the use of multiple descriptors tend to improve the ability of discrimination data. In this context, another relevant fact is that in a data set, some subsets may present essential specific intrinsic characteristics to better show their rest of the data elements. Based in such premises, this work proposes the use of boundary conditions to identify these subsets and then use the best descriptor combination balancing for each of these, aiming to decrease the existing semantic gap in similarity queries. Throughout the conducted experiments the use of the proposed technique had better results when compared to use individual descriptor using the same boundary conditions and also using descriptors combination for the whole set without the use of boundary conditions. / Dados complexos, como imagens, enfrentam problemas semânticos em suas consultas que comprometem a qualidade dos resultados. Esses problemas são caracterizados pela divergência entre a interpretação semântica desses dados e a forma como são representados computacionalmente em características de baixo nível. Nessa representação são utilizados vetores de características que descrevem características intrínsecas (como cor, forma e textura) em atributos qualificadores. Ao analisar a similaridade em dados complexos percebe-se que essas características intrínsecas se complementam na representação do dado, bem como é realizada pela percepção humana e por este motivo a utilização de múltiplos descritores tende a melhorar a capacidade de discriminação dos dados. Nesse contexto, outro fato relevante é que em um conjunto de dados, alguns subconjuntos podem apresentar características intrínsecas específicas essenciais que melhor evidenciam seus elementos do restante dos dados. Com base nesses preceitos, este trabalho propõe a utilização de condições de contorno para delimitar estes subconjuntos e determinar o melhor balanceamento de múltiplos descritores para cada um deles, com o objetivo de diminuir o gap semântico nas consultas por similaridade. Em todos os experimentos realizados a utilização da técnica proposta sempre apresentou melhores resultados. Em comparação a utilização de descritores individuais com as mesmas condições de contorno e sem condições de contorno, e também a combinação de descritores para o conjunto todo sem a utilização de condições de contorno.
|
2 |
Indexação de dados em domínios métricos generalizáveis / Indexing complex data in Generic Metric Domains.Pola, Ives Renê Venturini 10 June 2005 (has links)
Os sistemas Gerenciadores de Bases de Dados (SGBDs) foram desenvolvidos para manipular domínios de dados numéricos e/ou pequenas seqüencias de caracteres (palavras) e não foram projetados prevendo a manipulação de dados complexos, como por exemplo dados multimídia. Os operadores em domínios de dados que requisitam a relação de ordem têm pouca utilidade para manipular operações que envolvem dados complexos. Uma classe de operadores que se adequa melhor para manipular esses dados são os operadores por similaridade: consulta por abrangência (``range queries') e consulta de vizinhos mais próximos (``k-nearest neighbor queries'). Embora muitos resultados já tenham sido obtidos na elaboração de algoritmos de busca por similaridade, todos eles consideram uma única função para a medida de similaridade, que deve ser universalmente aplicável a todos os pares de elementos do conjunto de dados. Este projeto propõe explorar a possibilidade de trabalhar com estruturas de dados concebidas dentro dos conceitos de dados em domínios métricos, mas que admitam o uso de uma função de distância adaptável, ou seja, que mude para determinados grupos de objetos, dependendo de algumas características universais, e assim permitindo acomodar características que sejam particulares a algumas classes de imagens e não de todo o conjunto delas, classificando as imagens em uma hierarquia de tipos, onde cada tipo está associado a uma função de distância diferente e vetores de características diferentes, todos indexados numa mesma árvore. / The DBMS were developed to manipulate data in numeric domains and short strings, not considering the manipulation of complex data, like multimidia data. The operators em data domain which requests for the total order property have no use to handle complex data. An operator class that fit well to handle this type of data are the similarity operators: range query and nearest neighbor query. Although many results have been shown in research to answer similarity queries, all use only one distance function to measure the similarity, which must be applicable to all pairs of elements of the set. The goal of this work is to explore the possibility of deal with complex data in metric domains, that uses a suitable distance function, that changes its behavior for certain groups of data, depending of some universal features, allowing them to use specific features of some classes of data, not shared for the entire set. This flexibility will allow to reduce the set of useful features of each element in the set individually, relying in the values obtainded for one or few features extracted in first place. This values will guide the others important features to extract from data.
|
3 |
Inclusão de diversidade em consultas aos vizinhos mais próximos usando descritores distintos para similaridade e diversidadeCardoso, Ana Claudia 18 April 2017 (has links)
Submitted by Aelson Maciera (aelsoncm@terra.com.br) on 2017-09-13T18:11:26Z
No. of bitstreams: 1
DissACC.pdf: 1668214 bytes, checksum: 82bf6ff6918613ce74cc691a951a22b0 (MD5) / Approved for entry into archive by Ronildo Prado (bco.producao.intelectual@gmail.com) on 2018-01-25T17:53:52Z (GMT) No. of bitstreams: 1
DissACC.pdf: 1668214 bytes, checksum: 82bf6ff6918613ce74cc691a951a22b0 (MD5) / Approved for entry into archive by Ronildo Prado (bco.producao.intelectual@gmail.com) on 2018-01-25T17:54:04Z (GMT) No. of bitstreams: 1
DissACC.pdf: 1668214 bytes, checksum: 82bf6ff6918613ce74cc691a951a22b0 (MD5) / Made available in DSpace on 2018-01-25T18:00:35Z (GMT). No. of bitstreams: 1
DissACC.pdf: 1668214 bytes, checksum: 82bf6ff6918613ce74cc691a951a22b0 (MD5)
Previous issue date: 2017-04-18 / Não recebi financiamento / One of the ways to recover images in a database is through similarity queries. Using characteristics
extracted from these images, such as color, shape or texture, this work seeks to
identify similarities to a central query element. However, the results may be very similar to
each other, which is not always the expected result. In addition to the redundancy in the results,
the problem of the ’semantic gap’, which is a divergence in the evaluation of similarity
between images performed by the computer considering its numerical representation (low
level characteristics) and the human perception about the image (high level characteristics).
In order to improve the quality of the results, we sought to minimize the issue of redundancy
and the ’semantic gap’ through the use of more than one descriptor in queries for similarity.
We sought to explore the inclusion of diversity using one descriptor to treat similarity and
another descriptor to treat diversity, more generally a metric space for similarity and another
for diversity. For the implementation of the query by similarity was used the consultation
to several neighbors closer. Considering that the descriptors may be distinct and one of
them may have greater numerical representativeness, it was necessary to do the normalization,
considering the methods of normalization by the greater distance and normalization
by the greater approximate distance with balancing by the intrinsic dimension. An exhaustive
search algorithm was used to perform the tests. The experiments were carried out in a
classified database. To evaluate the semantic quality of the results, a measure was proposed
that evaluates the inclusion of diversity considering the diversity present in the query only
considering the similarity and the maximum diversity that can be included. A comparison
was made between the result obtained and the considered ideal, which refers to the value of
l defined by the user himself. By comparing the results obtained with the results obtained
in the queries for a single descriptor, the evaluation of the included diversity followed the
trend of l, which allows to say that normalization and balancing is necessary. In addition,
it is intended in the future to study new ways of normalizing. / Uma das formas para se recuperar imagens em banco de dados, é através de consultas por
similaridade. Utilizando características extraídas dessas imagens, como cor, forma ou textura,
busca-se identificar semelhanças a um elemento central de consulta. No entanto, os
resultados nas consultas podem ser muito semelhantes entre si, o que nem sempre é o resultado
esperado. Além da redundância nos resultados, deve-se destacar o problema do ‘gap
semântico’, que é a divergência na avaliação da similaridade entre imagens realizada pelo
computador considerando a sua representação numérica (características de baixo nível) e a
percepção humana sobre a imagem (características de alto nível). Com o objetivo de melhorar
a qualidade dos resultados nas consultas buscou-se minimizar a questão da redundância
e do ‘gap semântico’ através da utilização de mais de um descritor nas consultas por similaridade.
Buscou-se explorar a inclusão de diversidade utilizando-se um descritor para tratar
a similaridade e outro descritor para tratar a diversidade, mais genericamente, um espaço
métrico para similaridade e outro para a diversidade. Para a implementação da consulta por
similaridade utilizou-se a consulta aos vizinhos diversos mais próximos. Considerando-se
que os descritores utilizados podem ser distintos e que um deles possa ter maior representatividade
numérica do que o outro, foi necessário fazer a normalização, sendo considerados os
métodos da normalização pela maior distância e normalização pela maior distancia aproximada
com balanceamento pela dimensão intrínseca. Para a realização dos testes utilizou-se
um algoritmo de busca exaustiva. Os experimentos foram realizados em uma base de dados
classificada. Para avaliar a qualidade semântica dos resultados foi proposta uma medida
que avalia a inclusão de diversidade considerando a diversidade presente na consulta apenas
considerando a similaridade e a diversidade máxima que pode ser incluída. Foi feita
uma comparação entre o resultado obtido e o considerado ideal, que refere-se ao valor de
l definido pelo próprio usuário. Comparando-se os resultados alcançados com os resultados
obtidos nas consultas para um único descritor, a avaliação da diversidade incluída
acompanhou a tendência de l, o que permite dizer que a normalização e balanceamento é
necessário. Além disso, pretende-se futuramente estudar novas formas de normalizar.
|
4 |
Indexação de dados em domínios métricos generalizáveis / Indexing complex data in Generic Metric Domains.Ives Renê Venturini Pola 10 June 2005 (has links)
Os sistemas Gerenciadores de Bases de Dados (SGBDs) foram desenvolvidos para manipular domínios de dados numéricos e/ou pequenas seqüencias de caracteres (palavras) e não foram projetados prevendo a manipulação de dados complexos, como por exemplo dados multimídia. Os operadores em domínios de dados que requisitam a relação de ordem têm pouca utilidade para manipular operações que envolvem dados complexos. Uma classe de operadores que se adequa melhor para manipular esses dados são os operadores por similaridade: consulta por abrangência (``range queries') e consulta de vizinhos mais próximos (``k-nearest neighbor queries'). Embora muitos resultados já tenham sido obtidos na elaboração de algoritmos de busca por similaridade, todos eles consideram uma única função para a medida de similaridade, que deve ser universalmente aplicável a todos os pares de elementos do conjunto de dados. Este projeto propõe explorar a possibilidade de trabalhar com estruturas de dados concebidas dentro dos conceitos de dados em domínios métricos, mas que admitam o uso de uma função de distância adaptável, ou seja, que mude para determinados grupos de objetos, dependendo de algumas características universais, e assim permitindo acomodar características que sejam particulares a algumas classes de imagens e não de todo o conjunto delas, classificando as imagens em uma hierarquia de tipos, onde cada tipo está associado a uma função de distância diferente e vetores de características diferentes, todos indexados numa mesma árvore. / The DBMS were developed to manipulate data in numeric domains and short strings, not considering the manipulation of complex data, like multimidia data. The operators em data domain which requests for the total order property have no use to handle complex data. An operator class that fit well to handle this type of data are the similarity operators: range query and nearest neighbor query. Although many results have been shown in research to answer similarity queries, all use only one distance function to measure the similarity, which must be applicable to all pairs of elements of the set. The goal of this work is to explore the possibility of deal with complex data in metric domains, that uses a suitable distance function, that changes its behavior for certain groups of data, depending of some universal features, allowing them to use specific features of some classes of data, not shared for the entire set. This flexibility will allow to reduce the set of useful features of each element in the set individually, relying in the values obtainded for one or few features extracted in first place. This values will guide the others important features to extract from data.
|
Page generated in 0.0877 seconds