• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 21
  • 7
  • 7
  • 7
  • 7
  • 3
  • 2
  • 1
  • Tagged with
  • 23
  • 23
  • 15
  • 9
  • 9
  • 9
  • 8
  • 8
  • 8
  • 6
  • 6
  • 6
  • 5
  • 5
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Descobrindo a Topologia: um compêndio de fundamentos teóricos e atividades lúdicas para auxiliar na formalização de conceitos topológicos no Ensino Básico. / Discovering Topology: A compendium of theoretical foundations and play activities for in the formalization of topological concepts in the Basic education.

Silva, Camila Tolin Santos da 31 July 2018 (has links)
Submitted by CAMILA TOLIN SANTOS DA SILVA (camilatolin@yahoo.com.br) on 2018-08-30T19:02:42Z No. of bitstreams: 1 Camila Tolin - Dissertação mestrado versão final.pdf: 53772690 bytes, checksum: e820d5f4112aab671ce28d3bd47eab57 (MD5) / Rejected by Elza Mitiko Sato null (elzasato@ibilce.unesp.br), reason: Solicitamos que realize correções na submissão seguindo as orientações abaixo: Problema 01) É necessário que o arquivo contendo a sua dissertação esteja no formato PDF (Portable Document Format) e não esteja protegido . Problema 02) A ficha catalográfica deve ser corrigida pois nela consta: ”Instituto de Biociências, Letras e Ciências Exatas”, Presidente Prudente, o nome do Câmpus de Presidente Prudente é Faculdade de Ciências e Tecnologia. Problema 03) Solicito que corrija também na descrição na natureza da pesquisa na folha de rosto e aprovação: Dissertação apresentada como parte dos requisitos para obtenção do título de Mestre, junto ao programa de Mestrado Profissional em Matemática em Rede Nacional - PROFMAT, da Faculdade de Ciências e Tecnologia da Universidade Estadual Paulista Júlio de Mesquita Filho , Câmpus de Presidente Prudente. Problema 04) O arquivo contém 12(doze) páginas em branco (pags. 04, 06, 08, 10, 12, 14, 24, 42, 52, 82, 98 e 138) as mesmas devem retiradas pois o arquivo não pode conter páginas em branco. e deve ser corrigido também na ficha catalográfica o número de folhas. Lembramos que o arquivo depositado no repositório deve ser igual ao impresso, o rigor com o padrão da Universidade se deve ao fato de que o seu trabalho passará a ser visível mundialmente. Agradecemos a compreensão. on 2018-08-31T13:19:11Z (GMT) / Submitted by CAMILA TOLIN SANTOS DA SILVA (camilatolin@yahoo.com.br) on 2018-09-03T19:10:00Z No. of bitstreams: 1 Camila Tolin - Dissertação mestrado versão final 03-09-2018.pdf: 53765385 bytes, checksum: 97efaf5bb1d8f5cfbffec24611d1e062 (MD5) / Approved for entry into archive by Elza Mitiko Sato null (elzasato@ibilce.unesp.br) on 2018-09-03T19:52:36Z (GMT) No. of bitstreams: 1 silva_cts_me_sjrp.pdf: 9381939 bytes, checksum: 551bd372a749383dd387d1f2049a82bf (MD5) / Made available in DSpace on 2018-09-03T19:52:36Z (GMT). No. of bitstreams: 1 silva_cts_me_sjrp.pdf: 9381939 bytes, checksum: 551bd372a749383dd387d1f2049a82bf (MD5) Previous issue date: 2018-07-31 / A topologia é um ramo da matemática, sutilmente entrelaçado com a Geometria, de aplicação em diversas áreas do conhecimento, cuja conceituação foi apresentada de forma expressiva nas escolas durante as décadas de 60 e 70, com o movimento educacional conhecido como Matemática Moderna. Através das mudanças curriculares, muitos temas abordados no ensino fundamental e médio foram reestruturados dentro de um conjunto de parâmetros para a organização curricular da base nacional comum, os PCN's, que normatizam a base do ensino e orientam que a matemática deve ser apresentada para o desenvolvimento de habilidades inerentes à resolução de problemas, aquisição de linguagem simbólica, modelagem e interpretação de situações cotidianas, argumentação e aplicação em situações da vida real. Portanto, esse trabalho foi elaborado com o objetivo de fornecer suporte para o ensino da topologia no ensino básico, através da compilação de fatos históricos, formalização de definições básicas de caráter introdutório como continuidade, espaços métricos, espaços topológicos, entre outros, apresentação de atividades que poderão ser trabalhadas conjuntamente com o ensino da geometria, que de forma lúdica e intuitiva, ajudarão a alicerçar a base para um futuro aprofundamento desses conceitos, auxiliando no desenvolvimento do pensamento topológico. / Topology is a branch of mathematics, subtly intertwined with geometry, of application in several areas of knowledge, whose conceptualization was presented expressively in schools during the 60s and 70s, with the educational movement known as Modern Mathematics. Through the curricular changes, many topics addressed in elementary and secondary education have been restructured within a set of parameters for the curriculum organization of the common national base, the PCNs, that normalize the base of the teaching and guide that the mathematics must be presented for the development of inherent abilities to solve problems, acquisition of symbolic language, modeling and interpretation of everyday situations, argumentation and application in real life situations. Thus, this work was developed with the purpose of providing support for the teaching of topology in basic education, through the compilation of historical facts, formalization of basic de nitions of introductory character such as continuity, metric spaces, topological spaces, among others, presentation of activities which can be worked together with the teaching geometry, which in a playful and intuitive way, will help to lay the foundation for a future deepening of these concepts, aiding in the development of topological thinking.
12

A característica de Euler /

Gisoldi, Denis Vanucci. January 2013 (has links)
Orientador: Alice Kimie Miwa Libardi / Banca: Marcos Vieira Teixeira / Banca: Evelin Meneguesso Barbaresco / O PROFMAT - Programa de Mestrado Profissional em Matemática em Rede Nacional é coordenado pela Sociedade Brasileira de Matemática e realizado por uma rede de Instituições de Ensino Superior. / Resumo: O objetivo principal deste trabalho é o estudo da característica da Euler de poliedros, superfícies e de soma conexa de superfícies. É provado que se duas superfícies tem a mesma característica de Euler, então elas são homeomorfas. A recíproca é também verdadeira, porém sua demonstração foge ao escopo deste trabalho. Para o desenvolvimento da atividade para alunos do ensino médio, foram construídos materiais didáticos com o objetivo de motivar e mostrar triangulações de algumas superfícies, necessárias para o cálculo das características de Euler / Abstract: The main goal of this work is the study of the Euler characteristic of polyhedron, surfaces and of connected sum of surfaces. It is also proved that if two surfaces have the same Euler characteristic then they are homeomorphics. The converse is also true, but it is not proven in this work. For the development of an activity for high school students were made didactic materials in order to motivate and show the triangulations of some surfaces, necessary to calculate the Euler characteristics / Mestre
13

Explorando variedade em consultas por similaridade / Investigationg variety in similarity queries

Lúcio Fernandes Dutra Santos 26 October 2012 (has links)
A complexidade dos dados armazenados em grandes bases de dados aumenta sempre, criando a necessidade de novas formas de consulta. As consultas por similaridade vêm apresentando crescente interesse para tratar de dados complexos, sendo as mais representativas a consulta por abrangência (\'R IND. q\' Range query) e a consulta aos k-vizinhos mais próximos (k-\'NN IND. q\' k-Nearest Neighboor query). Até recentemente, essas consultas não estavam disponíveis nos Sistemas de Gerenciamento de Bases de Dados (SGBD). Agora, com o início de sua disponibilidade, tem se tornado claro que os operadores de busca fundamentais usados para executá-las não são suficientes para atender às necessidades das aplicações que as demandam. Assim, estão sendo estudadas variações e extensões aos operadores fundamentais, em geral voltados às necessidades de domínios de aplicações específicas. Além disso, os seguintes problemas vêm impactando diretamente sua aceitação por parte dos usuários e, portanto, sua usabilidade: (i) os operadores fundamentais são pouco expressivos em situações reais; (ii) a cardinalidade dos resultados tende a ser grande, obrigando o usuário analisar muitos elementos; e (iii) os resultados nem sempre atendem ao interesse do usuário, implicando na reformulação e ajuste frequente das consultas. O objetivo desta dissertação é o desenvolvimento de uma técnica inédita para exibir um grau de variedade nas respostas às consultas aos k-vizinhos mais próximos em domínios de dados métricos, explorando aspectos de diversidade em extensões dos operadores fundamentais usando apenas as propriedades básicas do espaço métrico sem a solicitação de outra informação por parte do usuário. Neste sentido, são apresentados: a formalização de um modelo de variedade que possibilita inserir diversidade nas consultas por similaridade sem a definição de parâmetros por parte do usuário; um algoritmo incremental para responder às consultas aos k-vizinhos mais próximos com variedade; um método de avaliação de sobreposição de variedade para as consultas por similaridade. As propriedades desses resultados permitem usar as técnicas desenvolvidas para apoiar a propriedade de variedade nas consultas aos k-vizinhos mais próximos em Sistemas de Gerenciamento de Bases de Dados / The data being collected and generated nowadays increases not only in volume, but also in complexity, leading to the need of new query operators. Similarity queries are one of the most pursued resources to retrieve complex data. The most studied operators to perform similarity are the Range Query (\'R IND.q\') and the k-Nearest Neighbor Query (k-\'NN IND. q\'). Until recently, those queries were not available in the Database Management Systems. Now they are starting to become available, but since its earliest applications to develop real systems, it became clear that the basic similarity query operators are not enough to meet the requirements of the target applications. Therefore, new variations and extensions to the basic operators are being studied, although every work up to now is only pursuing the requirements of specific application domains. Furthermore, the following issues are directly impacting their acceptance by users and therefore its usability: (i) the basic operators are not expressive in real situations, (ii) the result-set cardinality tends to be large, imposing to the user the need to analyze to many elements, and (iii) the results do not always meet the users interest, resulting in the reformulation and adjustment of the queries. The goal of this dissertation is the development of a novel technique to enable a degree of variety the answers of k-nearest neighbor queries in metric spaces, investigating aspects of diversity in extensions of the basic operators using only the properties of metric spaces, never requesting extra information from the user. In this monograph, we present: the formalization of the variety model that allows to support diversity in similarity queries without requiring diversification parameters from the user; a greedy algorithm to obtain answers for similarity queries to the k-nearest neighbors with variety; an evaluation method to assess the diversification ratio existing on a subset of elements in metric space. The properties of those results allow using our proposed techniques to support variety in k-nearest neighbor queries in Database Management Systems
14

Jogos topológicos e metrizabilidade / Topological game and metrizibility

Dione Andrade Lara 21 October 2016 (has links)
Neste trabalho apresentaremos o princípio seletivo S1(O;H ) que caracteriza a propriedade da diagonal Gd . Iremos também apresentar um jogo topológico G1(O;H ) induzido por esse princípio seletivo e estudaremos as relações entre esse jogo e a propriedade da diagonal Gd . Além disso, apresentaremos outros jogos topológicos e mostraremos quais são as relações destes com o jogo G1(O;H ). Finalmente, daremos algumas aplicações desses jogos e exemplos / In this work we present a selection principle S1(O;H) that characterizes the Gd -diagonal property. We also present a topological game G1(O;H ) induced by this selection principle and we study the relations between this game and the Gd -diagonal property. Besides that, we present other topological games and we show which are the relations between those topological games and the game G1(O;H ). Finally, we give some applications and examples.
15

Cônicas e métricas em R^2 /

Hrycyk, Márcio January 2019 (has links)
Orientador: Eliris Cristina Rizziolli / Resumo: Este estudo tem como objetivo explorar as cônicas clássicas, a saber: elipse, hipérbole e parábola. Inicialmente será feita uma abordagem do ponto de vista geométrico e posteriormente um tratamento analítico através das três métricas usuais de R^2: euclidiana, do máximo e a da soma. / Abstract: This study aims to explore the classic conics, namely: ellipse, hyperbole and parable. Initially an approach will be made from the geometrical point of view and later an analytical treatment through the three usual R2: euclidean, maximum and sum metrics. / Mestre
16

Explorando conceitos da teoria de espaços métricos em consultas por similaridade sobre dados complexos / Exploring concepts of metric space theory in similarity queries over complex data

Pola, Ives Renê Venturini 25 August 2010 (has links)
Estruturas de indexação para domínios métricos são úteis para agilizar consultas por similaridade sobre dados complexos, tais como imagens, onde o custo computacional da comparação de dois itens de dados geralmente é alto. O estado da arte para executar consultas por similaridade está centrado na utilização dos chamados \"Métodos de Acesso Métrico\" (MAM). Tais métodos consideram os dados como elementos de um espaço métrico, onde apenas valem as propriedades fundamentais para que um espaço seja considerado métrico, onde a única informação que os MAMs utilizam é a medida de similaridade entre pares de elementos do domínio. No campo teórico, espaços métricos são extensamente estudados e servem de base para diversas áreas da Matemática. No entanto, a maioria dos trabalhos que têm sido desenvolvidos em Computação se restringem a utilizar as definições básicas desses espaços, e não foram encontrados estudos que explorem em mais profundidade os muitos conceitos teóricos existentes. Assim, este trabalho aplica conceitos teóricos importantes da Teoria de Espaços Métricos para desenvolver técnicas que auxiliem o tratamento e a manipulação dos diversos dados complexos, visando principalmente o desenvolvimento de métodos de indexação mais eficientes. É desenvolvida uma técnica para realizar um mapeamento de espaços métricos que leva à atenuação do efeito da maldição da dimensionalidade, a partir de uma aplicação lipschitziana real baseada em uma função de deformação do espaço das distâncias entre os elementos do conjunto. Foi mostrado que uma função do tipo exponecial deforma as distâncias de modo a diminuir os efeitos da maldição da dimensionalidade, melhorando assim o desempenho nas consultas. Uma segunda contribuição é o desenvolvimento de uma técnica para a imersão de espaços métricos, realizada de maneira a preservar a ordem das distâncias, possibilitando a utilização de propriedades no espaço de imersão. A imersão de espaços métricos no \' R POT. n\' possibilita a utilização da lei dos cossenos e assim viabiliza o cálculo de distâncias entre elementos e um hiperplano métrico, permitindo aumentar a agilidade à consultas por similaridade. O uso do hiperplano métrico foi exemplificado construindo uma árvore binária métrica, e também foi aplicado em um método de acesso métrico, a família MMH de métodos de acesso métrico, melhorando o particionamento do espaço dos dados / The access methods designed for metric domains are useful to answer similarity queries on any type of data, being specially useful to index complex data, such as images, where the computacional cost of comparison are high. The main mecanism used up to now to perform similarity queries is centered on \"Metric Acess Methods\" (MAM). Such methods consider data as elements that belong to a metric space, where only hold the properties that define the metric space. Therefore, the only information that a MAM can use is the similarity measure between pairs of elements in the domain. Metric spaces are extremelly well studied and is the basis for many mathematics areas. However, most researches from computer science are restrained to use the basic properties of metric spaces, not exploring the various existing theorical concepts. This work apply theoretical concepts of metric spaces to develop techniques aiding the treatment and manipulation of diverse complex data, aiming at developing more efficient indexing methods. A technique of mapping spaces was developed in order to ease the dimensionality curse effects, basing on a real lipschitz application that uses a stretching function that changes the distance space of elements. It was shown that an exponential function changes the distances space reducing the dimensionality curse effects, improving query operations. A second contribution is the developing of a technique based on metric space immersion, preserving the distances order between pairs of elements, allowing the usage of immersion space properties. The immersion of metric spaces into \'R POT. n\' allow the usage of the cossine law leading to the determination of distances between elements and a hiperplane, forming metric hiperplanes. The use of the metric hiperplanes lead to an improvement of query operations performance. The metric hiperplane itself formed the binary metric tree, and when applied to a metric access method, lead the formation of a family of metric access methods that improves the metric space particioning achieving faster similarity queries
17

Explorando conceitos da teoria de espaços métricos em consultas por similaridade sobre dados complexos / Exploring concepts of metric space theory in similarity queries over complex data

Ives Renê Venturini Pola 25 August 2010 (has links)
Estruturas de indexação para domínios métricos são úteis para agilizar consultas por similaridade sobre dados complexos, tais como imagens, onde o custo computacional da comparação de dois itens de dados geralmente é alto. O estado da arte para executar consultas por similaridade está centrado na utilização dos chamados \"Métodos de Acesso Métrico\" (MAM). Tais métodos consideram os dados como elementos de um espaço métrico, onde apenas valem as propriedades fundamentais para que um espaço seja considerado métrico, onde a única informação que os MAMs utilizam é a medida de similaridade entre pares de elementos do domínio. No campo teórico, espaços métricos são extensamente estudados e servem de base para diversas áreas da Matemática. No entanto, a maioria dos trabalhos que têm sido desenvolvidos em Computação se restringem a utilizar as definições básicas desses espaços, e não foram encontrados estudos que explorem em mais profundidade os muitos conceitos teóricos existentes. Assim, este trabalho aplica conceitos teóricos importantes da Teoria de Espaços Métricos para desenvolver técnicas que auxiliem o tratamento e a manipulação dos diversos dados complexos, visando principalmente o desenvolvimento de métodos de indexação mais eficientes. É desenvolvida uma técnica para realizar um mapeamento de espaços métricos que leva à atenuação do efeito da maldição da dimensionalidade, a partir de uma aplicação lipschitziana real baseada em uma função de deformação do espaço das distâncias entre os elementos do conjunto. Foi mostrado que uma função do tipo exponecial deforma as distâncias de modo a diminuir os efeitos da maldição da dimensionalidade, melhorando assim o desempenho nas consultas. Uma segunda contribuição é o desenvolvimento de uma técnica para a imersão de espaços métricos, realizada de maneira a preservar a ordem das distâncias, possibilitando a utilização de propriedades no espaço de imersão. A imersão de espaços métricos no \' R POT. n\' possibilita a utilização da lei dos cossenos e assim viabiliza o cálculo de distâncias entre elementos e um hiperplano métrico, permitindo aumentar a agilidade à consultas por similaridade. O uso do hiperplano métrico foi exemplificado construindo uma árvore binária métrica, e também foi aplicado em um método de acesso métrico, a família MMH de métodos de acesso métrico, melhorando o particionamento do espaço dos dados / The access methods designed for metric domains are useful to answer similarity queries on any type of data, being specially useful to index complex data, such as images, where the computacional cost of comparison are high. The main mecanism used up to now to perform similarity queries is centered on \"Metric Acess Methods\" (MAM). Such methods consider data as elements that belong to a metric space, where only hold the properties that define the metric space. Therefore, the only information that a MAM can use is the similarity measure between pairs of elements in the domain. Metric spaces are extremelly well studied and is the basis for many mathematics areas. However, most researches from computer science are restrained to use the basic properties of metric spaces, not exploring the various existing theorical concepts. This work apply theoretical concepts of metric spaces to develop techniques aiding the treatment and manipulation of diverse complex data, aiming at developing more efficient indexing methods. A technique of mapping spaces was developed in order to ease the dimensionality curse effects, basing on a real lipschitz application that uses a stretching function that changes the distance space of elements. It was shown that an exponential function changes the distances space reducing the dimensionality curse effects, improving query operations. A second contribution is the developing of a technique based on metric space immersion, preserving the distances order between pairs of elements, allowing the usage of immersion space properties. The immersion of metric spaces into \'R POT. n\' allow the usage of the cossine law leading to the determination of distances between elements and a hiperplane, forming metric hiperplanes. The use of the metric hiperplanes lead to an improvement of query operations performance. The metric hiperplane itself formed the binary metric tree, and when applied to a metric access method, lead the formation of a family of metric access methods that improves the metric space particioning achieving faster similarity queries
18

Recuperação de informações tridimensionais a partir de múltiplas imagens / Recovering of three-dimensional information from multiple images

Gomes, Marcelo Marques 20 August 2018 (has links)
Orientador: Clésio Luis Tozzi / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-20T02:20:27Z (GMT). No. of bitstreams: 1 Gomes_MarceloMarques_M.pdf: 2920969 bytes, checksum: 0ae0c041b47241b92c32e9792f18d608 (MD5) Previous issue date: 2012 / Resumo: Este trabalho aborda a solução para o problema da recuperação da informação tridimensional somente a partir de imagens da cena ou do objeto que se deseja modelar desconhecidas as informações a respeito das câmeras utilizadas. A solução apresentada divide-se em duas partes: na primeira se estabelece a relação entre pares ou trios de câmeras utilizando matriz fundamental ou tensor trifocal, respectivamente e a partir dessas relações obtém-se por meio de triangulação uma reconstrução tridimensional da cena ou do objeto observado em função de uma transformação projetiva arbitrária. Na segunda parte determina-se uma transformação que leva a cena ou o objeto obtidos no espaço projetivo para o espaço métrico. Essa transformação que leva o objeto recuperado no espaço projetivo para o espaço métrico é encontrada por meio de autocalibração utilizando o plano no infinito e a cônica absoluta que apresentam a propriedade de serem invariantes a rotação, translação e escala, em relação a um referencial escolhido arbitrariamente. Dependendo do número de imagens disponíveis é necessário inserir restrições nos parâmetros intrínsecos das câmeras para viabilizar o cálculo da transformação. Essas restrições são inseridas na forma de suposições a respeito dos parâmetros intrínsecos das câmeras, como pontos principais conhecidos ou constantes entre as câmeras, skew nulo, relação de aspecto unitária etc. Os resultados da reconstrução no espaço projetivo obtidos com o uso da matriz fundamental e do tensor trifocal foram comparados em relação ao erro de reconstrução utilizando protótipo implementado em Matlab e imagens sintéticas. A solução geral foi avaliada em relação ao erro de reprojeção, reconstrução no espaço métrico com base em imagens sintéticas e imagens reais de objetos conhecidos, utilizando um protótipo desenvolvido na plataforma Embarcadero Delphi / Abstract: This work addresses a solution to the problem of recovering three-dimensional information from images of a scene or modeled object based only on images and without any information of the cameras parameters. The presented solution is divided in two parts: in the first part it is established the relationship between a pair or a triple of cameras using the fundamental matrix or trifocal tensor, respectively, and obtained by triangulation a three-dimensional reconstruction of the observed scene or object in function of an arbitrary projective transformation. In the second part it is determined a transformation to covert the obtained scene or object reconstruction from the projective space to the metric space. This transformation is found by auto-calibration using the plane at infinity and the absolute conic which have the property of being invariant to rotation, translation and scale in relation to an arbitrarily chosen reference frame. According to the number of available images, restrictions on the intrinsic parameters may be necessary in order to obtain a valid transformation. These restrictions are inserted in the form of assumptions about the values of the intrinsic parameters of the cameras or relations between then, like known principal points or constant values for the cameras, zero skew, unit aspect ratio and so on. Using synthetic images and a prototype implemented in Matlab, the results of reconstruction in projective space based on the fundamental matrix and trifocal tensor were compared in relation to the error of reconstruction. Based on synthetic images and real images of known objects and a prototype developed in the Embarcadero Delphi platform, the general solution was evaluated in relation to the reprojection error and the error of reconstruction in the metric space / Mestrado / Engenharia de Computação / Mestre em Engenharia Elétrica
19

Optimizing similarity queries in metric spaces meeting user\'s expectation / Otimização de operações de busca por similaridade em espaços métricos

Ferreira, Mônica Ribeiro Porto 22 October 2012 (has links)
The complexity of data stored in large databases has increased at very fast paces. Hence, operations more elaborated than traditional queries are essential in order to extract all required information from the database. Therefore, the interest of the database community in similarity search has increased significantly. Two of the well-known types of similarity search are the Range (\'R IND. q\') and the k-Nearest Neighbor (\'kNN IND. q\') queries, which, as any of the traditional ones, can be sped up by indexing structures of the Database Management System (DBMS). Another way of speeding up queries is to perform query optimization. In this process, metrics about data are collected and employed to adjust the parameters of the search algorithms in each query execution. However, although the integration of similarity search into DBMS has begun to be deeply studied more recently, the query optimization has been developed and employed just to answer traditional queries. The execution of similarity queries, even using efficient indexing structures, tends to present higher computational cost than the execution of traditional ones. Two strategies can be applied to speed up the execution of any query, and thus they are worth to employ to answer also similarity queries. The first strategy is query rewriting based on algebraic properties and cost functions. The second technique is when external query factors are applied, such as employing the semantic expected by the user, to prune the answer space. This thesis aims at contributing to the development of novel techniques to improve the similarity-based query optimization processing, exploiting both algebraic properties and semantic restrictions as query refinements / A complexidade dos dados armazenados em grandes bases de dados tem aumentado sempre, criando a necessidade de novas operações de consulta. Uma classe de operações de crescente interesse são as consultas por similaridade, das quais as mais conhecidas são as consultas por abrangência (\'R IND. q\') e por k-vizinhos mais próximos (\'kNN IND. q\'). Qualquer consulta e agilizada pelas estruturas de indexação dos Sistemas de Gerenciamento de Bases de Dados (SGBDs). Outro modo de agilizar as operações de busca e a manutenção de métricas sobre os dados, que são utilizadas para ajustar parâmetros dos algoritmos de busca em cada consulta, num processo conhecido como otimização de consultas. Como as buscas por similaridade começaram a ser estudadas seriamente para integração em SGBDs muito mais recentemente do que as buscas tradicionais, a otimização de consultas, por enquanto, e um recurso que tem sido utilizado para responder apenas a consultas tradicionais. Mesmo utilizando as melhores estruturas existentes, a execução de consultas por similaridade tende a ser mais custosa do que as operações tradicionais. Assim, duas estratégias podem ser utilizadas para agilizar a execução de qualquer consulta e, assim, podem ser empregadas também para responder às consultas por similaridade. A primeira estratégia e a reescrita de consultas baseada em propriedades algébricas e em funções de custo. A segunda técnica faz uso de fatores externos à consulta, tais como a semântica esperada pelo usuário, para restringir o espaço das respostas. Esta tese pretende contribuir para o desenvolvimento de técnicas que melhorem o processo de otimização de consultas por similaridade, explorando propriedades algebricas e restrições semânticas como refinamento de consultas
20

Similaridade em big data / Similarity in big data

Santos, Lúcio Fernandes Dutra 19 July 2017 (has links)
Os volumes de dados armazenados em grandes bases de dados aumentam em ritmo sempre crescente, pressionando o desempenho e a flexibilidade dos Sistemas de Gerenciamento de Bases de Dados (SGBDs). Os problemas de se tratar dados em grandes quantidades, escopo, complexidade e distribuição vêm sendo tratados também sob o tema de big data. O aumento da complexidade cria a necessidade de novas formas de busca - representar apenas números e pequenas cadeias de caracteres já não é mais suficiente. Buscas por similaridade vêm se mostrando a maneira por excelência de comparar dados complexos, mas até recentemente elas não estavam disponíveis nos SGBDs. Agora, com o início de sua disponibilidade, está se tornando claro que apenas os operadores de busca por similaridade fundamentais não são suficientes para lidar com grandes volumes de dados. Um dos motivos disso é que similaridade\' é, usualmente, definida considerando seu significado quando apenas poucos estão envolvidos. Atualmente, o principal foco da literatura em big data é aumentar a eficiência na recuperação dos dados usando paralelismo, existindo poucos estudos sobre a eficácia das respostas obtidas. Esta tese visa propor e desenvolver variações dos operadores de busca por similaridade para torná-los mais adequados para processar big data, apresentando visões mais abrangentes da base de dados, aumentando a eficácia das respostas, porém sem causar impactos consideráveis na eficiência dos algoritmos de busca e viabilizando sua execução escalável sobre grandes volumes de dados. Para alcançar esse objetivo, este trabalho apresenta quatro frentes de contribuições: A primeira consistiu em um modelo de diversificação de resultados que pode ser aplicado usando qualquer critério de comparação e operador de busca por similaridade. A segunda focou em definir técnicas de amostragem e de agrupamento de dados com o modelo de diversificação proposto, acelerando o processo de análise dos conjuntos de resultados. A terceira contribuição desenvolveu métodos de avaliação da qualidade dos conjuntos de resultados diversificados. Por fim, a última frente de contribuição apresentou uma abordagem para integrar os conceitos de mineração visual de dados e buscas por similaridade com diversidade em sistemas de recuperação por conteúdo, aumentando o entendimento de como a propriedade de diversidade pode ser aplicada. / The data being collected and generated nowadays increase not only in volume, but also in complexity, requiring new query operators. Health care centers collecting image exams and remote sensing from satellites and from earth-based stations are examples of application domains where more powerful and flexible operators are required. Storing, retrieving and analyzing data that are huge in volume, structure, complexity and distribution are now being referred to as big data. Representing and querying big data using only the traditional scalar data types are not enough anymore. Similarity queries are the most pursued resources to retrieve complex data, but until recently, they were not available in the Database Management Systems. Now that they are starting to become available, its first uses to develop real systems make it clear that the basic similarity query operators are not enough to meet the requirements of the target applications. The main reason is that similarity is a concept formulated considering only small amounts of data elements. Nowadays, researchers are targeting handling big data mainly using parallel architectures, and only a few studies exist targeting the efficacy of the query answers. This Ph.D. work aims at developing variations for the basic similarity operators to propose better suited similarity operators to handle big data, presenting a holistic vision about the database, increasing the effectiveness of the provided answers, but without causing impact on the efficiency on the searching algorithms. To achieve this goal, four mainly contributions are presented: The first one was a result diversification model that can be applied in any comparison criteria and similarity search operator. The second one focused on defining sampling and grouping techniques with the proposed diversification model aiming at speeding up the analysis task of the result sets. The third contribution concentrated on evaluation methods for measuring the quality of diversified result sets. Finally, the last one defines an approach to integrate the concepts of visual data mining and similarity with diversity searches in content-based retrieval systems, allowing a better understanding of how the diversity property is applied in the query process.

Page generated in 0.4416 seconds