Global ETD Search

21	Optimizing similarity queries in metric spaces meeting user\'s expectation / Otimização de operações de busca por similaridade em espaços métricos Mônica Ribeiro Porto Ferreira 22 October 2012 (has links) The complexity of data stored in large databases has increased at very fast paces. Hence, operations more elaborated than traditional queries are essential in order to extract all required information from the database. Therefore, the interest of the database community in similarity search has increased significantly. Two of the well-known types of similarity search are the Range (\'R IND. q\') and the k-Nearest Neighbor (\'kNN IND. q\') queries, which, as any of the traditional ones, can be sped up by indexing structures of the Database Management System (DBMS). Another way of speeding up queries is to perform query optimization. In this process, metrics about data are collected and employed to adjust the parameters of the search algorithms in each query execution. However, although the integration of similarity search into DBMS has begun to be deeply studied more recently, the query optimization has been developed and employed just to answer traditional queries. The execution of similarity queries, even using efficient indexing structures, tends to present higher computational cost than the execution of traditional ones. Two strategies can be applied to speed up the execution of any query, and thus they are worth to employ to answer also similarity queries. The first strategy is query rewriting based on algebraic properties and cost functions. The second technique is when external query factors are applied, such as employing the semantic expected by the user, to prune the answer space. This thesis aims at contributing to the development of novel techniques to improve the similarity-based query optimization processing, exploiting both algebraic properties and semantic restrictions as query refinements / A complexidade dos dados armazenados em grandes bases de dados tem aumentado sempre, criando a necessidade de novas operações de consulta. Uma classe de operações de crescente interesse são as consultas por similaridade, das quais as mais conhecidas são as consultas por abrangência (\'R IND. q\') e por k-vizinhos mais próximos (\'kNN IND. q\'). Qualquer consulta e agilizada pelas estruturas de indexação dos Sistemas de Gerenciamento de Bases de Dados (SGBDs). Outro modo de agilizar as operações de busca e a manutenção de métricas sobre os dados, que são utilizadas para ajustar parâmetros dos algoritmos de busca em cada consulta, num processo conhecido como otimização de consultas. Como as buscas por similaridade começaram a ser estudadas seriamente para integração em SGBDs muito mais recentemente do que as buscas tradicionais, a otimização de consultas, por enquanto, e um recurso que tem sido utilizado para responder apenas a consultas tradicionais. Mesmo utilizando as melhores estruturas existentes, a execução de consultas por similaridade tende a ser mais custosa do que as operações tradicionais. Assim, duas estratégias podem ser utilizadas para agilizar a execução de qualquer consulta e, assim, podem ser empregadas também para responder às consultas por similaridade. A primeira estratégia e a reescrita de consultas baseada em propriedades algébricas e em funções de custo. A segunda técnica faz uso de fatores externos à consulta, tais como a semântica esperada pelo usuário, para restringir o espaço das respostas. Esta tese pretende contribuir para o desenvolvimento de técnicas que melhorem o processo de otimização de consultas por similaridade, explorando propriedades algebricas e restrições semânticas como refinamento de consultas Álgebra por similaridade Consultas por similaridade Espaços métricos Expectativa do usuário Metric spaces Similarity algebra Similarity queries Similarity query optimization User's expectation
22	Similaridade em big data / Similarity in big data Lúcio Fernandes Dutra Santos 19 July 2017 (has links) Os volumes de dados armazenados em grandes bases de dados aumentam em ritmo sempre crescente, pressionando o desempenho e a flexibilidade dos Sistemas de Gerenciamento de Bases de Dados (SGBDs). Os problemas de se tratar dados em grandes quantidades, escopo, complexidade e distribuição vêm sendo tratados também sob o tema de big data. O aumento da complexidade cria a necessidade de novas formas de busca - representar apenas números e pequenas cadeias de caracteres já não é mais suficiente. Buscas por similaridade vêm se mostrando a maneira por excelência de comparar dados complexos, mas até recentemente elas não estavam disponíveis nos SGBDs. Agora, com o início de sua disponibilidade, está se tornando claro que apenas os operadores de busca por similaridade fundamentais não são suficientes para lidar com grandes volumes de dados. Um dos motivos disso é que similaridade\' é, usualmente, definida considerando seu significado quando apenas poucos estão envolvidos. Atualmente, o principal foco da literatura em big data é aumentar a eficiência na recuperação dos dados usando paralelismo, existindo poucos estudos sobre a eficácia das respostas obtidas. Esta tese visa propor e desenvolver variações dos operadores de busca por similaridade para torná-los mais adequados para processar big data, apresentando visões mais abrangentes da base de dados, aumentando a eficácia das respostas, porém sem causar impactos consideráveis na eficiência dos algoritmos de busca e viabilizando sua execução escalável sobre grandes volumes de dados. Para alcançar esse objetivo, este trabalho apresenta quatro frentes de contribuições: A primeira consistiu em um modelo de diversificação de resultados que pode ser aplicado usando qualquer critério de comparação e operador de busca por similaridade. A segunda focou em definir técnicas de amostragem e de agrupamento de dados com o modelo de diversificação proposto, acelerando o processo de análise dos conjuntos de resultados. A terceira contribuição desenvolveu métodos de avaliação da qualidade dos conjuntos de resultados diversificados. Por fim, a última frente de contribuição apresentou uma abordagem para integrar os conceitos de mineração visual de dados e buscas por similaridade com diversidade em sistemas de recuperação por conteúdo, aumentando o entendimento de como a propriedade de diversidade pode ser aplicada. / The data being collected and generated nowadays increase not only in volume, but also in complexity, requiring new query operators. Health care centers collecting image exams and remote sensing from satellites and from earth-based stations are examples of application domains where more powerful and flexible operators are required. Storing, retrieving and analyzing data that are huge in volume, structure, complexity and distribution are now being referred to as big data. Representing and querying big data using only the traditional scalar data types are not enough anymore. Similarity queries are the most pursued resources to retrieve complex data, but until recently, they were not available in the Database Management Systems. Now that they are starting to become available, its first uses to develop real systems make it clear that the basic similarity query operators are not enough to meet the requirements of the target applications. The main reason is that similarity is a concept formulated considering only small amounts of data elements. Nowadays, researchers are targeting handling big data mainly using parallel architectures, and only a few studies exist targeting the efficacy of the query answers. This Ph.D. work aims at developing variations for the basic similarity operators to propose better suited similarity operators to handle big data, presenting a holistic vision about the database, increasing the effectiveness of the provided answers, but without causing impact on the efficiency on the searching algorithms. To achieve this goal, four mainly contributions are presented: The first one was a result diversification model that can be applied in any comparison criteria and similarity search operator. The second one focused on defining sampling and grouping techniques with the proposed diversification model aiming at speeding up the analysis task of the result sets. The third contribution concentrated on evaluation methods for measuring the quality of diversified result sets. Finally, the last one defines an approach to integrate the concepts of visual data mining and similarity with diversity searches in content-based retrieval systems, allowing a better understanding of how the diversity property is applied in the query process. Análise de qualidade de resultados Big data Buscas em espaços métricos Buscas por similaridade Diversificação de resultados Analysis of results quality Big data Result diversification Similarity queries Similarity search in metric space
23	Sistemas dinamicos em espaços metricos fuzzy : aplicações em biomatematica / Dynamical systems in fuzzy metric spaces : applications in biomathematics Cecconello, Moiseis dos Santos 15 August 2018 (has links) Orientadores: Rodney Carlos Bassanezi, Adilson Jose Vieira Brandão / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-15T01:52:00Z (GMT). No. of bitstreams: 1 Cecconello_MoiseisdosSantos_D.pdf: 62393038 bytes, checksum: b7f0d1f9138d8e787749532bf661d026 (MD5) Previous issue date: 2010 / Resumo: Neste trabalho desenvolvemos ferramentas de análise qualitativa para sistemas dinâmicos definidos sobre o espaço formado pelos conjuntos fuzzy com a níveis compactos e não vazios. São propostas condições para existência de pontos de equilíbrio para o fluxo fuzzy cuja função de pertinência é sobrejetiva, generalizando alguns resultados já conhecidos. Os fluxos fuzzy considerados aqui são determinados pela extensão de Zadeh aplicada em soluções de equações diferenciais autônomas. São obtidos também condições para a existência de pontos e órbitas periódicas para o fluxo fuzzy. Em particular, demonstramos um teorema tipo Poincaré-Bendixson para tais fluxos gerados por equações autônomas bidimensionais. A análise qualitativa desenvolvida é aplicada em sistemas dinâmicos fuzzy provenientes de modelos significativos da Biomatemática. / Abstract: In this work we develop some tools for qualitative analysis of dynamical systems defined on the metric space of fuzzy sets with compact and nonempty a cuts. Conditions are offered for the existence of equilibrium points for the flow whose fuzzy membership function is surjective, generalizing some results already known. Fuzzy flows considered here are determined by Zadeh's extension applied in solutions of autonomous differential equations. We also obtained conditions for the existence of periodic points and periodic orbits for the fuzzy flow. In particular, we demonstrate a theorem like Poincaré-Bendixson for such flows generated by two-dimensional autonomous equations. The qualitative analysis results are applied to fuzzy dynamic systems from meaningful models of Biomathematics. / Doutorado / Biomatematica / Doutor em Matemática Aplicada Teoria dos sistemas dinâmicos Conjuntos fuzzy Biomatemática Espaços métricos Órbitas periódicas Theory of dynamical systems Fuzzy sets Biomathematics Metric spaces Periodic orbits

Page generated in 0.0773 seconds