Spelling suggestions: "subject:"vizinhos?a"" "subject:"vizinhas?a""
11 |
Alterações na legislação brasileira de manejo florestal e seus efeitos na distribuição espacial e polinização de espécies madeireiras amazônicas / Changes in Brazilian forest management legislation and their effects on spatial distribution and pollination of Amazonian timber speciesSontag, Vanessa Erler 29 August 2017 (has links)
Conhecer o comportamento espacial e demográfico e a dinâmica genética das espécies madeireiras e manter uma distância entre as árvores que permita sua reprodução é essencial para o desenvolvimento de procedimentos de manejo que visem a conservação das espécies e garantia de estoques futuros de madeira. No entanto, quando uma área é explorada para fins madeireiros, as árvores remanescentes podem não ficar a uma distância viável a polinização. A legislação brasileira atual limita a exploração de espécies com baixa densidade de ocorrência e define alguns critérios para a escolha das árvores remanescentes, porém, eles levam em consideração apenas o número de indivíduos e não os fatores ecológicos e genéticos das espécies além de serem os mesmos aplicados a toda Amazônia. O objetivo deste trabalho foi analisar o comportamento espacial de três espécies madeireiras, a Manilkara huberi, a Hymenaea courbaril e o Handroanthus serratifolius, em quatro áreas de estudo na Amazônia brasileira a partir de inventários de empresas florestais e verificar a implicação das últimas mudanças ocorridas na legislação no processo de polinização dessas espécies. O trabalho foi dividido em duas partes. A primeira verificou se essas três espécies possuem o mesmo padrão espacial em diferentes regiões da Amazônia e discutiu a questão da raridade presente na legislação. Foi calculada a densidade e a matriz do vizinho mais próximo para todos os indivíduos antes do corte das três espécies em cada área de estudo e as distâncias plotadas em um gráfico quantil-quantil. Os resultados mostraram que a Manilkara huberi é uma espécie que pode ser encontrada em alta ou baixa densidade e em agregados ou não dependendo da região de ocorrência, diferente do Handroanthus serratifolius que apresenta uma densidade e padrão de distribuição semelhante independente da região de ocorrência. A Hymenaea courbaril permeia entre essas duas situações. Notou-se uma semelhança na distribuição das espécies entre as áreas próximas. A segunda parte analisou as consequências da alteração da legislação na distância entre as árvores remanescentes das três espécies e verificou se essa distância era viável para o processo de polinização. Foi simulado o corte a partir de cenários legislativos, em que apenas o diâmetro mínimo de corte (DMC) foi alterado. Os resultados mostraram que houve uma diminuição na distância entre árvores. A diminuição favoreceu o processo de polinização visto que os polinizadores precisam percorrer menores distâncias na busca por alimento. A legislação tem tomado um caminho mais conservativo, porém há muito o que ser desenvolvido, visto que cada espécie possui sua própria ecologia reprodutiva mas são manejadas da mesma forma. / The information about the spatial and demographic behavior and the genetic dynamic of timber species and maintaining a distance between trees that allows their reproduction is essential for the development of management procedures to conserve species and guarantee future wood stocks. However, when an area is harvested for timber purposes, the remaining trees may not stay at a feasible distance for pollination. Current Brazilian legislation limits the exploitation of low-density species and defines some criteria for choosing the remaining trees. However, they take into account only the number of individuals and not the ecology and genetic aspects of the species. Besides, the same criteria are applied to the entire Amazon. The aim of this study was to analyze the spatial behavior of three timber species, Manilkara huberi, Hymenaea courbaril and Handroanthus serratifolius, in four study areas in the Brazilian Amazon Forest. Companies inventories were used to verify the implication of the latest changes in the Brazilian legislation on the pollination process of these species. The study was divided into two parts. The first one verified if these three species have the same spatial pattern in different regions of the Amazon and discussed the rarity issue in the legislation. The density and the nearest neighbor distance matrix were calculated for all individuals before cutting for the three species in each study area and the distances were plotted on a quantile-quantile plot. The results showed that Manilkara huberi can be found in high or low density and aggregated or not depending on the region of occurrence. On the other hand, other than Handroanthus serratifolius populations present similar densities and distribution patterns despite region of occurrence. Hymenaea courbaril permeates between these two situations. The distribution of this species among nearby areas showed similarity. The second part of this work analyzed the consequences of changes in Brazilian forest management legislation on the distance between the remaining trees of the three species and verified whether this distance was feasible for the pollination process. The cutting was simulated based on two legislative scenarios, in which only the minimum cut diameter (MCD) was changed. The results showed that there was a decrease in the distance between trees due to the increase of the density of remaining individuals. The distance decrease favored the pollination process, since pollinators need to travel shorter distances searching for food. Brazilian forest legislation has taken a more conservative path, but there is still much to be developed, since each species has its own reproductive ecology, even so are managed the same way.
|
12 |
Alterações na legislação brasileira de manejo florestal e seus efeitos na distribuição espacial e polinização de espécies madeireiras amazônicas / Changes in Brazilian forest management legislation and their effects on spatial distribution and pollination of Amazonian timber speciesVanessa Erler Sontag 29 August 2017 (has links)
Conhecer o comportamento espacial e demográfico e a dinâmica genética das espécies madeireiras e manter uma distância entre as árvores que permita sua reprodução é essencial para o desenvolvimento de procedimentos de manejo que visem a conservação das espécies e garantia de estoques futuros de madeira. No entanto, quando uma área é explorada para fins madeireiros, as árvores remanescentes podem não ficar a uma distância viável a polinização. A legislação brasileira atual limita a exploração de espécies com baixa densidade de ocorrência e define alguns critérios para a escolha das árvores remanescentes, porém, eles levam em consideração apenas o número de indivíduos e não os fatores ecológicos e genéticos das espécies além de serem os mesmos aplicados a toda Amazônia. O objetivo deste trabalho foi analisar o comportamento espacial de três espécies madeireiras, a Manilkara huberi, a Hymenaea courbaril e o Handroanthus serratifolius, em quatro áreas de estudo na Amazônia brasileira a partir de inventários de empresas florestais e verificar a implicação das últimas mudanças ocorridas na legislação no processo de polinização dessas espécies. O trabalho foi dividido em duas partes. A primeira verificou se essas três espécies possuem o mesmo padrão espacial em diferentes regiões da Amazônia e discutiu a questão da raridade presente na legislação. Foi calculada a densidade e a matriz do vizinho mais próximo para todos os indivíduos antes do corte das três espécies em cada área de estudo e as distâncias plotadas em um gráfico quantil-quantil. Os resultados mostraram que a Manilkara huberi é uma espécie que pode ser encontrada em alta ou baixa densidade e em agregados ou não dependendo da região de ocorrência, diferente do Handroanthus serratifolius que apresenta uma densidade e padrão de distribuição semelhante independente da região de ocorrência. A Hymenaea courbaril permeia entre essas duas situações. Notou-se uma semelhança na distribuição das espécies entre as áreas próximas. A segunda parte analisou as consequências da alteração da legislação na distância entre as árvores remanescentes das três espécies e verificou se essa distância era viável para o processo de polinização. Foi simulado o corte a partir de cenários legislativos, em que apenas o diâmetro mínimo de corte (DMC) foi alterado. Os resultados mostraram que houve uma diminuição na distância entre árvores. A diminuição favoreceu o processo de polinização visto que os polinizadores precisam percorrer menores distâncias na busca por alimento. A legislação tem tomado um caminho mais conservativo, porém há muito o que ser desenvolvido, visto que cada espécie possui sua própria ecologia reprodutiva mas são manejadas da mesma forma. / The information about the spatial and demographic behavior and the genetic dynamic of timber species and maintaining a distance between trees that allows their reproduction is essential for the development of management procedures to conserve species and guarantee future wood stocks. However, when an area is harvested for timber purposes, the remaining trees may not stay at a feasible distance for pollination. Current Brazilian legislation limits the exploitation of low-density species and defines some criteria for choosing the remaining trees. However, they take into account only the number of individuals and not the ecology and genetic aspects of the species. Besides, the same criteria are applied to the entire Amazon. The aim of this study was to analyze the spatial behavior of three timber species, Manilkara huberi, Hymenaea courbaril and Handroanthus serratifolius, in four study areas in the Brazilian Amazon Forest. Companies inventories were used to verify the implication of the latest changes in the Brazilian legislation on the pollination process of these species. The study was divided into two parts. The first one verified if these three species have the same spatial pattern in different regions of the Amazon and discussed the rarity issue in the legislation. The density and the nearest neighbor distance matrix were calculated for all individuals before cutting for the three species in each study area and the distances were plotted on a quantile-quantile plot. The results showed that Manilkara huberi can be found in high or low density and aggregated or not depending on the region of occurrence. On the other hand, other than Handroanthus serratifolius populations present similar densities and distribution patterns despite region of occurrence. Hymenaea courbaril permeates between these two situations. The distribution of this species among nearby areas showed similarity. The second part of this work analyzed the consequences of changes in Brazilian forest management legislation on the distance between the remaining trees of the three species and verified whether this distance was feasible for the pollination process. The cutting was simulated based on two legislative scenarios, in which only the minimum cut diameter (MCD) was changed. The results showed that there was a decrease in the distance between trees due to the increase of the density of remaining individuals. The distance decrease favored the pollination process, since pollinators need to travel shorter distances searching for food. Brazilian forest legislation has taken a more conservative path, but there is still much to be developed, since each species has its own reproductive ecology, even so are managed the same way.
|
13 |
Classificação de dados combinando mapas auto-organizáveis com vizinho informativo mais próximoMoreira, Lenadro Juvêncio 14 December 2016 (has links)
Submitted by Rosa Assis (rosa_assis@yahoo.com.br) on 2017-03-21T19:40:25Z
No. of bitstreams: 2
LEANDRO JUVENCIO MOREIRA.pdf: 1183496 bytes, checksum: b7b7de6c9a5112b9705c906c6cbdaaec (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Paola Damato (repositorio@mackenzie.br) on 2017-03-22T15:01:23Z (GMT) No. of bitstreams: 2
LEANDRO JUVENCIO MOREIRA.pdf: 1183496 bytes, checksum: b7b7de6c9a5112b9705c906c6cbdaaec (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-03-22T15:01:23Z (GMT). No. of bitstreams: 2
LEANDRO JUVENCIO MOREIRA.pdf: 1183496 bytes, checksum: b7b7de6c9a5112b9705c906c6cbdaaec (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2016-12-14 / The data classification is a data mining task with relevant utilization in various areas of application, such as medicine, industry, marketing, financial market, teaching and many others. Although this task is an element search for many autors, there are open issues such as, e.g., in situations where there is so much data, noise data and unbalanced classes. In this way, this work will present a data classifier proposal that combines the SOM (Self-Organizing Map) neural network with INN (Informative Nearest Neighbors). The combination of these two algorithms will be called in this work as SOM-INN. Therefore, the SOM-INN process to classify a new object will be done in a first step with the SOM that has a functionality to map a reduced dataset through an approach that utilizes the prototype generation concept, also called the winning neuron and, in a second step, with the INN algorithm that is used to classify the new object through an approach that finds in the reduced dataset by SOM the most informative object. Were made experiments using 21 public datasets comparing classic data classification algorithms of the literature, from the indicators of reduction training set, accuracy, kappa and time consumed in the classification process. The results obtained show that the proposed SOM-INN algorithm, when compared with the others classifiers of the literature, presents better accuracy in databases where the border region is not well defined. The main differential of the SOM-INN is in the classification time, which is extremely important for real applications.
Keywords: data classification; prototype generation; K nearest neighbors; self-organizing / A classificação de dados é uma tarefa da mineração de dados com utilização relevante em diversas áreas de aplicação, tais como, medicina, indústria, marketing, mercado financeiro, ensino e muitas outras. Embora essa tarefa seja elemento de pesquisa de muitos autores, ainda há problemas em aberto como, por exemplo, em situações onde há abundância de dados, dados ruidosos e desbalanceamento de classes. Nesse sentido, este trabalho apresenta uma proposta de classificador de dados em um processo de duas etapas que combina a rede neural SOM (Self-Organizing Maps) com o classificador vizinhos informativos mais próximos ou INN (Informative Nearest Neighbors). A combinação desses dois algoritmos será aqui chamada como SOM-INN. Portanto, o processo de uso do SOM-INN na classificação de um novo objeto será feito em uma primeira etapa com o SOM que tem a funcionalidade de mapear um conjunto reduzido dos dados de treinamento por meio de uma abordagem que utiliza o conceito de geração de protótipo, também denominado de neurônio vencedor e, em uma segunda etapa, com o algoritmo INN que é usado para classificar o novo objeto por meio de uma abordagem que encontra no conjunto de treinamento reduzido pelo SOM os objetos mais informativos. Foram realizados experimentos usando 21 conjuntos de dados públicos, comparando com os algoritmos clássicos da literatura de classificação de dados, a partir dos indicadores de redução do conjunto de treinamento, acurácia, kappa e tempo consumido no processo de classificação. Os resultados obtidos mostram que o algoritmo proposto SOM-INN, quando comparado com outros classificadores da literatura, apresenta acurácia melhor em bases de dados em que a região de fronteira não é bem definida. O principal diferencial do SOM-INN está no tempo de classificação, o que é de suma importância para aplicações reais.
|
14 |
Desenvolvimento da análise de vizinhança em mapas conceituais a partir do uso de um conceito obrigatório / Development of neighborhood analysis in concept maps considering the use of one compulsory conceptCicuto, Camila Aparecida Tolentino 06 October 2011 (has links)
Os mapas conceituais (MCs) são úteis para representar o conhecimento dos alunos e promover a aprendizagem significativa. A análise detalhada de mapas conceituais pode revelar informações latentes que não são percebidas a partir da mera leitura do seu conjunto de proposições. O presente trabalho tem como objetivo propor a análise de vizinhança (AViz) como uma forma inovadora de analisar os MCs obtidos em sala de aula. A seleção de um conceito obrigatório (CO) permite verificar como os alunos o relaciona com outros conceitos, que são denominados conceitos vizinhos (CVs). MCs (n=69) sobre as mudanças climáticas formam o primeiro conjunto de dados empíricos que ratifica o potencial da AViz. O CO selecionado foi dispersão, a fim de analisar se os alunos conseguem relacioná-lo com o caráter global desse problema ambiental. Os padrões identificados a partir da AViz sugerem que, apesar de serem submetidos a uma mesma sequência didática, nem todos os alunos conseguiram utilizar o CO de forma adequada. Isso pode ser explicado a partir da Teoria da Aprendizagem Significativa de David Ausubel, que destaca o papel fundamental dos conhecimentos prévios no processo de assimilação de novas informações. / Concept maps (CMs) are useful to represent students\' knowledge and to promote meaningful learning. The deep analysis of concept maps may reveal latent information that is not perceived from the simple reading of its propositional network. This work proposes the Neighborhood Analysis (NeAn) as an innovative way to analyze the CMs obtained in classrooms. The selection of a compulsory concept (CC) allows teachers to evaluate how the students relate it to other concepts, named neighbors (NCs). CMs (n=69) on climate change are the first set of empirical data that confirms the potential of NeAn. Dispersion was selected as CC in order to check whether students can relate it with the global perspective of this environmental problem. The patterns found from the NeAn suggest that, despite being exposed to the same didactic activities, some students could not use the CC properly. This may be explained from David Ausubel\'s learning theory, which stresses the critical role of prior knowledge in the assimilation process of new information.
|
15 |
Soluções aproximadas para algoritmos escaláveis de mineração de dados em domínios de dados complexos usando GPGPU / On approximate solutions to scalable data mining algorithms for complex data problems using GPGPUMamani, Alexander Victor Ocsa 22 September 2011 (has links)
A crescente disponibilidade de dados em diferentes domínios tem motivado o desenvolvimento de técnicas para descoberta de conhecimento em grandes volumes de dados complexos. Trabalhos recentes mostram que a busca em dados complexos é um campo de pesquisa importante, já que muitas tarefas de mineração de dados, como classificação, detecção de agrupamentos e descoberta de motifs, dependem de algoritmos de busca ao vizinho mais próximo. Para resolver o problema da busca dos vizinhos mais próximos em domínios complexos muitas abordagens determinísticas têm sido propostas com o objetivo de reduzir os efeitos da maldição da alta dimensionalidade. Por outro lado, algoritmos probabilísticos têm sido pouco explorados. Técnicas recentes relaxam a precisão dos resultados a fim de reduzir o custo computacional da busca. Além disso, em problemas de grande escala, uma solução aproximada com uma análise teórica sólida mostra-se mais adequada que uma solução exata com um modelo teórico fraco. Por outro lado, apesar de muitas soluções exatas e aproximadas de busca e mineração terem sido propostas, o modelo de programação em CPU impõe restrições de desempenho para esses tipos de solução. Uma abordagem para melhorar o tempo de execução de técnicas de recuperação e mineração de dados em várias ordens de magnitude é empregar arquiteturas emergentes de programação paralela, como a arquitetura CUDA. Neste contexto, este trabalho apresenta uma proposta para buscas kNN de alto desempenho baseada numa técnica de hashing e implementações paralelas em CUDA. A técnica proposta é baseada no esquema LSH, ou seja, usa-se projeções em subespac¸os. O LSH é uma solução aproximada e tem a vantagem de permitir consultas de custo sublinear para dados em altas dimensões. Usando implementações massivamente paralelas melhora-se tarefas de mineração de dados. Especificamente, foram desenvolvidos soluções de alto desempenho para algoritmos de descoberta de motifs baseados em implementações paralelas de consultas kNN. As implementações massivamente paralelas em CUDA permitem executar estudos experimentais sobre grandes conjuntos de dados reais e sintéticos. A avaliação de desempenho realizada neste trabalho usando GeForce GTX470 GPU resultou em um aumento de desempenho de até 7 vezes, em média sobre o estado da arte em buscas por similaridade e descoberta de motifs / The increasing availability of data in diverse domains has created a necessity to develop techniques and methods to discover knowledge from huge volumes of complex data, motivating many research works in databases, data mining and information retrieval communities. Recent studies have suggested that searching in complex data is an interesting research field because many data mining tasks such as classification, clustering and motif discovery depend on nearest neighbor search algorithms. Thus, many deterministic approaches have been proposed to solve the nearest neighbor search problem in complex domains, aiming to reduce the effects of the well-known curse of dimensionality. On the other hand, probabilistic algorithms have been slightly explored. Recently, new techniques aim to reduce the computational cost relaxing the quality of the query results. Moreover, in large-scale problems, an approximate solution with a solid theoretical analysis seems to be more appropriate than an exact solution with a weak theoretical model. On the other hand, even though several exact and approximate solutions have been proposed, single CPU architectures impose limits on performance to deliver these kinds of solution. An approach to improve the runtime of data mining and information retrieval techniques by an order-of-magnitude is to employ emerging many-core architectures such as CUDA-enabled GPUs. In this work we present a massively parallel kNN query algorithm based on hashing and CUDA implementation. Our method, based on the LSH scheme, is an approximate method which queries high-dimensional datasets with sub-linear computational time. By using the massively parallel implementation we improve data mining tasks, specifically we create solutions for (soft) realtime time series motif discovery. Experimental studies on large real and synthetic datasets were carried out thanks to the highly CUDA parallel implementation. Our performance evaluation on GeForce GTX 470 GPU resulted in average runtime speedups of up to 7x on the state-of-art of similarity search and motif discovery solutions
|
16 |
Desenvolvimento da análise de vizinhança em mapas conceituais a partir do uso de um conceito obrigatório / Development of neighborhood analysis in concept maps considering the use of one compulsory conceptCamila Aparecida Tolentino Cicuto 06 October 2011 (has links)
Os mapas conceituais (MCs) são úteis para representar o conhecimento dos alunos e promover a aprendizagem significativa. A análise detalhada de mapas conceituais pode revelar informações latentes que não são percebidas a partir da mera leitura do seu conjunto de proposições. O presente trabalho tem como objetivo propor a análise de vizinhança (AViz) como uma forma inovadora de analisar os MCs obtidos em sala de aula. A seleção de um conceito obrigatório (CO) permite verificar como os alunos o relaciona com outros conceitos, que são denominados conceitos vizinhos (CVs). MCs (n=69) sobre as mudanças climáticas formam o primeiro conjunto de dados empíricos que ratifica o potencial da AViz. O CO selecionado foi dispersão, a fim de analisar se os alunos conseguem relacioná-lo com o caráter global desse problema ambiental. Os padrões identificados a partir da AViz sugerem que, apesar de serem submetidos a uma mesma sequência didática, nem todos os alunos conseguiram utilizar o CO de forma adequada. Isso pode ser explicado a partir da Teoria da Aprendizagem Significativa de David Ausubel, que destaca o papel fundamental dos conhecimentos prévios no processo de assimilação de novas informações. / Concept maps (CMs) are useful to represent students\' knowledge and to promote meaningful learning. The deep analysis of concept maps may reveal latent information that is not perceived from the simple reading of its propositional network. This work proposes the Neighborhood Analysis (NeAn) as an innovative way to analyze the CMs obtained in classrooms. The selection of a compulsory concept (CC) allows teachers to evaluate how the students relate it to other concepts, named neighbors (NCs). CMs (n=69) on climate change are the first set of empirical data that confirms the potential of NeAn. Dispersion was selected as CC in order to check whether students can relate it with the global perspective of this environmental problem. The patterns found from the NeAn suggest that, despite being exposed to the same didactic activities, some students could not use the CC properly. This may be explained from David Ausubel\'s learning theory, which stresses the critical role of prior knowledge in the assimilation process of new information.
|
17 |
Soluções aproximadas para algoritmos escaláveis de mineração de dados em domínios de dados complexos usando GPGPU / On approximate solutions to scalable data mining algorithms for complex data problems using GPGPUAlexander Victor Ocsa Mamani 22 September 2011 (has links)
A crescente disponibilidade de dados em diferentes domínios tem motivado o desenvolvimento de técnicas para descoberta de conhecimento em grandes volumes de dados complexos. Trabalhos recentes mostram que a busca em dados complexos é um campo de pesquisa importante, já que muitas tarefas de mineração de dados, como classificação, detecção de agrupamentos e descoberta de motifs, dependem de algoritmos de busca ao vizinho mais próximo. Para resolver o problema da busca dos vizinhos mais próximos em domínios complexos muitas abordagens determinísticas têm sido propostas com o objetivo de reduzir os efeitos da maldição da alta dimensionalidade. Por outro lado, algoritmos probabilísticos têm sido pouco explorados. Técnicas recentes relaxam a precisão dos resultados a fim de reduzir o custo computacional da busca. Além disso, em problemas de grande escala, uma solução aproximada com uma análise teórica sólida mostra-se mais adequada que uma solução exata com um modelo teórico fraco. Por outro lado, apesar de muitas soluções exatas e aproximadas de busca e mineração terem sido propostas, o modelo de programação em CPU impõe restrições de desempenho para esses tipos de solução. Uma abordagem para melhorar o tempo de execução de técnicas de recuperação e mineração de dados em várias ordens de magnitude é empregar arquiteturas emergentes de programação paralela, como a arquitetura CUDA. Neste contexto, este trabalho apresenta uma proposta para buscas kNN de alto desempenho baseada numa técnica de hashing e implementações paralelas em CUDA. A técnica proposta é baseada no esquema LSH, ou seja, usa-se projeções em subespac¸os. O LSH é uma solução aproximada e tem a vantagem de permitir consultas de custo sublinear para dados em altas dimensões. Usando implementações massivamente paralelas melhora-se tarefas de mineração de dados. Especificamente, foram desenvolvidos soluções de alto desempenho para algoritmos de descoberta de motifs baseados em implementações paralelas de consultas kNN. As implementações massivamente paralelas em CUDA permitem executar estudos experimentais sobre grandes conjuntos de dados reais e sintéticos. A avaliação de desempenho realizada neste trabalho usando GeForce GTX470 GPU resultou em um aumento de desempenho de até 7 vezes, em média sobre o estado da arte em buscas por similaridade e descoberta de motifs / The increasing availability of data in diverse domains has created a necessity to develop techniques and methods to discover knowledge from huge volumes of complex data, motivating many research works in databases, data mining and information retrieval communities. Recent studies have suggested that searching in complex data is an interesting research field because many data mining tasks such as classification, clustering and motif discovery depend on nearest neighbor search algorithms. Thus, many deterministic approaches have been proposed to solve the nearest neighbor search problem in complex domains, aiming to reduce the effects of the well-known curse of dimensionality. On the other hand, probabilistic algorithms have been slightly explored. Recently, new techniques aim to reduce the computational cost relaxing the quality of the query results. Moreover, in large-scale problems, an approximate solution with a solid theoretical analysis seems to be more appropriate than an exact solution with a weak theoretical model. On the other hand, even though several exact and approximate solutions have been proposed, single CPU architectures impose limits on performance to deliver these kinds of solution. An approach to improve the runtime of data mining and information retrieval techniques by an order-of-magnitude is to employ emerging many-core architectures such as CUDA-enabled GPUs. In this work we present a massively parallel kNN query algorithm based on hashing and CUDA implementation. Our method, based on the LSH scheme, is an approximate method which queries high-dimensional datasets with sub-linear computational time. By using the massively parallel implementation we improve data mining tasks, specifically we create solutions for (soft) realtime time series motif discovery. Experimental studies on large real and synthetic datasets were carried out thanks to the highly CUDA parallel implementation. Our performance evaluation on GeForce GTX 470 GPU resulted in average runtime speedups of up to 7x on the state-of-art of similarity search and motif discovery solutions
|
18 |
[en] AUTOMATED SYNTHESIS OF OPTIMAL DECISION TREES FOR SMALL COMBINATORIAL OPTIMIZATION PROBLEMS / [pt] SÍNTESE AUTOMATIZADA DE ÁRVORES DE DECISÃO ÓTIMAS PARA PEQUENOS PROBLEMAS DE OTIMIZAÇÃO COMBINATÓRIACLEBER OLIVEIRA DAMASCENO 24 August 2021 (has links)
[pt] A análise de complexidade clássica para problemas NP-difíceis é geralmente
orientada para cenários de pior caso, considerando apenas o comportamento
assintótico. No entanto, existem algoritmos práticos com execução em um tempo razoável para muitos problemas clássicos. Além disso, há evidências que apontam para algoritmos polinomiais no modelo de árvore de decisão linear para resolver esses problemas, embora não muito explorados. Neste trabalho, exploramos esses resultados teóricos anteriores. Mostramos que a solução ótima para problemas combinatórios 0-1 pode ser encontrada reduzindo esses problemas para uma Busca por Vizinho Mais Próximo sobre o conjunto de vértices de Voronoi correspondentes. Utilizamos os hiperplanos que delimitam essas regiões para gerar sistematicamente uma árvore de decisão que repetidamente divide o espaço até que possa separar todas as soluções, garantindo uma resposta ótima. Fazemos experimentos para testar os limites de tamanho para os quais podemos construir essas árvores para os casos do 0-1 knapsack, weighted minimum cut e symmetric traveling salesman. Conseguimos encontrar as árvores desses problemas com tamanhos até 10, 5 e 6, respectivamente. Obtemos também as relações de adjacência completas para os esqueletos dos politopos do knapsack
e do traveling salesman até os tamanhos 10 e 7. Nossa abordagem supera
consistentemente o método de enumeração e os métodos baseline para o weighted
minimum cut e symmetric traveling salesman, fornecendo soluções ótimas em
microssegundos. / [en] Classical complexity analysis for NP-hard problems is usually oriented to
worst-case scenarios, considering only the asymptotic behavior. However, there
are practical algorithms running in a reasonable time for many classic problems. Furthermore, there is evidence pointing towards polynomial algorithms in
the linear decision tree model to solve these problems, although not explored
much. In this work, we explore previous theoretical results. We show that the
optimal solution for 0-1 combinatorial problems can be found by reducing these
problems into a Nearest Neighbor Search over the set of corresponding Voronoi
vertices. We use the hyperplanes delimiting these regions to systematically generate a decision tree that repeatedly splits the space until it can separate all solutions, guaranteeing an optimal answer. We run experiments to test the size limits for which we can build these trees for the cases of the 0-1 knapsack, weighted minimum cut, and symmetric traveling salesman. We manage to find the trees of these problems with sizes up to 10, 5, and 6, respectively. We also obtain the complete adjacency relations for the skeletons of the knapsack and traveling salesman polytopes up to size 10 and 7. Our approach consistently outperforms the enumeration method and the baseline methods for the weighted minimum cut and symmetric traveling salesman, providing optimal solutions within microseconds.
|
Page generated in 0.0324 seconds