Global ETD Search

171	Ferramentas para acompanhamento do perfil do aprendiz utilizando mineração de dados Domingues, Andrei Wellington Leão January 2013 (has links) Orientador: Itana Stiubiener / Dissertação (mestrado) - Universidade Federal do ABC. Programa de Pós-Graduação em Engenharia da Informação, 2013 ESTILO COGNITIVO MINERAÇÃO DE DADOS
172	"Generalização de regras de associação" / Generalization of association rules Marcos Aurélio Domingues 27 April 2004 (has links) Mineração de Dados é um processo de natureza iterativa e interativa responsável por identificar padrões em grandes conjuntos de dados, objetivando extrair conhecimento válido, útil e inovador a partir desses. Em Mineração de Dados, Regras de Associação é uma técnica que consiste na identificação de padrões intrínsecos ao conjunto de dados. Essa técnica tem despertado grande interesse nos pesquisadores de Mineração de Dados e nas organizações, entretanto, a mesma possui o inconveniente de gerar grande volume de conhecimento no formato de regras, dificultando a análise e interpretação dos resultados pelo usuário. Nesse contexto, este trabalho tem como objetivo principal generalizar e eliminar Regras de Associação não interessantes e/ou redundantes, facilitando, dessa maneira, a análise das regras obtidas com relação à compreensibilidade e tamanho do conjunto de regras. A generalização das Regras de Associação é realizada com o uso de taxonomias. Entre os principais resultados deste trabalho destacam-se a proposta e a implementação do algoritmo GART e do módulo computacional RulEE-GAR. O algoritmo GART (Generalization of Association Rules using Taxonomies - Generalização de Regras de Associação usando Taxonomias) utiliza taxonomias para generalizar Regras de Associação. Já o módulo RulEE-GAR, além de facilitar o uso do algoritmo GART durante a identificação de taxonomias e generalização de regras, provê funcionalidades para analisar as Regras de Associação generalizadas. Os experimentos realizados, neste trabalho, mostraram que o uso de taxonomias na generalização de Regras de Associação pode reduzir o volume de um conjunto de regras. / Data Mining refers to the process of finding patterns in large data sets. The Association Rules in Data Mining try to identify intrinsic behaviors of the data set. This has motivated researchers of Data Mining and organizations. However, the Association Rules have the inconvenient of generating a great amount of knowledge in the form of rules. This makes the analysis and interpretation of the results difficult for the user. Taking this into account, the main objective of this research is the generalization and elimination of non-interesting and/or redundant Association Rules. This facilite the analysis of the rules with respect to the compreensibility and the size of the rule set. The generalization is realized using taxonomies. The main results of this research are the proposal and the implementation of the algorithm GART and of the computational module RulEE-GAR. The algorithm GART (Generalization of Association Rules using Taxonomies) uses taxonomies to generalize Association Rules. The module RulEE-GAR facilitates the use of the algorithm GART in the identification of taxonomies and generalization of rules and provide functionalities to the analysis of the generalized Association Rules. The results of experiments showed that the employment of taxonomies in the generalization of Association Rules can reduce the size of a rule set. Mineração de Dados Pós Processamento Regras de Associação Taxonomias Association Rules Data Mining Post Processing Taxonomies
173	"Desenvolvimento de um Framework para Análise Visual de Informações Suportando Data Mining" / "Development of a Framework for Visual Analysis of Information with Data Mining suport" Jose Fernando Rodrigues Junior 22 July 2003 (has links) No presente documento são reunidas as colaborações de inúmeros trabalhos das áreas de Bancos de Dados, Descoberta de Conhecimento em Bases de Dados, Mineração de Dados, e Visualização de Informações Auxiliada por Computador que, juntos, estruturam o tema de pesquisa e trabalho da dissertação de Mestrado: a Visualização de Informações. A teoria relevante é revista e relacionada para dar suporte às atividades conclusivas teóricas e práticas relatadas no trabalho. O referido trabalho, embasado pela substância teórica pesquisada, faz diversas contribuições à ciência em voga, a Visualização de Informações, apresentando-as através de propostas formalizadas no decorrer deste texto e através de resultados práticos na forma de softwares habilitados à exploração visual de informações. As idéias apresentadas se baseiam na exibição visual de análises numéricas estatísticas básicas, frequenciais (Frequency Plot), e de relevância (Relevance Plot). São relatadas também as contribuições à ferramenta FastMapDB do Grupo de Bases de Dados e Imagens do ICMC-USP em conjunto com os resultados de sua utilização. Ainda, é apresentado o Arcabouço, previsto no projeto original, para construção de ferramentas visuais de análise, sua arquitetura, características e utilização. Por fim, é descrito o Pipeline de visualização decorrente da junção entre o Arcabouço de visualização e a ferramenta FastMapDB. O trabalho se encerra com uma breve análise da ciência de Visualização de Informações com base na literatura estudada, sendo traçado um cenário do estado da arte desta disciplina com sugestões de futuros trabalhos. / In the present document are joined the collaborations of many works from the fields of Databases, Knowledge Discovery in Databases, Data Mining, and Computer-based Information Visualization, collaborations that, together, define the structure of the research theme and the work of the Masters Dissertation presented herein. This research topic is the Information Visualization discipline, and its relevant theory is reviewed and related to support the concluding activities, both theoretical and practical, reported in this work. The referred work, anchored by the theoretical substance that was studied, makes several contributions to the science in investigation, the Information Visualization, presenting them through formalized proposals described across this text, and through practical results in the form of software enabled to the visual exploration of information. The presented ideas are based on the visual exhibition of numeric analysis, named basic statistics, frequency analysis (Frequency Plot), and according to a relevance analysis (Relevance Plot). There are also reported the contributions to the FastMapDB tool, a visual exploration tool built by the Grupo de Bases de Dados e Imagens do ICMC-USP, the performed enhancements are listed as achieved results in the text. Also, it is presented the Framework, as previewed in this work's original proposal, projected to allow the construction of visual analysis tools; besides its description are listed its architecture, characteristics and utilization. At last, it is described the visualization Pipeline that emerges from the joining of the visualization Framework and the FastMapDB tool. The work ends with a brief analysis of the Information Visualization science based on the studied literature, it is delineated a scenario of the state of the art of this discipline along with suggestions for future work. Mineração de Dados Visualização de Informações Data Mining Information Visualization Knowledge Discovery in Databases
174	Detecção de ilhamento de geradores síncronos distribuídos por correlações da mineração complexa de dados / Islanding detection of distributed synchronous generators by complex data-mining correlations Eduardo Augusto Pereira Gomes 31 August 2016 (has links) Um dos principais problemas que podem ocorrer em sistemas de distribuição ou de subtransmissão de energia elétrica com geração distribuída (GD) é o ilhamento. O ilhamento ocorre quando um ou mais geradores distribuídos alimentam uma porção do sistema que se encontra eletricamente isolada do restante do sistema elétrico. Logo, geradores distribuídos têm de ser equipados com esquema de proteção anti-ilhamento, pois a operação ilhada pode colocar em risco a segurança das pessoas e equipamentos e pode deteriorar a qualidade da energia elétrica suprida aos consumidores locais. Este trabalho está inserido no contexto de proteção de sistemas elétricos de distribuição com GD e propõe uma nova técnica passiva-inteligente de proteção anti-ilhamento para geradores síncronos distribuídos. O método proposto utiliza a mineração de dados do Data Mining of Code Repositories (DAMICORE), o qual possui grandes potencialidades para descobrir correlações em dados complexos. Para realizar essa tarefa, três algoritmos são executados em sequência. São eles: o Normalized Compression Distance (NCD) para calcular a matriz de distância do conjunto de dados; o Neighbor-Joining (NJ) para construir as árvores filogenéticas; e por fim o Fast Newman (FN) para buscar grupos na árvore filogenética nos quais os dados apresentam alto grau de independência. O método de detecção de ilhamento nesta dissertação utiliza 10 características importantes dos sinais de tensão e corrente trifásicas no ponto de acoplamento comum (PAC). Essas 10 características são utilizadas como entrada ao DAMICORE para formular um algoritmo baseado em mineração de dados capaz de detectar ilhamento e de diferenciá-los de outros tipos de distúrbios. Os resultados mostram que o método identifica o ilhamento corretamente, detectando-o rapidamente, especialmente nos casos em que a detecção do ilhamento por relés baseados em medidas de frequência falha ou é lenta. / One of the main issues that can occur into distribution power systems with distributed generation is islanding. Islanding occurs when one or more distributed generators feed a portion of the distribution system that becomes electrically isolated from the rest of the power system. Thus, distributed generators have to be equipped with anti-islanding protection schemes, because the islanded operation may put at risk the safety of people and the equipment. It can also deteriorate the power quality supplied to local consumers. This work is in the context of the protection schemes for distribution power systems with distributed generation and it proposes a new intelligent passive anti-islanding protection scheme for distributed synchronous generators. The scheme is based on the Data Mining of Code Repositories (DAMICORE), which finds the similarity within complex data sets. This task is performed by computing the following algorithms, in sequence: the Normalized Compression Distance (NCD) to calculate a distance matrix among the data sets; the Neighbor-Joining (NJ) to build the phylogenetic trees; and the Fast Newman (FN) to find clusters with high degree of independence by using the phylogenetic trees. The proposed method comprises the extraction of 10 important features of the three-phase voltages and currents measured at the point of common coupling of the distributed generator. These 10 features are then used as input to the DAMICORE in order to formulate a data mining-based algorithm capable of detecting islanding and of distinguishing it from other disturbances. The results show that the method identifies the islanding correctly, detecting it quickly, especially where the detection of islanding by frequency-based relays are slow. DAMICORE Geração distribuída Mineração de dados Proteção anti-ilhamento Anti-islanding protection DAMICORE Data-mining Distributed generation
175	Análise do padrão sazonal de imagens de índice de vegetação do sensor modis para culturas agrícolas / Seasonal trend analysis ofthe vegetation index of agricultural crops with data mining techniques Becker, Willyan Ronaldo 10 February 2016 (has links) Submitted by Edineia Teixeira (edineia.teixeira@unioeste.br) on 2017-08-31T19:33:36Z No. of bitstreams: 2 Willyan_Becker2017.pdf: 12083877 bytes, checksum: 7a9e90225376028c123e5c6e1c568603 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-08-31T19:33:36Z (GMT). No. of bitstreams: 2 Willyan_Becker2017.pdf: 12083877 bytes, checksum: 7a9e90225376028c123e5c6e1c568603 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2016-02-10 / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / Orbital remote sensing techniques have proved to be a valuable tool, since they enable the agricultural monitoring of the vigor and the type of vegetation coverage in a regional scale, bringing results with greater anticipation and precision, and lower operational cost when compared to traditional techniques. Automatic identification of cultivated areas is one of the most important steps in the crop forecasting process. The improvement in the estimate of area cultivated with each crop directly influences the result of the forecast of each crop year, since the agricultural production is a function of the cultivated area. The general objective of this research was to create an automatic methodology for the separation of agricultural crops from soybean and maize by means of data mining (Article 1) and a methodology for forecasting the harvest date from the date of maximum vegetative development (Article 2). The methods used corresponded to the application of the seasonal trends analysis and data mining for soybean and corn agricultural areas in the state of Paraná, with images of the EVI vegetation index of MODIS sensors, TERRA and AQUA satellites. The results obtained in Article 1 show that, through the decision tree, one of the techniques of data mining, it was verified that, among eleven variables that characterize the spectral-temporal pattern of the EVI of each culture, five were enough to perform the separation of soybean and maize crops, in the year 2014/2015, with an accuracy of 96.3% and a kappa index of 0.92, being the maximum value of EVI, the date of sowing (DS), the Date of maximum vegetative development (DMDV), Cycle, and Major Integral. In Article 2 the DS, DMDV and Harvest Date (DC) of the EVI temporal profile were estimated for each mapped soybean and maize pixel in the crop years 2011/2012 to 2013/2014. Then, for each crop and crop year, the variables Delta1 (DMDV minus DS) and Delta2 (DC minus DMDV) were created. The results of the differences (DCDifference) between DC estimated by EVI (DCEVI) and predicted by mean time (DCDelta2) show that, for soybeans, it is possible to use only the mean value of the interval between DMDV and DC in the three harvested years studied, with 55 days for soybeans. For corn, the mean interval between DMDV and DC was 60 days, but it is verified that there is a large difference between the results obtained with DCEVI and DCDelta2. For corn DCDelta2 there were large variations among the mesoregions. Differences in DC (DCDifference), when using the means by mesoregions, presented better results than for Paraná as a whole. / Técnicas de sensoriamento remoto orbital têm se mostrado uma ferramenta valiosa, pois possibilitam o monitoramento agrícola do vigor e do tipo de cobertura vegetal em escala regional, trazendo resultados com maior antecedência e precisão e menor custo operacional em relação às técnicas tradicionais. A identificação automática de áreas cultivadas constitui uma das etapas mais importantes no processo de previsão de safras. A melhoria na estimativa de área cultivada com cada cultura influencia diretamente o resultado da previsão de cada ano-safra, uma vez que a produção agrícola é função da área cultivada. O objetivo geral desta pesquisa foi criar uma metodologia automática para separação das culturas agrícolas de soja e milho, por meio da mineração de dados (Artigo 1) e uma metodologia de previsão da data de colheita das culturas a partir da data de máximo desenvolvimento vegetativo (Artigo 2). Os métodos utilizados corresponderam à aplicação da análise de padrões sazonais e mineração de dados para áreas agrícolas de soja e milho no estado do Paraná, com imagens do índice de vegetação EVI dos sensores MODIS, satélites TERRA e AQUA. Os resultados obtidos no Artigo 1 mostram que, por meio da árvore de decisão, uma das técnicas de mineração de dados, constatou-se que, dentre onze variáveis que caracterizam o padrão espectro-temporal do EVI de cada cultura, cinco foram suficientes para realizar a separação das culturas de soja e milho, ano-safra 2014/2015, com uma exatidão de 96,3% e um índice kappa de 0,92, sendo elas o valor máximo de EVI, a data de semeadura (DS), a data de máximo desenvolvimento vegetativo (DMDV), o ciclo e a integral maior. No Artigo 2 foram estimadas as DS, DMDV e Data de Colheita (DC) do perfil temporal EVI para cada pixel mapeado de soja e milho nos anos-safra 2011/2012 a 2013/2014. Posteriormente criaram-se, para cada cultura e ano-safra, as variáveis Delta1 (DMDV menos a DS) e o Delta2 (DC menos a DMDV). Os resultados das diferenças (DCDiferença) entre a DC estimada pelo EVI (DCEVI) e a prevista por média temporal (DCDelta2) apontam que, para a soja, há a possibilidade de utilizar-se apenas do valor médio do intervalo entre a DMDV e a DC nos três anos-safra estudados, sendo 55 dias para a soja. Para a cultura do milho, o intervalo médio entre a DMDV e a DC foi de 60 dias, porém verifica-se que existe grande diferença entre os resultados obtidos com a DCEVI e a DCDelta2. Para a DCDelta2 do milho houve grandes variações entre as mesorregiões. As diferenças nas DC (DCDiferença), quando utilizadas as médias por mesorregiões, apresentam melhores resultados que para o Paraná como um todo. Ciclo fenológico EVI Timesat Mineração de Dados Phenological cycle EVI Timesat Data Mining CIENCIAS AGRARIAS::ENGENHARIA AGRICOLA
176	Análise do comportamento subjacente ao encadeamento de viagens através do uso de minerador de dados / Analysis of behavior underlying chained trips by using data miner Cira Souza Pitombo 21 February 2003 (has links) O objetivo principal deste trabalho é analisar o comportamento de grupos homogêneos de indivíduos com relação às viagens encadeadas, usando um minerador de dados. Vários aspectos das viagens encadeadas foram representados através da extensão do processo de codificação inicialmente proposto por Ichikawa (2002). Foram codificados os aspectos como seqüência de atividades realizadas por cada indivíduo, modo de viagem, período do dia em que cada viagem foi realizada e tempo de viagem. O minerador de dados usado neste trabalho foi Árvore de Decisão e Classificação, uma ferramenta de análise disponível no software S-Plus 2000. A análise baseou-se na pesquisa origem-destino realizada pelo METRÔ-SP na região metropolitana de São Paulo, por meio de entrevistas domiciliares, em 1987. Concluiu-se que variáveis socioeconômicas podem explicar o comportamento relacionado a viagens encadeadas, indicando que minerador de dados pode ter um papel importante na análise do comportamento relacionado às viagens encadeadas. / The main aim of this work is to analyze the behavior of homogeneous groups of individuals regarding the chained trips by using a data miner. Several aspects of chained trips were represented through the extension of the coding process initially proposed by Ichikawa (2002). Aspects such as sequence of activities performed by each individual, travel mode, period of the day in which each trip occurs, and travel time were coded. The data miner used in this work was Decision and Classification Tree, an analysis tool available in S-Plus 2000 software package. The analysis was based on the origin-destination home-interview survey carried out by METRÔ-SP in São Paulo metropolitan area, in 1987. The main finding is that the socioeconomic variables can explain the behavior related to the chained trips, indicating that data miner can play an important role in the analysis of the behavior related to the chained trips. Análise de demanda Mineração de dados Padrões de viagem Viagens encadeadas Data-mining Demand analysis Travel patterns Trip-chaining
177	Análise comparativa do encadeamento de viagens de três áreas urbanas / Comparative analysis of the chained trips of three urban areas Pablo Brilhante de Sousa 22 March 2004 (has links) O objetivo principal deste trabalho é identificar se e como as áreas urbanas interferem nos padrões de viagens encadeadas dos viajantes urbanos. Para atingir os objetivos, as diferenças e similaridades notadas entre os principais grupos socioeconômicos das áreas urbanas em relação aos padrões de viagens encadeadas serão discutidas. O método para comparação dos comportamentos relacionados às viagens encadeadas baseia-se na compatibilização das variáveis das três áreas e posterior aplicação do minerador de dados denominado Árvore de Decisão e Classificação, disponível no pacote estatístico S-Plus 6.1. As viagens encadeadas foram representadas através da codificação inicialmente proposta por Ichikawa (2002) e ampliada por Pitombo (2003). Foram codificados os motivos, modos e período do dia em que cada viagem foi realizada. A análise foi baseada nas pesquisas origem-destino realizadas na região metropolitana de São Paulo pelo Metrô-SP, em 1997, na região metropolitana de Belém pela JICA/Governo do Estado do Pará, em 2000, e na cidade de Bauru pela EMDURB, em 1997. Concluiu-se que, em geral, o comportamento de viajantes urbanos são influenciados pelas políticas urbanas regionais, características socioeconômicas e espaciais de cada região. / The main aim of this work is to identify whether and how the urban areas interfere in the urban trips makers\'trip chaining pattern. For attaining the aims, the differences and similarities observed among the behaviour of trip makers belonging to the main socioeconomic groups living in the three urban areas will be discussed. The method to compare the behavior related to trip chaining is based on the compatibilization of the variables of three areas and subsequent application of the data miner named Decision and Classification Tree, available in the S-Plus 6.1 statistical package. The chained trips were coded by using the process initially proposed by Ichikawa (2002) and amplified later by Pitombo (2003). The trip purpose, travel mode and period of the day in which each trip occurs were coded. The analysis was based on the origin-destination home-interview surveys carried out in São Paulo Metropolitan Area by Metrô-SP, in 1997, Belém Metropolitan Area by JICA/Pará State Government, in 2000, and Bauru city by EMDURB, in 1997. The main finding is that urban trip makers\'behaviour are affected by regional urban policy, socioeconomic features and geographical characteristics of each area. Análise de demanda Mineração de dados Padrões de viagens Viagens encadeadas Data-mining Demand analysis Travel patterns Trip-chaining
178	"O framework de integração do sistema DISCOVER" / The Discover integration framework Prati, Ronaldo Cristiano 04 April 2003 (has links) Talvez uma das maiores capacidades do ser humano seja a sua habilidade de aprender a partir de observações e transmitir o que aprendeu para outros humanos. Durante séculos, a humanidade vem tentado compreender o mundo em que vive e, a partir desse novo conhecimento adquirido, melhorar o mundo em que vive. O desenvolvimento da tecnologia colocou a descoberta de conhecimento em um momento ímpar na história da humanidade. Com os progressos da Ciência da Computação, e, em particular, da Inteligência Artificial - IA - e Aprendizado de Máquina -AM, hoje em dia é possível, a partir de métodos de inferência indutiva e utilizando um conjunto de exemplos, descobrir algum tipo de conhecimento implícito nesses exemplos. Entretanto, por ser uma área de pesquisa relativamente nova, e por envolver um processo tanto iterativo quanto interativo, atualmente existem poucas ferramentas que suportam eficientemente a descoberta de conhecimento a partir dos dados. Essa falta de ferramentas se agrava ainda mais no que se refere ao seu uso por pesquisadores em Aprendizado de Máquina e Aquisição de Conhecimento. Esses fatores, além do fato que algumas pesquisas em nosso Laboratório de Inteligência Computacional - LABIC - têm alguns componentes em comum, motivaram a elaboração do projeto Discover, que consiste em uma estratégia de trabalho em conjunto, envolvendo um conjunto de ferramentas que se integram e interajam, e que supram as necessidades de pesquisa dos integrantes do nosso laboratório. O Discover também pode ser utilizado como um campo de prova para desenvolver novas ferramentas e testar novas idéias. Como o Discover tem como principal finalidade o seu uso e extensão por pesquisadores, uma questão principal é que a arquitetura do projeto seja flexível o suficiente para permitir que novas pesquisas sejam englobadas e, simultaneamente, deve impor determinados padrões que permitam a integração eficiente de seus componentes. Neste trabalho, é proposto um framework de integração de componentes que tem como principal objetivo possibilitar a criação de um sistema computacional a partir das ferramentas desenvolvidas para serem utilizadas no projeto Discover. Esse framework compreende um mecanismo de adaptação de interface que cria uma camada (interface horizontal) sobre essas ferramentas, um poderoso mecanismo de metadados, que é utilizado para descrever tanto os componentes que implementam as funcionalidades do sistema quanto as configurações de experimentos criadas pelos usuário, que serão executadas pelo framework, e um ambiente de execução para essas configurações de experimentos. / One of human greatest capability is the ability to learn from observed instances of the world and to transmit what have been learnt to others. For thousands of years, we have tried to understand the world, and used the acquired knowledge to improve it. Nowadays, due to the progress in digital data acquisition and storage technology as well as significant progress in the field of Artificial Intelligence - AI, particularly Machine Learning - ML, it is possible to use inductive inference in huge databases in order to find, or discover, new knowledge from these data. The discipline concerned with this task has become known as Knowledge Discovery from Databases - KDD. However, this relatively new research area offers few tools that can efficiently be used to acquire knowledge from data. With these in mind, a group of researchers at the Computational Intelligence Laboratory - LABIC - is working on a system, called Discover, in order to help our research activities in KDD and ML. The aim of the system is to integrate ML algorithms mostly used by the community with the data and knowledge processing tools developed as the results of our work. The system can also be used as a workbench for new tools and ideas. As the main concern of the Discover is related to its use and extension by researches, an important question is related to the flexibility of its architecture. Furthermore, the Discover architecture should allow new tools be easily incorporated. Also, it should impose strong patterns to guarantee efficient component integration. In this work, we propose a component integration framework that aims the development of an integrated computational environment using the tools already implemented in the Discover project. The proposed component integration framework has been developed keeping in mind its future integration with new tools. This framework offers an interface adapter mechanism that creates a layer (horizontal interface) over these tools, a powerful metadata mechanism, which is used to describe both components implementing systems' functionalities and experiment configurations created by the user, and an environment that enables these experiment execution. Aprendizado de Máquina Data Mining Descoberta de Conhecimento Discover Discover Knowledge Discovery Machine Learning Mineração de Dados
179	Mineração e visualização de coleções de séries temporais / Mining and visualization of time series collections Alencar, Aretha Barbosa 10 December 2007 (has links) A análise de séries temporais gera muitos desafios para profisionais em um grande número de domínios. Várias soluções de visualização integrada com algoritmos de mineração já foram propostas para tarefas exploratórias em coleções de séries temporais. À medida que o conjunto de dados cresce, estas soluções falham em promover uma boa associação entre séries temporais similares. Neste trabalho, é apresentada uma ferramenta para a análise exploratória e mineração de conjuntos de séries temporais que adota uma representação visual baseada em medidas de dissimilaridade entre séries. Esta representação é criada usando técnicas rápidas de projeção, de forma que as séries temporais possam ser visualizadas em espaços bidimensionais. Vários tipos de atributos visuais e conexões no grafo resultante podem ser utilizados para suportar a exploração dessa representação. Também é possível aplicar algumas tarefas de mineração de dados, como a classificação, para apoiar a busca por padrões. As visualizações resultantes têm se mostrado muito úteis na identificação de grupos de séries com comportamentos similares, que são mapeadas para a mesma vizinhança no espaço bidimensional. Grupos visuais de elementos, assim como outliers, são facilmente identficáveis. A ferramenta é avaliada por meio de sua aplicação a vários conjuntos de séries. Um dos estudos de caso explora dados de vazões de usinas hidrelétricas no Brasil, uma aplicação estratégica para o planejamento energético. / Time series analysis poses many challenges to professionals in a wide range of domains. Several visualization solutions integrated with mining algorithms have been proposed for exploratory tasks on time series collections. As the data sets grow large, though, the visual alternatives do not allow for a good association between similar time series. In this work, we introduce a tool for exploratory visualization and mining of large time series data sets that adopts a visual representation based on distance measures between series. This representation is created employing fast projection techniques, so the time series can be viewed in two-dimensional spaces. Various types of visual attributes and connection on the resulting graph can be applied to support exploration. It also supports data mining tasks, such as classification, to search for patterns. The resulting visualizations have proved very useful for identifying groups of series with similar behavior, which are mapped to the close neighborhoods in twodimensional spaces. Visual clusters of elements, as well as outliers, are easily identifiable. Case studies on several domains are presented to validate the tool. One of them is on a data set of stream ows in hydroelectric power plants in Brazil, a strategic application for energy planning. Data mining Information visualization Mineração de dados Séries temporais Time series Visualização de informação
180	Integrando mineração de séries temporais e fractais para encontrar padrões e eventos extremos em bases de dados climáticas e de sensoriamento remoto / Integrating time series mining and fractals to discover patterns and extreme events in climate and remote sensing databases Romani, Luciana Alvim Santos 13 December 2010 (has links) Esta tese apresenta novos metodos baseados na teoria dos fractais e em tecnicas de mineração de dados para dar suporte ao monitoramento agrícola em escala regional, mais especicamente areas com plantações de cana-de-açucar que tem um papel importante na economia brasileira como uma alternativa viavel para a substituição de combustíveis fósseis. Uma vez que o clima tem um grande impacto na agricultura, os agrometeorologistas utilizam dados climáticos associados a índices agrometeorológicos e mais recentemente dados provenientes de satélites para apoiar a tomada de decisão. Neste sentido, foi proposto um método que utiliza a dimensão fractal para identicar mudanças de tendências nas séries climáticas juntamente com um módulo de análise estatística para definir quais atributos são responsáveis por essas alterações de comportamento. Além disso, foram propostos dois métodos de medidas de similaridade para auxiliar na comparação de diferentes regiões agrícolas representadas por múltiplas variáveis provenientes de dados meteorológicos e imagens de sensoriamento remoto. Diante da importância de se estudar os extremos climáticos que podem se intensicar dado os cenários que preveem mudanças globais no clima, foi proposto o algoritmo CLIPSMiner que identifica padrões relevantes e extremos em séries climáticas. CLIPSMiner também permite a identificação de correlação de múltiplas séries considerando defasagem de tempo e encontra padrões de acordo com parâmetros que podem ser calibrados pelos usuários. A busca por padrões de associação entre séries foi alcançada por meio de duas abordagens distintas. A primeira delas integrou o cálculo da correlação de dimensão fractal com uma técnica para tornar os valores contínuos das séries em intervalos discretos e um algoritmo de regras de associação gerando o método Apriori-FD. Embora tenha identificado padrões interessantes em relação a temperatura, este método não conseguiu lidar de forma apropriada com defasagem temporal. Foi proposto então o algoritmo CLEARMiner que de forma não-supervisionada minera padrões em uma série associando-os a padrões em outras séries considerando a possibilidade de defasagem temporal. Os métodos propostos foram comparados a técnicas similares e avaliados por um grupo composto por meteorologistas, agrometeorologistas e especialistas em sensoriamento remoto. Os experimentos realizados mostraram que a aplicação de técnicas de mineração de dados e fractais contribui para melhorar a análise dos dados agrometeorológicos e de satélite auxiliando no trabalho de pesquisadores, além de se configurar como uma ferramenta importante para apoiar a tomada de decisão no agronegócio / This thesis presents new methods based on fractal theory and data mining techniques to support agricultural monitoring in regional scale, specifically regions with sugar canefields. This commodity greatly contributes to the Brazilian economy since it is a viable alternative to replace fossil fuels. Since climate in uences the national agricultural production, researchers use climate data associated to agrometeorological indexes, and recently they also employed data from satellites to support decision making processes. In this context, we proposed a method that uses the fractal dimension to identify trend changes in climate series jointly with a statistical analysis module to define which attributes are responsible for the behavior alteration in the series. Moreover, we also proposed two methods of similarity measure to allow comparisons among different agricultural regions represented by multiples variables from meteorological data and remote sensing images. Given the importance of studying the extreme weather events, which could increase in intensity, duration and frequency according to different scenarios indicated by climate forecasting models, we proposed the CLIPSMiner algorithm to identify relevant patterns and extremes in climate series. CLIPSMiner also detects correlations among multiple time series considering time lag and finds patterns according to parameters, which can be calibrated by the users. We applied two distinct approaches in order to discover association patterns on time series. The first one is the Apriori-FD method that integrates an algorithm to perform attribute selection through applying the correlation fractal dimension, an algorithm of discretization to convert continuous values of series into discrete intervals, and a well-known association rules algorithm (Apriori). Although Apriori-FD has identified interesting patterns related to temperature, this method failed to appropriately deal with time lag. As a solution, we proposed CLEARMiner that is an unsupervised algorithm in order to mine the association patterns in one time series relating them to patterns in other series considering the possibility of time lag. The proposed methods were compared with similar techniques as well as assessed by a group of meteorologists, and specialists in agrometeorology and remote sensing. The experiments showed that applying data mining techniques and fractal theory can contribute to improve the analyses of agrometeorological and satellite data. These new techniques can aid researchers in their work on decision making and become important tools to support decision making in agribusiness Climate change Data mining Knowledge discovery in databases Mineração de dados Mudanças climáticas

Search results