Global ETD Search

531	Aplicação de técnicas de previsão de demanda em manufatura = estudo de caso em uma indústria de laminados / Application of techniques for forecasting demand in manufacturing : a case study in an industry of rolled laminates Casula, Henrique Cury 20 August 2018 (has links) Orientador: Antonio Batocchio / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Mecânica / Made available in DSpace on 2018-08-20T08:27:21Z (GMT). No. of bitstreams: 1 Casula_HenriqueCury_M.pdf: 1869496 bytes, checksum: 0ebc9d261c898a9363cb007fa72f0bef (MD5) Previous issue date: 2012 / Resumo: A previsibilidade é uma importante ferramenta que os tomadores de decisão buscam nas suas escolhas. Entende-se a tomada de decisão como o processo de identificação de um problema ou de uma oportunidade e a seleção de uma linha de ação para resolvê-la ou de alteração dos objetivos e metas a fim de superá-las. Visando o auxilio a decisões de dimensionamento da cadeia de suprimentos será apresentado um estudo de caso de aplicação de modelos estatísticos em séries temporais para gerar cenários futuros, os riscos inerentes e os erros de previsão. Os dados matemáticos foram ajustados com os especialistas da empresa em estudo que acrescentaram informações não presentes nas séries temporais, como informações de mercado, gerando assim a previsão fim para as decisões. O trabalho foi aplicado em uma manufatura para o auxilio no dimensionamento do seu centro de distribuição para comportar o crescimento de longo prazo / Abstract: Predictability is an important tool for decision makers in their choices. The decision-making is the process of identifying a problem or an opportunity and the selection of a course of action to solve it or change the goals and objectives in order to overcome them. In order to help of design decisions in the supply chain will be presented to the application of statistical models in time series to generate future scenarios, the risks and the forecast errors. The mathematical data were fitted with the company's experts added information not present in time series, such as market information, thereby generating the prediction order for decisions. The method was applied in a manufacturing to design your distribution center to accommodate the long-term growth / Mestrado / Materiais e Processos de Fabricação / Mestre em Engenharia Mecânica Previsão de vendas Análise de séries temporais Programação não-linear Demanda (Teoria econômica) Oferta e procura Sales Forecasting Time series analysis Nonlinear programming Demand (Economic theory) Supply and demand
532	Estimação e previsão da estrutura a termo das taxas de juros usando técnicas de inteligência computacional / Term structure of interest rate modeling and forecasting using computational intelligence techniques Maciel, Leandro dos Santos, 1986- 20 August 2018 (has links) Orientadores: Fernando Antonio Campos Gomide, Rosangela Ballini / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-20T17:20:07Z (GMT). No. of bitstreams: 1 Maciel_LeandrodosSantos_M.pdf: 2052895 bytes, checksum: a88ae55ebe5e6a0ea1053d3c5aef5f66 (MD5) Previous issue date: 2012 / Resumo: Este trabalho propõe a utilização de técnicas de inteligência computacional para a estimação e previsão da estrutura a termo das taxas de juros, com base em dados dos mercados de renda fixa dos Estados Unidos e Brasil. Para o problema de estimação da curva de juros, as técnicas de computação evolucionária, Algoritmos Genéticos, Evolução Diferencial e Estratégias Evolutivas, foram comparadas com abordagens tradicionais da literatura, como mínimos quadrados não-lineares e programação quadrática sequencial. A motivação da aplicação de técnicas de computação evolucionária no problema de estimação da estrutura a termo busca superar limitações como não-convergência e elevada instabilidade dos parâmetros à inicialização. Além disso, recentemente, a literatura tem apontado o elevado desempenho dos algoritmos genéticos em problemas de modelagem da curva de rendimentos. Outra contribuição deste trabalho consiste no desenvolvimento de um modelo nebuloso evolutivo de aprendizado participativo estendido, denominado ePL+, que inclui em sua versão original, ePL, mecanismos para aumentar sua autonomia e adaptabilidade na modelagem de sistemas complexos. Dessa forma, o modelo ePL+ e outros modelos nebulosos funcionais evolutivos foram avaliados na questão da previsão das taxas futuras de juros, em contraposição com modelos econométricos baseados em processos autoregressivos e modelos de redes neurais artificiais multi-camadas, uma vez que a evolução das taxas de juros apresenta uma dinâmica altamente não-linear e variante no tempo, justificando a ideia de modelagem adaptativa. O desempenho dos métodos considerados foi avaliado em termos de métricas de erro, complexidade computacional e por meio de testes estatísticos paramétricos e não-paramétricos, MGN e SIGN, respectivamente. Os resultados evidenciaram o elevado potencial dos modelos de inteligência computacional na estimação e previsão da estrutura a termo em ambas economias consideradas, constatado pelo melhor desempenho, em termos de ajuste e significância estatística, em relação às técnicas de otimização de parâmetros e econométricas mais utilizadas na literatura / Abstract: This work proposes the term structure of interest rates modeling and forecasting using computational intelligence techniques, based on data from the US and Brazilian fixed income markets. The yield curve modeling includes the use of some evolutionary computation methods like Genetic Algorithms, Differential Evolution and Evolution Strategies in comparison with traditional optimization techniques such as nonlinear least squares and sequential quadratic programming. The motivation behind the use of evolutionary computation to yield curve estimation aims to overcome limitations like non-convergence and high parameters instability to initialization. Moreover, recently, the literature has been shown the higher performance of genetic algorithms in yield curve modeling problems. This work also contributes by developing an extended participatory learning fuzzy model, called ePL+, which includes on its original version, ePL, mechanisms to improve its autonomy and adaptability in complex systems modeling. Therefore, the ePL+ model and some evolving functional fuzzy approaches were evaluated in the future interest rates forecasting, as opposed to econometric models based on autoregressive processes and multilayer artificial neural networks methodologies, since interest rates evolution shows a high non-linear dynamics and also time-varying, justifying the idea of adaptive modeling. Models' performance were compared in terms of error measures, computational complexity and by parametric and non-parametric statistical tests, MGN and SIGN, respectively. The results reveal the high potential of computational intelligence methods to deal with the term structure modeling and forecasting for both economies considered, as pointed out by their adjustment and statistical superior performance then traditional optimization and econometrics techniques reported in the literature / Mestrado / Automação / Mestre em Engenharia Elétrica Taxas de juros Computação evolutiva Sistemas nebulosos Sistemas de computação adaptativos Análise de séries temporais Interest rates Evolutionary computation Fuzzy systems Adaptive computing systems Time-series analysis
533	The impact of OFDI on economic growth countries: an econometric approach using panel data and time-series evidence Ambrosini, Mattia 20 December 2012 (has links) Submitted by Eliene Soares da Silva (eliene.silva@fgv.br) on 2013-02-14T11:32:36Z No. of bitstreams: 1 MPGI MasterThesis Mattia Ambrosini 645094.pdf: 1221533 bytes, checksum: 1117aaa68ec08569df715c16c4e0e0d0 (MD5) / Approved for entry into archive by Eliene Soares da Silva (eliene.silva@fgv.br) on 2013-02-14T11:44:31Z (GMT) No. of bitstreams: 1 MPGI MasterThesis Mattia Ambrosini 645094.pdf: 1221533 bytes, checksum: 1117aaa68ec08569df715c16c4e0e0d0 (MD5) / Made available in DSpace on 2013-02-14T12:08:26Z (GMT). No. of bitstreams: 1 MPGI MasterThesis Mattia Ambrosini 645094.pdf: 1221533 bytes, checksum: 1117aaa68ec08569df715c16c4e0e0d0 (MD5) Previous issue date: 2012-12-20 / The thesis at hand adds to the existing literature by investigating the relationship between economic growth and outward foreign direct investments (OFDI) on a set of 16 emerging countries. Two different econometric techniques are employed: a panel data regression analysis and a time-series causality analysis. Results from the regression analysis indicate a positive and significant correlation between OFDI and economic growth. Additionally, the coefficient for the OFDI variable is robust in the sense specified by the Extreme Bound Analysis (EBA). On the other hand, the findings of the causality analysis are particularly heterogeneous. The vector autoregression (VAR) and the vector error correction model (VECM) approaches identify unidirectional Granger causality running either from OFDI to GDP or from GDP to OFDI in six countries. In four economies causality among the two variables is bidirectional, whereas in five countries no causality relationship between OFDI and GDP seems to be present. Emerging countries Economic growth OFDI Panel data Time-series causality analysis Ciência política Áreas subdesenvolvidas Desenvolvimento econômico Análise de séries temporais Investimentos estrangeiros Análise de regressão
534	Estimativa de provisões de IBNR utilizando espaço de estados e filtro de Kalman: um caso brasileiro Pereira, Marcos Henrique Rios 27 August 2013 (has links) Submitted by Marcos Pereira (marcoshenriquerios@gmail.com) on 2013-09-18T23:42:13Z No. of bitstreams: 1 Dissertacao_Marcos_Rios_final.pdf: 3400230 bytes, checksum: 55e2f8c2e2c24851639db9e8bda17832 (MD5) / Approved for entry into archive by Suzinei Teles Garcia Garcia (suzinei.garcia@fgv.br) on 2013-09-19T15:26:00Z (GMT) No. of bitstreams: 1 Dissertacao_Marcos_Rios_final.pdf: 3400230 bytes, checksum: 55e2f8c2e2c24851639db9e8bda17832 (MD5) / Made available in DSpace on 2013-09-19T15:30:35Z (GMT). No. of bitstreams: 1 Dissertacao_Marcos_Rios_final.pdf: 3400230 bytes, checksum: 55e2f8c2e2c24851639db9e8bda17832 (MD5) Previous issue date: 2013-08-27 / Esta dissertação pretende discutir a provisão de sinistros do tipo IBNR, bem como qual a melhor forma de estimar estas provisões. Para tanto, serão utilizados dados reais de uma grande seguradora Brasileira para um produto de seguro de um ramo Não Vida. Serão utilizados no cálculo o clássico método Chain Ladder e em contrapartida um modelo de Espaço de Estados e Filtro de Kalman, discutindo as flexibilidades, vantagens e desvantagens de se utilizar tal metodologia. / This master thesis discusses the claims reserve of the IBNR type, as well as the best way to estimate these provisions. For this purpose will be used the real data from a large Brazilian insurer for an insurance product from a non-life business. Will be used in calculating the classic Chain Ladder method and against this a State Space model and Kalman Filter, discussing the flexibilities, advantages and disadvantages of use such methodology. Modelos de espaço de estados Filtro de Kalman IBNR State space models Time series analysis Kalman filter Insurance - Brazil Economia Métodos de espaço de estados Análise de séries temporais Seguros - Brasil
535	A machine learning approach to dengue forecasting: comparing LSTM, Random Forest and Lasso Mussumeci, Elisa 12 April 2018 (has links) Submitted by Elisa Mussumeci (elisamussumeci@gmail.com) on 2018-05-29T18:53:58Z No. of bitstreams: 1 machine-learning-aproach (4).pdf: 11272802 bytes, checksum: 52b25abf2711fdd6d1a338316c15c154 (MD5) / Approved for entry into archive by ÁUREA CORRÊA DA FONSECA CORRÊA DA FONSECA (aurea.fonseca@fgv.br) on 2018-05-29T19:15:35Z (GMT) No. of bitstreams: 1 machine-learning-aproach (4).pdf: 11272802 bytes, checksum: 52b25abf2711fdd6d1a338316c15c154 (MD5) / Made available in DSpace on 2018-06-14T19:45:29Z (GMT). No. of bitstreams: 1 machine-learning-aproach (4).pdf: 11272802 bytes, checksum: 52b25abf2711fdd6d1a338316c15c154 (MD5) Previous issue date: 2018-04-12 / We used the Infodengue database of incidence and weather time-series, to train predictive models for the weekly number of cases of dengue in 790 cities of Brazil. To overcome a limitation in the length of time-series available to train the model, we proposed using the time series of epidemiologically similar cities as predictors for the incidence of each city. As Machine Learning-based forecasting models have been used in recent years with reasonable success, in this work we compare three machine learning models: Random Forest, lasso and Long-short term memory neural network in their forecasting performance for all cities monitored by the Infodengue Project. Machine learning Neural networks Time series Forecasting Epidemiology Aprendizado por máquina Redes neurais Matemática Análise de séries temporais Redes neurais (Computação) Modelagem de dados Análise de regressão Dengue
536	MODELOS DE PREVISÃO APLICADOS AO CONTROLE DE QUALIDADE COM DADOS AUTOCORRELACIONADOS / FORECAST MODEL APPLIED TO QUALITY CONTROL WITH AUTOCORRELATIONAL DATA Klidzio, Regiane 04 September 2009 (has links) This research has a topic forecast models applied to industrial productive processes with the objective of verifying the stability of the process through control charts applied to the residues originated from linear and non-linear model. In the presence of autocorrelation data, it was necessary to look for a mathematical model which are produce independent and identically distributed residues. This investigation about the stability of the process goes by the verification of the volatility is influence in the detection of points that are capable to affect the productive process performance. This fact shows the existence of the volatility in productive processes, which it is just used until now in economic variables. The data used for analysis belong to three different industries in different segments. The mathematic models were used multivariate dynamic equation, ARIMA and ARIMA-ARCH model. According to the control charts the statistical techniques used to eliminate the serial autocorrelation was statistically adequate comparing to the classic model used by each industry analyzed. Besides, it was verified, in the period that the volatility occurs corresponds to the period the shows a lack of stability detected by Shewhart control charts. The mathematic models were able to represent the productive process, facilitating understands the behavior of the variables, and help to accomplish the forecast and monitoring the process. / A presente pesquisa tem como tema a abordagem de modelos de previsão, aplicados a processos produtivos industriais, com o objetivo de verificar a estabilidade do processo por meio de gráficos de controle, aplicado aos resíduos oriundos de modelagem linear e nãolinear. Como as observações eram autocorrelacionadas, foi necessário buscar um modelo matemático pelo qual foram obtidos resíduos independentes e normalmente distribuídos. A investigação da estabilidade do processo passa pela verificação da influência da volatilidade na detecção de pontos amostrais que são potenciais para afetar o desempenho do processo produtivo. Esse fato comprova a existência da volatilidade em processos produtivos que, até o momento, é trabalhada apenas em variáveis econômicas. Os dados utilizados para análise pertencem a três empresas de segmentos distintos. O modelo matemático foi ajustado utilizando modelo de regressão dinâmica multivariada, modelo ARIMA e modelo ARIMAARCH. De acordo com os gráficos de controle, as técnicas estatísticas empregadas para eliminar a autocorrelação serial dos dados mostraram-se adequadas estatisticamente, se comparadas com o modelo clássico utilizado por cada empresa analisada. Além disso, verificou-se que, no período que ocorre volatilidade corresponde a um período fora de controle detectado nos gráficos de controle de Shewhart. Os modelos matemáticos encontrados foram capazes de representar os processos produtivos, possibilitando compreender o comportamento das variáveis e auxiliaram na realização das previsões e na monitoração do processo. Séries temporais Modelos lineares e não-lineares Autocorrelação Previsão Gráficos de controle Time series Linear e non-linear models Autocorrelation Forecast Control charts
537	Propostas imuno-inspiradas para identificação de sistemas e realização de séries temporais multivariáveis no espaço de estado / Immuno-inspired approaches for state space multivariable system identification and time series realization Giesbrecht, Mateus, 1984- 20 February 2013 (has links) Orientador: Celso Pascoli Bottura / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-22T08:49:57Z (GMT). No. of bitstreams: 1 Giesbrecht_Mateus_D.pdf: 4188992 bytes, checksum: a2d91ff20132430d1389b8cd758b80bc (MD5) Previous issue date: 2012 / Resumo: Nesta tese é descrito como alguns problemas relacionados à identificação de sistemas discretos multivariáveis, à realização de séries temporais discretas multivariáveis e à modelagem de séries temporais discretas multivariáveis, podem ser formulados como problemas de otimização. Além da formulação dos problemas de otimização, nesta tese também são apresentadas algumas propostas imuno-inspiradas para a solução de cada um dos problemas, assim como os resultados e conclusões da aplicação dos métodos propostos. Os métodos aqui propostos apresentam resultados e performance melhores que aqueles obtidos por métodos conhecidos para solução dos problemas estudados, e podem ser aplicados em problemas cujas condições não sejam favoráveis para aplicação dos métodos conhecidos na literatura / Abstract: In this thesis it is described how some problems related to multivariable system identification, multivariable time series realization and multivariable time series modeling, can be formulated as optimization problems. Additionally, in this thesis some immune-inspired methods to solve each problem are also shown, and also the results and conclusions resultant from the application of the proposed methods. The performance and the results obtained with the methods here proposed are better than the results produced by known methods to solve the studied problems and can be applied even if the problem conditions are not suitable to the methods presented in the literature / Doutorado / Automação / Doutor em Engenharia Elétrica Análise de séries temporais Identificação de sistemas Métodos de espaço de estados Processo estocástico Algoritmos evolutivos Time series analysis System Identification State Space methods, Stochastic processes Evolutionary algorithms
538	Time series data mining using complex networks / Mineração de dados em séries temporais usando redes complexas Leonardo Nascimento Ferreira 15 September 2017 (has links) A time series is a time-ordered dataset. Due to its ubiquity, time series analysis is interesting for many scientific fields. Time series data mining is a research area that is intended to extract information from these time-related data. To achieve it, different models are used to describe series and search for patterns. One approach for modeling temporal data is by using complex networks. In this case, temporal data are mapped to a topological space that allows data exploration using network techniques. In this thesis, we present solutions for time series data mining tasks using complex networks. The primary goal was to evaluate the benefits of using network theory to extract information from temporal data. We focused on three mining tasks. (1) In the clustering task, we represented every time series by a vertex and we connected vertices that represent similar time series. We used community detection algorithms to cluster similar series. Results show that this approach presents better results than traditional clustering results. (2) In the classification task, we mapped every labeled time series in a database to a visibility graph. We performed classification by transforming an unlabeled time series to a visibility graph and comparing it to the labeled graphs using a distance function. The new label is the most frequent label in the k-nearest graphs. (3) In the periodicity detection task, we first transform a time series into a visibility graph. Local maxima in a time series are usually mapped to highly connected vertices that link two communities. We used the community structure to propose a periodicity detection algorithm in time series. This method is robust to noisy data and does not require parameters. With the methods and results presented in this thesis, we conclude that network science is beneficial to time series data mining. Moreover, this approach can provide better results than traditional methods. It is a new form of extracting information from time series and can be easily extended to other tasks. / Séries temporais são conjuntos de dados ordenados no tempo. Devido à ubiquidade desses dados, seu estudo é interessante para muitos campos da ciência. A mineração de dados temporais é uma área de pesquisa que tem como objetivo extrair informações desses dados relacionados no tempo. Para isso, modelos são usados para descrever as séries e buscar por padrões. Uma forma de modelar séries temporais é por meio de redes complexas. Nessa modelagem, um mapeamento é feito do espaço temporal para o espaço topológico, o que permite avaliar dados temporais usando técnicas de redes. Nesta tese, apresentamos soluções para tarefas de mineração de dados de séries temporais usando redes complexas. O objetivo principal foi avaliar os benefícios do uso da teoria de redes para extrair informações de dados temporais. Concentramo-nos em três tarefas de mineração. (1) Na tarefa de agrupamento, cada série temporal é representada por um vértice e as arestas são criadas entre as séries de acordo com sua similaridade. Os algoritmos de detecção de comunidades podem ser usados para agrupar séries semelhantes. Os resultados mostram que esta abordagem apresenta melhores resultados do que os resultados de agrupamento tradicional. (2) Na tarefa de classificação, cada série temporal rotulada em um banco de dados é mapeada para um gráfico de visibilidade. A classificação é realizada transformando uma série temporal não marcada em um gráfico de visibilidade e comparando-a com os gráficos rotulados usando uma função de distância. O novo rótulo é dado pelo rótulo mais frequente nos k grafos mais próximos. (3) Na tarefa de detecção de periodicidade, uma série temporal é primeiramente transformada em um gráfico de visibilidade. Máximos locais em uma série temporal geralmente são mapeados para vértices altamente conectados que ligam duas comunidades. O método proposto utiliza a estrutura de comunidades para realizar a detecção de períodos em séries temporais. Este método é robusto para dados ruidosos e não requer parâmetros. Com os métodos e resultados apresentados nesta tese, concluímos que a teoria da redes complexas é benéfica para a mineração de dados em séries temporais. Além disso, esta abordagem pode proporcionar melhores resultados do que os métodos tradicionais e é uma nova forma de extrair informações de séries temporais que pode ser facilmente estendida para outras tarefas. Agrupamento Classificação Detecção de comunidades Detecção de periodicidade Mineração de grafos Mineração de séries temporais Redes complexas Classification Clustering Community detection Complex networks Graph mining Periodicity detection Time series data mining
539	Employing nonlinear time series analysis tools with stable clustering algorithms for detecting concept drift on data streams / Aplicando ferramentas de análise de séries temporais não lineares e algoritmos de agrupamento estáveis para a detecção de mudanças de conceito em fluxos de dados Fausto Guzzo da Costa 17 August 2017 (has links) Several industrial, scientific and commercial processes produce open-ended sequences of observations which are referred to as data streams. We can understand the phenomena responsible for such streams by analyzing data in terms of their inherent recurrences and behavior changes. Recurrences support the inference of more stable models, which are deprecated by behavior changes though. External influences are regarded as the main agent actuacting on the underlying phenomena to produce such modifications along time, such as new investments and market polices impacting on stocks, the human intervention on climate, etc. In the context of Machine Learning, there is a vast research branch interested in investigating the detection of such behavior changes which are also referred to as concept drifts. By detecting drifts, one can indicate the best moments to update modeling, therefore improving prediction results, the understanding and eventually the controlling of other influences governing the data stream. There are two main concept drift detection paradigms: the first based on supervised, and the second on unsupervised learning algorithms. The former faces great issues due to the labeling infeasibility when streams are produced at high frequencies and large volumes. The latter lacks in terms of theoretical foundations to provide detection guarantees. In addition, both paradigms do not adequately represent temporal dependencies among data observations. In this context, we introduce a novel approach to detect concept drifts by tackling two deficiencies of both paradigms: i) the instability involved in data modeling, and ii) the lack of time dependency representation. Our unsupervised approach is motivated by Carlsson and Memolis theoretical framework which ensures a stability property for hierarchical clustering algorithms regarding to data permutation. To take full advantage of such framework, we employed Takens embedding theorem to make data statistically independent after being mapped to phase spaces. Independent data were then grouped using the Permutation-Invariant Single-Linkage Clustering Algorithm (PISL), an adapted version of the agglomerative algorithm Single-Linkage, respecting the stability property proposed by Carlsson and Memoli. Our algorithm outputs dendrograms (seen as data models), which are proven to be equivalent to ultrametric spaces, therefore the detection of concept drifts is possible by comparing consecutive ultrametric spaces using the Gromov-Hausdorff (GH) distance. As result, model divergences are indeed associated to data changes. We performed two main experiments to compare our approach to others from the literature, one considering abrupt and another with gradual changes. Results confirm our approach is capable of detecting concept drifts, both abrupt and gradual ones, however it is more adequate to operate on complicated scenarios. The main contributions of this thesis are: i) the usage of Takens embedding theorem as tool to provide statistical independence to data streams; ii) the implementation of PISL in conjunction with GH (called PISLGH); iii) a comparison of detection algorithms in different scenarios; and, finally, iv) an R package (called streamChaos) that provides tools for processing nonlinear data streams as well as other algorithms to detect concept drifts. / Diversos processos industriais, científicos e comerciais produzem sequências de observações continuamente, teoricamente infinitas, denominadas fluxos de dados. Pela análise das recorrências e das mudanças de comportamento desses fluxos, é possível obter informações sobre o fenômeno que os produziu. A inferência de modelos estáveis para tais fluxos é suportada pelo estudo das recorrências dos dados, enquanto é prejudicada pelas mudanças de comportamento. Essas mudanças são produzidas principalmente por influências externas ainda desconhecidas pelos modelos vigentes, tal como ocorre quando novas estratégias de investimento surgem na bolsa de valores, ou quando há intervenções humanas no clima, etc. No contexto de Aprendizado de Máquina (AM), várias pesquisas têm sido realizadas para investigar essas variações nos fluxos de dados, referidas como mudanças de conceito. Sua detecção permite que os modelos possam ser atualizados a fim de apurar a predição, a compreensão e, eventualmente, controlar as influências que governam o fluxo de dados em estudo. Nesse cenário, algoritmos supervisionados sofrem com a limitação para rotular os dados quando esses são gerados em alta frequência e grandes volumes, e algoritmos não supervisionados carecem de fundamentação teórica para prover garantias na detecção de mudanças. Além disso, algoritmos de ambos paradigmas não representam adequadamente as dependências temporais entre observações dos fluxos. Nesse contexto, esta tese de doutorado introduz uma nova metodologia para detectar mudanças de conceito, na qual duas deficiências de ambos paradigmas de AM são confrontados: i) a instabilidade envolvida na modelagem dos dados, e ii) a representação das dependências temporais. Essa metodologia é motivada pelo arcabouço teórico de Carlsson e Memoli, que provê uma propriedade de estabilidade para algoritmos de agrupamento hierárquico com relação à permutação dos dados. Para usufruir desse arcabouço, as observações são embutidas pelo teorema de imersão de Takens, transformando-as em independentes. Esses dados são então agrupados pelo algoritmo Single-Linkage Invariante à Permutação (PISL), o qual respeita a propriedade de estabilidade de Carlsson e Memoli. A partir dos dados de entrada, esse algoritmo gera dendrogramas (ou modelos), que são equivalentes a espaços ultramétricos. Modelos sucessivos são comparados pela distância de Gromov-Hausdorff a fim de detectar mudanças de conceito no fluxo. Como resultado, as divergências dos modelos são de fato associadas a mudanças nos dados. Experimentos foram realizados, um considerando mudanças abruptas e o outro mudanças graduais. Os resultados confirmam que a metodologia proposta é capaz de detectar mudanças de conceito, tanto abruptas quanto graduais, no entanto ela é mais adequada para cenários mais complicados. As contribuições principais desta tese são: i) o uso do teorema de imersão de Takens para transformar os dados de entrada em independentes; ii) a implementação do algoritmo PISL em combinação com a distância de Gromov-Hausdorff (chamado PISLGH); iii) a comparação da metodologia proposta com outras da literatura em diferentes cenários; e, finalmente, iv) a disponibilização de um pacote em R (chamado streamChaos) que provê tanto ferramentas para processar fluxos de dados não lineares quanto diversos algoritmos para detectar mudanças de conceito. Agrupamento Aprendizado de máquina Fluxos de dados Mudanças de conceito Séries temporais não lineares Clustering Concept drift Data streams Machine learning Nonlinear time series
540	Improving time series modeling by decomposing and analysing stochastic and deterministic influences / Modelagem de séries temporais por meio da decomposição e análise de influências estocásticas e determinísticas Ricardo Araújo Rios 22 October 2013 (has links) This thesis presents a study on time series analysis, which was conducted based on the following hypothesis: time series influenced by additive noise can be decomposed into stochastic and deterministic components in which individual models permit obtaining a hybrid one that improves accuracy. This hypothesis was confirmed in two steps. In the first one, we developed a formal analysis using the Nyquist-Shannon sampling theorem, proving Intrinsic Mode Functions (IMFs) extracted from the Empirical Mode Decomposition (EMD) method can be combined, according to their frequency intensities, to form stochastic and deterministic components. Considering this proof, we designed two approaches to decompose time series, which were evaluated in synthetic and real-world scenarios. Experimental results confirmed the importance of decomposing time series and individually modeling the deterministic and stochastic components, proving the second part of our hypothesis. Furthermore, we noticed the individual analysis of both components plays an important role in detecting patterns and extracting implicit information from time series. In addition to these approaches, this thesis also presents two new measurements. The first one is used to evaluate the accuracy of time series modeling in forecasting observations. This measurement was motivated by the fact that existing measurements only consider the perfect match between expected and predicted values. This new measurement overcomes this issue by also analyzing the global time series behavior. The second measurement presented important results to assess the influence of the deterministic and stochastic components on time series observations, supporting the decomposition process. Finally, this thesis also presents a Systematic Literature Review, which collected important information on related work, and two new methods to produce surrogate data, which permit investigating the presence of linear and nonlinear Gaussian processes in time series, irrespective of the influence of nonstationary behavior / Esta tese apresenta um estudo sobre análise de séries temporais, a qual foi conduzida baseada na seguinte hipótese: séries temporais influenciadas por ruído aditivo podem ser decompostas em componentes estocásticos e determinísticos que ao serem modelados individualmente permitem obter um modelo híbrido de maior acurácia. Essa hipótese foi confirmada em duas etapas. Na primeira, desenvolveu-se uma análise formal usando o teorema de amostragem proposto por Nyquist-Shannon, provando que IMFs (Intrinsic Mode Functions) extraídas pelo método EMD (Empirical Mode Decomposition) podem ser combinadas de acordo com suas intensidades de frequência para formar os componentes estocásticos e determinísticos. Considerando essa prova, duas abordagens de decomposição de séries foram desenvolvidas e avaliadas em aplicações sintéticas e reais. Resultados experimentais confirmaram a importância de decompor séries temporais e modelar seus componentes estocásticos e determinísticos, provando a segunda parte da hipótese. Além disso, notou-se que a análise individual desses componentes possibilita detectar padrões e extrair importantes informações implícitas em séries temporais. Essa tese apresenta ainda duas novas medidas. A primeira é usada para avaliar a acurácia de modelos utilizados para predizer observações. A principal vantagem dessa medida em relação às existentes é a possibilidade de avaliar os valores individuais de predição e o comportamento global entre as observações preditas e experadas. A segunda medida permite avaliar a influência dos componentes estocásticos e determinísticos sobre as séries temporais. Finalmente, essa tese apresenta ainda resultados obtidos por meio de uma revisão sistemática da literatura, a qual coletou importantes trabalhos relacionados, e dois novos métodos para geração de dados substitutos, permitindo investigar a presença de processos Gaussianos lineares e não-lineares, independente da influência de comportamento não-estacionário Análise de séries temporais Decomposição Decomposição de modo empírico Ruído aditivo Additive noise Decomposition Empirical mode decomposition Stochastic and deterministic influences Time series analysis

Search results