Global ETD Search

1	Resistencia e robustez qualitativas em processos estacionarios ergodicos Gneri, Mario Antonio, 1945- 25 August 1995 (has links) Orientador: Oscar Humberto Bustos / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Científica / Made available in DSpace on 2018-07-20T16:19:16Z (GMT). No. of bitstreams: 1 Gneri_MarioAntonio_D.pdf: 4713622 bytes, checksum: fcbc181f8fe766fd0d53ec6fb9c843bf (MD5) Previous issue date: 1995 / Resumo: Não informado / Abstract: Not informed / Doutorado / Doutor em Ciências Estatística robusta Processo estacionario
2	Detecção de dados atipicos e metodos de regressão com alto ponto de ruptura Machado, Helymar da Costa 17 April 1997 (has links) Orientador: Gabriela Stangenhaus / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-07-22T04:02:22Z (GMT). No. of bitstreams: 1 Machado_HelymardaCosta_M.pdf: 4843890 bytes, checksum: d92608cb421a49bc3a9b5850b381092c (MD5) Previous issue date: 1997 / Resumo: As técnicas de diagnóstico para detecção de dados atípicos comumente utilizadas na análise de regressão linear têm por base o método de estimação dos mínimos quadrados dos resíduos. No entanto, se no conjunto de dados houver observações atípicas, estas obsetVações influenciarão o ajuste, afetando o estimador obtido por esse método. Quando isto OCOITe, pode haver efeitos de maceramento (isto é, não se detectam as observações atipicas, ou seja, aquelas que se distanciam das demais) e/ou "swamping" (isto é, c1assifica se como atípica uma observação comum). Neste traba1ho são abordados métodos de estimação com alto ponto de ruptura, ou seja, métodos cujos esticadores não são afetados quando houver observações atípicas no conjunto de dados. Como alternativa para o método dos mínimos quadrados dos resíduos são abordados mais deta1hadamente o método da mínima mediana dos quadrados dos resíduos e o método dos quadrados aparados mínimos. As técnicas de diagnóstico baoadas em tais métodos são resistentes a dados atípicos, conseguindo identificá-los. Para obtenção de uma solução para os estimadores dos métodos de estimação resistentes às observações atípicas utilizam-se algoritmos que se baseiam nos chamado conjuntos elementares, que consistem de subconjuntos das observações do conjunto de dados. Assim, são apresentados vários algoritmos baseados nos conjuntos elementares, sendo que alguns algori1mos consistem na enumeração completa ou parcial (através de uma amostra aleatória) de todos os possíveis conjuntos elementares, enquanto que outros são resolvidos através de programação linear. / Abstract: Not informed. / Mestrado / Mestre em Estatística Análise de regressão Estimativa de parâmetro Algoritmos Estatística robusta
3	Estimadores de regressãao com alto ponto de ruptura e detecção multiplas observações discrepantes Aguero Palacios, Ysela Dominga 22 February 1994 (has links) Orientador : Gabriela Stangenhaus / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação / Made available in DSpace on 2018-07-19T02:35:18Z (GMT). No. of bitstreams: 1 AgueroPalacios_YselaDominga_M.pdf: 2589211 bytes, checksum: c30cce4b804f3c4a4a42f0838046538b (MD5) Previous issue date: 1994 / Resumo: Os métodos de diagnósticos de observações discrepantes na análise de regressão linear múltipla baseiam-se na eliminação de apenas uma observação de cada vez. Existem também métodos nos quais se elimina mais de uma observação de cada vez, mais são pouco aplicados devido aos problemas combinatórios envolvidos. Por outro lado, existem conjuntos de dados com um padrão de múltiplas observações discrepantes os quais não são revelados pelos métodos de eliminação de uma observação de cada vez. Nestes casos dizemos que aconteceu um problema de "mascaramento". Neste trabalho estudamos métodos exploratórios de identificação de múltiplas observações discrepantes usando estimadores com alto ponto de ruptura, isto é, estimadores que além de não serem afetados no caso de existir múltiplas observações discrepantes no conjunto de dados, sejam úteis para identificá-los. / Abstract: Not informed / Mestrado / Mestre em Estatística Análise de regressão Estimativa de parâmetro Algoritmos Estatística robusta
4	Robust algorithms for linear regression and locally linear embedding / Algoritmos robustos para regressão linear e locally linear embedding Rettes, Julio Alberto Sibaja January 2017 (has links) RETTES, Julio Alberto Sibaja. Robust algorithms for linear regression and locally linear embedding. 2017. 105 f. Dissertação (Mestrado em Ciência da Computação)- Universidade Federal do Ceará, Fortaleza, 2017. / Submitted by Weslayne Nunes de Sales (weslaynesales@ufc.br) on 2017-03-30T13:15:27Z No. of bitstreams: 1 2017_dis_rettesjas.pdf: 3569500 bytes, checksum: 46cedc2d9f96d0f58bcdfe3e0d975d78 (MD5) / Approved for entry into archive by Rocilda Sales (rocilda@ufc.br) on 2017-04-04T11:10:44Z (GMT) No. of bitstreams: 1 2017_dis_rettesjas.pdf: 3569500 bytes, checksum: 46cedc2d9f96d0f58bcdfe3e0d975d78 (MD5) / Made available in DSpace on 2017-04-04T11:10:44Z (GMT). No. of bitstreams: 1 2017_dis_rettesjas.pdf: 3569500 bytes, checksum: 46cedc2d9f96d0f58bcdfe3e0d975d78 (MD5) Previous issue date: 2017 / Nowadays a very large quantity of data is flowing around our digital society. There is a growing interest in converting this large amount of data into valuable and useful information. Machine learning plays an essential role in the transformation of data into knowledge. However, the probability of outliers inside the data is too high to marginalize the importance of robust algorithms. To understand that, various models of outliers are studied. In this work, several robust estimators within the generalized linear model for regression framework are discussed and analyzed: namely, the M-Estimator, the S-Estimator, the MM-Estimator, the RANSAC and the Theil-Sen estimator. This choice is motivated by the necessity of examining algorithms with different working principles. In particular, the M-, S-, MM-Estimator are based on a modification of the least squares criterion, whereas the RANSAC is based on finding the smallest subset of points that guarantees a predefined model accuracy. The Theil Sen, on the other hand, uses the median of least square models to estimate. The performance of the estimators under a wide range of experimental conditions is compared and analyzed. In addition to the linear regression problem, the dimensionality reduction problem is considered. More specifically, the locally linear embedding, the principal component analysis and some robust approaches of them are treated. Motivated by giving some robustness to the LLE algorithm, the RALLE algorithm is proposed. Its main idea is to use different sizes of neighborhoods to construct the weights of the points; to achieve this, the RAPCA is executed in each set of neighbors and the risky points are discarded from the corresponding neighborhood. The performance of the LLE, the RLLE and the RALLE over some datasets is evaluated. / Na atualidade um grande volume de dados é produzido na nossa sociedade digital. Existe um crescente interesse em converter esses dados em informação útil e o aprendizado de máquinas tem um papel central nessa transformação de dados em conhecimento. Por outro lado, a probabilidade dos dados conterem outliers é muito alta para ignorar a importância dos algoritmos robustos. Para se familiarizar com isso, são estudados vários modelos de outliers. Neste trabalho, discutimos e analisamos vários estimadores robustos dentro do contexto dos modelos de regressão linear generalizados: são eles o M-Estimator, o S-Estimator, o MM-Estimator, o RANSAC e o Theil-Senestimator. A escolha dos estimadores é motivada pelo principio de explorar algoritmos com distintos conceitos de funcionamento. Em particular os estimadores M, S e MM são baseados na modificação do critério de minimização dos mínimos quadrados, enquanto que o RANSAC se fundamenta em achar o menor subconjunto que permita garantir uma acurácia predefinida ao modelo. Por outro lado o Theil-Sen usa a mediana de modelos obtidos usando mínimos quadradosno processo de estimação. O desempenho dos estimadores em uma ampla gama de condições experimentais é comparado e analisado. Além do problema de regressão linear, considera-se o problema de redução da dimensionalidade. Especificamente, são tratados o Locally Linear Embedding, o Principal ComponentAnalysis e outras abordagens robustas destes. É proposto um método denominado RALLE com a motivação de prover de robustez ao algoritmo de LLE. A ideia principal é usar vizinhanças de tamanhos variáveis para construir os pesos dos pontos; para fazer isto possível, o RAPCA é executado em cada grupo de vizinhos e os pontos sob risco são descartados da vizinhança correspondente. É feita uma avaliação do desempenho do LLE, do RLLE e do RALLE sobre algumas bases de dados. Outliers Estatística robusta Regressão linear Redução da dimensionalidade Locally Linear Embedding
5	Processos de ordem infinita estocasticamente perturbados / Processes of infinite order stochastically perturbed Moreira, Lucas, 1984- 19 August 2018 (has links) Orientador: Nancy Lopes Garcia / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica / Made available in DSpace on 2018-08-19T13:37:17Z (GMT). No. of bitstreams: 1 Moreira_Lucas_D.pdf: 778475 bytes, checksum: 78934b9baf39cc234f800623a7af5cdf (MD5) Previous issue date: 2012 / Resumo: Inspirados em Collet, Galves e Leonardi (2008), a motivação original deste texto é responder a seguinte questão: é possível recuperar a árvore de contextos de uma cadeia de alcance variável através de uma amostra perturbada da cadeia? Inicialmente, consideramos cadeias binárias de ordem infinita nas quais um dos símbolos pode ser modificado com uma probabilidade pequena e fixada. Provamos que as probabilidades de transição da cadeia perturbada estão uniformemente próximas das probabilidades de transição correspondentes da cadeia original se a probabilidade de contaminação é suficientemente pequena. Por meio deste resultado, fomos capazes de responder afirmativamente à pergunta inicial deste trabalho, ou seja, é possível recuperar a árvore de contextos do processo original mesmo utilizando uma amostra contamina no procedimento de estimação. Com isso, mostramos que o estimador da árvore de contextos utilizado é robusto. Em seguida, consideramos o seguinte modelo: dadas duas cadeias de alcance variável, tomando valores num mesmo alfabeto finito, a cada instante do tempo, o novo processo escolhe aleatoriamente um dos dois processos originais com uma probabilidade grande e fixa. A cadeia obtida dessa maneira pode então ser vista como uma perturbação estocástica da cadeia que está sendo escolhida com probabilidade maior. Para esse modelo, obtivemos resultados semelhantes aos obtidos para o modelo inicial / Abstract: Inspired by Collet, Galves and Leonardi (2008), the original motivation of this paper is to answer the following question: Is it possible to recover the context tree of a length variable chain range through a disturbed sample of chain? Initially consider binary chains of infinite order in which one of the symbols can be modified with a small and fixed probability. We prove that the transition probabilities of the perturbed chain are uniformly close to the corresponding transition probabilities of the original chain if the probability of contamination is small enough. Through this result, we were able to answer affirmatively to the initial question of this work, i.e., it is possible to recover the context tree of the original process using a sample contaminates the estimation procedure. With this, we show that the estimator of the context tree used is robust. Next, consider the following model: given two length variable chains, taking values in the same finite alphabet, at each instant of time, the new process randomly chooses one of the two processes with a large and fixed probability. The chain obtained with greater probability can be seen as a stochastic disturbance of the original chain. For this model, we obtained similar results to the those obtained for the initial model / Doutorado / Estatistica / Doutor em Estatística Processo estocástico Estatística robusta Stochastic processes Robust statistics
6	Análise fatorial em series temporais com long-memory, outliers e sazonalidade : aplicação em poluição do ar na região da Grande Vitória-ES Sgrancio, Adriano Marcio 20 July 2015 (has links) Submitted by Elizabete Silva (elizabete.silva@ufes.br) on 2015-11-23T18:55:03Z No. of bitstreams: 2 license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) ANALISE FATORIAL EM SERIES TEMPORAIS.pdf: 2194722 bytes, checksum: 443c7c57567200ac6397234fc6b5687f (MD5) / Approved for entry into archive by Morgana Andrade (morgana.andrade@ufes.br) on 2016-01-05T10:06:44Z (GMT) No. of bitstreams: 2 license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) ANALISE FATORIAL EM SERIES TEMPORAIS.pdf: 2194722 bytes, checksum: 443c7c57567200ac6397234fc6b5687f (MD5) / Made available in DSpace on 2016-01-05T10:06:44Z (GMT). No. of bitstreams: 2 license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) ANALISE FATORIAL EM SERIES TEMPORAIS.pdf: 2194722 bytes, checksum: 443c7c57567200ac6397234fc6b5687f (MD5) Previous issue date: 2015 / CAPES / Os estudos de polui c~ao atmosf erica geralmente envolvem medi c~oes e an alises de dados de concentra c~oes de poluentes, como e o caso do MP10 (material particulado), de SO2 (di oxido de enxofre) e de outros poluentes. Estes dados normalmente possuem caracter sticas importantes como autocorrela c~ao, longa depend^encia, sazonalidade e observa c~oes at picas, que necessitam de ferramentas de an alise de s eries temporais multivariadas para avaliar o seu comportamento na atmosfera. Neste contexto, propomos um estimador fracion ario robusto da matriz de autocovari^ancia robusta de longa depend^encia e frequ^encia sazonal, para o modelo SARFIMA. O interesse pr atico em polui c~ao do ar e avaliar o comportamento das s eries de concentra c~oes de SO2 e fazer as previs~oes, mais acuradas, deste poluente. As previs~oes, do modelo SARFIMA estimado, s~ao comparadas as previs~oes do modelo SARMA, atrav es do erro quadr atico m edio. Existe outra di culdade na investiga c~ao dos poluentes atmosf ericos, por modelos de s eries temporais: os dados de SO2, de MP10 e de outros poluentes possuem alta dimensionalidade. Este fato di culta o tratamento dos dados atrav es de modelos vetoriais autorregressivos, pelo excessivo n umero de par^ametros estimados. Na literatura, a abordagem do problema para s eries temporais de grandes dimens~oes e feita atrav es da redu c~ao da dimensionalidade dos dados, utilizando, principalmente, o modelo fatorial e o m etodo de componentes principais. Por em, as caracter sticas de longa depend^encia e de observa c~oes at picas das s eries de polui c~ao atmosf erica, normalmente, n~ao s~ao envolvidas na teoria de an alise fatorial. Neste contexto, propomos aqui uma contribui c~ao te orica para o modelo fatorial de s eries temporais de grandes dimens~oes, envolvendo longa depend^encia e robustez na estima c~ao dos fatores. O modelo sugerido e aplicado em s eries de MP10 da rede de monitoramento da qualidade do ar da Grande Vit oria - ES. / Studies about air pollution typically involve measurements and analysis of pollutants, such as PM10 (particulate matter), SO2 (sulfur dioxide) and others. These data typically have important features like serial correlation, long dependency, seasonality and occurence of atypical observations, and many others, which may be analyzed by means of multivariate time series. In this context, a robust estimator of fractional robust autocovariance matrix of long dependence and seasonal frequency for SARFIMA model is proposed. The model is compared to SARMA model and is applied to SO2 concentrations. In addition of the mentioned features the data present high dimensionality in relation to sample size and number of variables. This fact complicates the analisys of the data using vector time series models. In the literature, the approach to mitigate this problem for high dimensional time series is to reduce the dimensionality using the factor analysis and principal component analysis. However, the long dependence characteristics and atypical observations, very common in air pollution series, is not considered by the standard factor analysis method. In this context, the standard factor model is extended to consider time series data presenting long dependence and outliers. The proposed method is applied to PM10 series of air quality monitoring network of the Greater Vit oria Region - ES. Análise fatorial Ar – Poluição Análise de séries temporais Valores estranhos (Estatística) Estatística robusta Dióxido de enxofre Material particulado Poluição do ar Outliers Robustez Longa dependência Material particulado Dióxido de enxofre 628
7	Tópicos em seleção de modelos markovianos / Topics in selection of Markov models Viola, Márcio Luis Lanfredi, 1978- 19 August 2018 (has links) Orientador: Jesus Enrique Garcia / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-19T15:10:51Z (GMT). No. of bitstreams: 1 Viola_MarcioLuisLanfredi_D.pdf: 951071 bytes, checksum: 87d2c8b2501105bc64aab5e92c769ea4 (MD5) Previous issue date: 2011 / Resumo: Nesta tese abordamos o problema estatístico de seleção de um modelo Markoviano de ordem finita que se ajuste bem a um conjunto de dados em duas situações diferentes. Em relação ao primeiro caso, propomos uma metodologia para a estimação de uma árvore de contextos utilizando-se amostras independentes sendo que a maioria delas são provenientes de um mesmo processo de Markov de memória variável finita e as demais provêm de um outro processo Markoviano de memória variável finita. O método proposto é baseado na taxa de entropia relativa simetrizada como uma medida de similaridade. Além disso, o conceito de ponto de ruptura assintótico foi adaptado ao nosso problema de seleção a fim de mostrar que o procedimento proposto, nesta tese, é robusto. Em relação ao segundo problema, considerando um processo de Markov multivariado de ordem finita, propomos uma metodologia consistente que fornece a partição mais fina das coordenadas do processo de forma que os seus elementos sejam condionalmente independentes. O método obtido é baseado no BIC (Critério de Informação Bayesiano). Porém, quando o número de coordenadas do processo cresce, o custo computacional do critério BIC torna-se excessivo. Neste caso, propomos um algoritmo mais eficiente do ponto de vista computacional e a sua consistência é demonstrada. A eficiência das metodologias propostas foi estudada através de simulações e elas foram aplicadas em dados linguísticos / Abstract: This work related two statistical problems involving the selection of a Markovian model of finite order. Firstly, we propose a procedure to choose a context tree from independent samples, with more than half of them being realizations of the same finite memory Markovian processes with finite alphabet with law P. Our model selection strategy is based on estimating relative entropies to select a subset of samples that are realizations of the same law. We define the asymptotic breakdown point for a model selection procedure, and show the asymptotic breakdown point for our procedure. Moreover, we study the robust procedure by simulations and it is applied to linguistic data. The aim of other problem is to develop a consistent methodology for obtain the finner partitions of the coordinates of an multivariate Markovian stationary process such that their elements are conditionally independents. The proposed method is establishment by Bayesian information criterion (BIC). However, when the number of the coordinates of process increases, the computing of criterion BIC becomes excessive. In this case, we propose an algorithm more efficient and the its consistency is demonstrated. It is tested by simulations and applied to linguistic data / Doutorado / Estatistica / Doutor em Estatística Markov, Processos de Estatística robusta Compressão de dados (Computação) Markov processes Robust statisitica Data compression (Computer science)

1

Page generated in 0.0844 seconds