Global ETD Search

31	Three essays on data contaminants, outliers and macroeconomic time series Palardy, Joseph Michael. January 1900 (has links) Thesis (Ph. D.)--West Virginia University, 2002. / Title from document title page. Document formatted into pages; contains viii, 175 p. : ill. Includes abstract. Includes bibliographical references (p. 171-175).
32	Robust estimation for spatial models and the skill test for disease diagnosis Lin, Shu-Chuan. January 2008 (has links) Thesis (Ph.D)--Industrial and Systems Engineering, Georgia Institute of Technology, 2009. / Committee Chair: Lu, Jye-Chyi; Committee Co-Chair: Kvam, Paul; Committee Member: Mei, Yajun; Committee Member: Serban, Nicoleta; Committee Member: Vidakovic, Brani. Part of the SMARTech Electronic Thesis and Dissertation Collection.
33	Eficiência bancária : uma abordagem não paramétrica aplicada ao Banco do Brasil Souza, João Carlos Félix 12 1900 (has links) Tese (doutorado)—Universidade de Brasília, Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação, Departamento de Economia, 2006. / Submitted by mariana castro (nanacastro0107@hotmail.com) on 2009-09-24T23:00:10Z No. of bitstreams: 1 2006_João Carlos Félix Souza.pdf: 2614729 bytes, checksum: 40701c3cb56191920d96ee18cf609d30 (MD5) / Approved for entry into archive by Gomes Neide(nagomes2005@gmail.com) on 2010-06-16T17:41:52Z (GMT) No. of bitstreams: 1 2006_João Carlos Félix Souza.pdf: 2614729 bytes, checksum: 40701c3cb56191920d96ee18cf609d30 (MD5) / Made available in DSpace on 2010-06-16T17:41:52Z (GMT). No. of bitstreams: 1 2006_João Carlos Félix Souza.pdf: 2614729 bytes, checksum: 40701c3cb56191920d96ee18cf609d30 (MD5) Previous issue date: 2006-12 / Este trabalho baseia-se na comparação empírica da eficiência bancária, Calculados por modelos não paramétricos, utilizando a distribuição dessa variável e pesquisando seus outliers. Não necessariamente os outliers são decorrentes de problemas de mensuração, podem ser analisados como mudança de atuação estratégica, o que efetivamente ocorre na aplicação no Banco do Brasil. Os resultados do cálculo de eficiência são submetidos ao modelo de Regressão Quantílica como variável endógena. As variáveis dependentes são formadas por indicadores do potencial de mercado do município, bem como alguns indicadores internos da Instituição. A análise desses resultados confirma a importância e impacto de certas variáveis de mercado ou dummiesy de localização na medição do grau de eficiência relativa. Dois modelos são testados na técnica DEA (Data Envelopment Analysis) optando-se por um modelo mais apropriado para a aplicação em questão. _______________________________________________________________________________________ ABSTRACT / This project is based on the empirical comparison of banking efficiency calculated by nonparametric models, using the distribution of this variable e researching its outliers. The outliers do not necessarily result from problems of measuring, but they can be analyzed as strategic change, something which actually occurs when it applies to Banco do Brasil. Efficiency calculation results are submitted to the Quantile Regression models as an endogenous variable. The dependent variables are formed by inside indicators of the institution and municipalities. The analysis of these results confirms the importance and the impact of certain market variables or localization dummies on the measuring of relative efficiency rates. Two models are tested in the DEA (Data Envelopment Analysis) technique, another more appropriate model being chosen to apply in the case. Eficiência organizacional Bancos Outliers Banco do Brasil
34	Estimação e previsão em processos sarfima(p, d, q) x (P, D, Q)ѕ[subscrito] na presença de outliers Bisognin, Cleber January 2007 (has links) Neste trabalho analisamos alguns processos com a propriedade de longa dependência e sazonalidade. Nosso estudo tem por objetivo principal estudar os processos k Factor GARMA p, λ, u, q e SARFIMA p, d, q P, D, Q s, onde s é a sazonalidade. Para os processos k Factor GARMA p, λ, u, q , baseados no conheci- mento das freqüências de Gegenbauer, propomos estimadores da classe semi- paramétrica para o correspondente parâmetro λ. Apresentamos importantes resultados envolvendo a função densidade espectral e os coeficientes das representações auto-regressiva e média móvel destes processos. No estudo dos processos SARFIMA p, d, q P, D, Q s, demonstramos algumas propriedades destes processos, tais como a expressão da função densidade espectral, o seu comportamento próximo às freqüências sazonais, a estacionariedade, as dependências intermediária e longa, a função de autocovariância e a sua expressão assintótica. Investigamos também as condições necessárias e suficientes para a causalidade e a inversibilidade destes processos SARFIMA. Analisamos a ergodicidade e apresentamos a previsão de erro quadrático médio mínimo para estes processos. Apresentamos diversos estimadores na classe dos métodos semiparamétricos para estimar, tanto o parâmetro de diferenciação d, bem como o de diferenciação sazonal D. Na classe paramétrica, apresentamos um método que estima todos os parâmetros do processo. Propomos nova metodologia de estimação para os parâmetros d e D, os chamados estimadores robustos. Introduzimos dois métodos de contaminação por outliers, o modelo multiparamétrico e a contaminação por mistura. Através de simulações de Monte Carlo, analisamos o comportamento dos estimadores das classes semiparamétrica e paramétrica para os parâmetros do processo SARFIMA. Nestas simulações, os processos são considerados com e sem contaminação por outliers do tipo aditivo e de inovação. Apresentamos o teste de verossimilhança para detectar e identificar outliers em processos SARFIMA. Desenvolvemos um estimador para a magnitude de outliers dos tipos aditivo e de inovação. Demonstramos que este estimadoré não viciado e normalmente distribuído. Realizamos a análise da série temporal dos níveis mensais do rio Nilo, em Aswan, com e sem contaminação por outliers do tipo aditivo. / In this work we analyze some processes with long memory and seasonality properties. The main goal is to study the k Factor GARMA p, λ, u, q and SARFIMA p, d, q P, D, Q s processes, where s is the seasonality. For the k Factor GARMA p, λ, u, q process, based on the knowledge of the Gegenbauer frequencies, we propose some estimators in the semiparame- tric class for the corresponding parameter λ. We present important results related to the spectral density function and to the coefficients of the autore- gressive and moving average infinite representations for these processes. In the study of the SARFIMA p, d, q P, D, Q s processes, we prove several properties, such as its spectral density function expression and its behavior near the seasonal frequencies, the stationarity, the intermediate and long memory, the autocovariance function and its asymptotic expres- sion. We also investigate necessary and sufficient conditions for the causality and the invertibility of SARFIMA processes. We analyze the ergodicity and we present the minimum mean squared error forecasting for these processes. We present several estimators in the semiparametric class to estimate both, the degree of differencing d and the seasonal differencing parameter D. In the parametric class, we introduce one method that estimates all the process parameters. We propose a new estimation methodology for the parameters d and D, based on robustness. We introduce two methods for outliers contami- nation, the so-called multi-parametric model and the mixing contamination. Through Monte Carlo simulations, we analyze the semiparametric and pa- rametric estimators behavior for the parameters of SARFIMA processes. In these simulations, the process is considered with and without contamination by addictive and innovation outliers. We present the likelihood test to detect and to identify outliers in SARFIMA processes. We also develop one estima- tor for the outlier’s magnitude for the addictive and innovation types. We show the unbiased property and normal distribution for this estimator. We carry out the analysis on the Nile River monthly flows at Aswan time series, with and without addictive outlier contamination. Matematica : Processos estocasticos Outliers Processos sarfima
35	Estimação e previsão em processos sarfima(p, d, q) x (P, D, Q)ѕ[subscrito] na presença de outliers Bisognin, Cleber January 2007 (has links) Neste trabalho analisamos alguns processos com a propriedade de longa dependência e sazonalidade. Nosso estudo tem por objetivo principal estudar os processos k Factor GARMA p, λ, u, q e SARFIMA p, d, q P, D, Q s, onde s é a sazonalidade. Para os processos k Factor GARMA p, λ, u, q , baseados no conheci- mento das freqüências de Gegenbauer, propomos estimadores da classe semi- paramétrica para o correspondente parâmetro λ. Apresentamos importantes resultados envolvendo a função densidade espectral e os coeficientes das representações auto-regressiva e média móvel destes processos. No estudo dos processos SARFIMA p, d, q P, D, Q s, demonstramos algumas propriedades destes processos, tais como a expressão da função densidade espectral, o seu comportamento próximo às freqüências sazonais, a estacionariedade, as dependências intermediária e longa, a função de autocovariância e a sua expressão assintótica. Investigamos também as condições necessárias e suficientes para a causalidade e a inversibilidade destes processos SARFIMA. Analisamos a ergodicidade e apresentamos a previsão de erro quadrático médio mínimo para estes processos. Apresentamos diversos estimadores na classe dos métodos semiparamétricos para estimar, tanto o parâmetro de diferenciação d, bem como o de diferenciação sazonal D. Na classe paramétrica, apresentamos um método que estima todos os parâmetros do processo. Propomos nova metodologia de estimação para os parâmetros d e D, os chamados estimadores robustos. Introduzimos dois métodos de contaminação por outliers, o modelo multiparamétrico e a contaminação por mistura. Através de simulações de Monte Carlo, analisamos o comportamento dos estimadores das classes semiparamétrica e paramétrica para os parâmetros do processo SARFIMA. Nestas simulações, os processos são considerados com e sem contaminação por outliers do tipo aditivo e de inovação. Apresentamos o teste de verossimilhança para detectar e identificar outliers em processos SARFIMA. Desenvolvemos um estimador para a magnitude de outliers dos tipos aditivo e de inovação. Demonstramos que este estimadoré não viciado e normalmente distribuído. Realizamos a análise da série temporal dos níveis mensais do rio Nilo, em Aswan, com e sem contaminação por outliers do tipo aditivo. / In this work we analyze some processes with long memory and seasonality properties. The main goal is to study the k Factor GARMA p, λ, u, q and SARFIMA p, d, q P, D, Q s processes, where s is the seasonality. For the k Factor GARMA p, λ, u, q process, based on the knowledge of the Gegenbauer frequencies, we propose some estimators in the semiparame- tric class for the corresponding parameter λ. We present important results related to the spectral density function and to the coefficients of the autore- gressive and moving average infinite representations for these processes. In the study of the SARFIMA p, d, q P, D, Q s processes, we prove several properties, such as its spectral density function expression and its behavior near the seasonal frequencies, the stationarity, the intermediate and long memory, the autocovariance function and its asymptotic expres- sion. We also investigate necessary and sufficient conditions for the causality and the invertibility of SARFIMA processes. We analyze the ergodicity and we present the minimum mean squared error forecasting for these processes. We present several estimators in the semiparametric class to estimate both, the degree of differencing d and the seasonal differencing parameter D. In the parametric class, we introduce one method that estimates all the process parameters. We propose a new estimation methodology for the parameters d and D, based on robustness. We introduce two methods for outliers contami- nation, the so-called multi-parametric model and the mixing contamination. Through Monte Carlo simulations, we analyze the semiparametric and pa- rametric estimators behavior for the parameters of SARFIMA processes. In these simulations, the process is considered with and without contamination by addictive and innovation outliers. We present the likelihood test to detect and to identify outliers in SARFIMA processes. We also develop one estima- tor for the outlier’s magnitude for the addictive and innovation types. We show the unbiased property and normal distribution for this estimator. We carry out the analysis on the Nile River monthly flows at Aswan time series, with and without addictive outlier contamination. Matematica : Processos estocasticos Outliers Processos sarfima
36	Modelo de calibração com erros simétricos William Pereira Marciano, Francisco 31 January 2012 (has links) Made available in DSpace on 2014-06-12T18:06:32Z (GMT). No. of bitstreams: 2 arquivo9496_1.pdf: 688391 bytes, checksum: fd5616d6a2089d6720e7cbf7013e7cee (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2012 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Neste trabalho e considerado o problema de calibrac~ao linear simetrico. A maioria dos modelos de calibrac~ao presentes na literatura sup~oe que os erros s~ao normalmente distribu idos, no entanto, a distribuic~ao normal e extremamente sensivel a presenca de observa c~oes atipicas. O uso de distribuic~oes de caudas pesadas da classe de distribuic~oes simetricas pode ser uma soluc~ao a este tipo de problema. Distribuic~oes alternativas pertencentes a classe simetrica de distribuic~oes como suposic~ao para os erros do modelo de calibrac~ao linear com repetic~oes na variavel resposta s~ao propostas neste trabalho, alem da distribuic~ao normal, estudamos as distribuic~oes t-Student, exponencial pot^encia e logistica tipo II. A metodologia de maxima verossimilhanca e empregada para obter as estimativas dos par^ametros para cada um dos modelos em estudo. Realizamos estudos de simulac~ao para verificar o comportamento assintotico dos estimadores dos par^ametros para cada um dos modelos. Finalmente apresentamos aplicac~oes dos modelos propostos a conjuntos de dados reais Modelo de calibração linear Distribuição simetrica Outliers
37	classCleaner: A Quantitative Method for Validating Peptide Identification in LC-MS/MS Workflows Key, Melissa Chester 05 1900 (has links) Indiana University-Purdue University Indianapolis (IUPUI) / Because label-free liquid chromatography-tandem mass spectrometry (LC-MS/MS) shotgun proteomics infers the peptide sequence of each measurement, there is inherent uncertainty in the identity of each peptide and its originating protein. Removing misidentified peptides can improve the accuracy and power of downstream analyses when differences between proteins are of primary interest. In this dissertation I present classCleaner, a novel algorithm designed to identify misidentified peptides from each protein using the available quantitative data. The algorithm is based on the idea that distances between peptides belonging to the same protein are stochastically smaller than those between peptides in different proteins. The method first determines a threshold based on the estimated distribution of these two groups of distances. This is used to create a decision rule for each peptide based on counting the number of within-protein distances smaller than the threshold. Using simulated data, I show that classCleaner always reduces the proportion of misidentified peptides, with better results for larger proteins (by number of constituent peptides), smaller inherent misidentification rates, and larger sample sizes. ClassCleaner is also applied to a LC-MS/MS proteomics data set and the Congressional Voting Records data set from the UCI machine learning repository. The later is used to demonstrate that the algorithm is not specific to proteomics. class labels classification filtering outliers proteomics
38	Outlier Detection in Gaussian Mixture Models Clark, Katharine January 2020 (has links) Unsupervised classification is a problem often plagued by outliers, yet there is a paucity of work on handling outliers in unsupervised classification. Mixtures of Gaussian distributions are a popular choice in model-based clustering. A single outlier can affect parameters estimation and, as such, must be accounted for. This issue is further complicated by the presence of multiple outliers. Predicting the proportion of outliers correctly is paramount as it minimizes misclassification error. It is proved that, for a finite Gaussian mixture model, the log-likelihoods of the subset models are distributed according to a mixture of beta-type distributions. This relationship is leveraged in two ways. First, an algorithm is proposed that predicts the proportion of outliers by measuring the adherence of a set of subset log-likelihoods to a beta-type mixture reference distribution. This algorithm removes the least likely points, which are deemed outliers, until model assumptions are met. Second, a hypothesis test is developed, which, at a chosen significance level, can test whether a dataset contains a single outlier. / Thesis / Master of Science (MSc) clustering outliers model selection mixture models
39	Alguns métodos robustos para detectar outliers multivariados / Some robust methods to detect multivariate outliers Giroldo, Fabíola Rocha de Santana 07 March 2008 (has links) Observações ou outliers estão quase sempre presentes em qualquer conjunto de dados, seja ele grande ou pequeno. Isso pode ocorrer por erro no armazenamento dos dados ou por existirem realmente alguns pontos diferentes dos demais. A presença desses pontos pode causar distorções nos resultados de modelos e estimativas. Por isso, a sua detecção é muito importante e deve ser feita antes do início de uma análise mais profunda dos dados. Após esse diagnóstico, pode-se tomar uma decisão a respeito dos pontos atípicos. Uma possibilidade é corrigi-los caso tenha ocorrido erro na transcrição dos dados. Caso sejam pontos válidos, eles devem ser tratados de forma diferente dos demais, seja com uma ponderação, seja com uma análise especial. Nos casos univariado e bivariado, o outlier pode ser detectado analisando-se o gráfico de dispersão que mostra o comportamento de cada observação do conjunto de dados de interesse. Se houver pontos distantes da massa de dados, eles devem ser considerados atípicos. No caso multivariado, a detecção por meio de gráficos torna-se um pouco mais complexa porque a análise deveria ser feita observando-se duas variáveis por vez, o que tornaria o processo longo e pouco confiável, pois um ponto pode ser atípico com relação a algumas variáveis e não ser com relação a outras, o que faria com que o resultado ficasse mascarado. Neste trabalho, alguns métodos robustos para detecção de outliers em dados multivariados são apresentados. A aplicação de cada um dos métodos é feita para um exemplo. Além disso, os métodos são comparados de acordo com o resultado que cada um apresentar para o exemplo em questão e via simulação. / Unusual observations or outliers are frequent in any data set, if it is large or not. Outliers may occur by typing mistake or by the existence of observations that are really different from the others. The presence of this observations may distort the results of models and estimates. Therefore, their detection is very important and it is recommended to be performed before any detailed analysis, when a decision can be taken about these atypical observations. A possibility is to correct these observations if the problem occurred with the construction of the data set. If the observations are correct, different strategies can be adopted, with some weights or with special analysis. In univariate and bivariate data sets, outliers can be detected analyzing the scatter plot. Observations distant from the cloud formed by the data set are considered unusual. In multivariate data sets, the detection of outliers using graphics is more difficult because we have to analyse a couple of variables each time, which results is a long and less reliable process because we can find an observation that is unusual for one variable and not unusual for the others, masking the results. In this work, some robust methods for detection of multivariate outliers are presented. The application of each one is done for an example. Moreover, the methods are compared by the results of each one in the example and by simulation. dados multivariados métodos robustos multivariate data multivariate outliers outliers multivariados robust methods
40	Proposta de ajustamento para melhoria da confiabilidade e precisão dos pontos de rede geodésicas para fins topográficos locais / Adjustment proposal for improving of the reliability and precision of geodetic network points for local Santos, Antonio José Prado Martins 06 March 2006 (has links) Em levantamentos geodésicos planialtimétrico se faz necessário conhecer a qualidade das coordenadas estimadas de acordo com o tipo de aplicação a que se destinam. Este trabalho mostra de modo didático o estudo das teorias de análise de qualidade de rede GPS, baseando-se nas teorias de confiabilidade de rede propostos por Baarda, em 1968. As hipóteses estatísticas são fundamentais para elaboração dos testes para detecção de erros grosseiros (outliers), que constitui a base para a análise da confiabilidade de rede. Neste trabalho são propostas três estratégias, desenvolvidas em MathCAD, para a análise da qualidade do ajustamento. Os resultados obtidos foram comparados com os dos programas comerciais, Ski-Pro e Ashtech Solution, e também validados por medidas de campo feitas com estação total. As três estratégias propostas, para a rede em estudo implantada no Campus II da USP, apresentaram bons resultados / Geodetic planimetric survey requires the knowledge of the coordinates quality, estimated according to the final application. This work shows a didactic way on the study on theoretical analyses on quality of GPS networks, based on reliability network proposed by Baarda in 1968. Statistical hypotheses are fundamental to development of outliers detection tests, which consists the base for network reliability. In this work, three strategies are proposed, developed in MathCAD, to analyze adjustment quality. The results were compared with the results of two commercial programs, Ski-Pro and Ashtech Solution, and also field validation measurements with total station. The three proposed strategy, applied on a pilot network located at the Campus II of USP, gave good results confiabilidade geodetic networks modelo paramétrico outliers outliers parametric model redes geodésicas reliability

Search results