Global ETD Search

261	Misturas finitas de misturas de escala skew-normal / Mixtures modelling using scale mixtures of skew-normal distribution Basso, Rodrigo Marreiro 03 December 2009 (has links) Orientador: Victor Hugo Lachos Davila / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-13T07:03:11Z (GMT). No. of bitstreams: 1 Basso_RodrigoMarreiro_M.pdf: 3130269 bytes, checksum: 85e95beb812a4ec069f39f8b9c79681a (MD5) Previous issue date: 2009 / Resumo: Nesse trabalho será considerada uma classe flexível de modelos usando misturas finitas de distribuições da classe de misturas de escala skew-normal. O algoritmo EM é empregado para se obter estimativas de máxima verossimilhança de maneira iterativa, sendo discutido com maior ênfase para misturas de distribuições skew-normal, skew-t, skew-slash e skew-normal contaminada. Também será apresentado um método geral para aproximar a matrix de covariância assintótica das estimativas de máxima verossimilhança. Resultados obtidos da análise de quatro conjuntos de dados reais ilustram a aplicabilidade da metodologia proposta / Abstract: In this work we consider a flexible class of models using finite mixtures of multivariate scale mixtures of skew-normal distributions. An EM-type algorithm is employed for iteratively computing maximum likelihood estimates and this is discussed with emphasis on finite mixtures of skew-normal, skew-t, skew-slash and skew-contaminated normal distributions. A general information-based method for approximating the asymptotic covariance matrix of the maximum likelihood estimates is also presented. Results obtained from the analysis of four real data sets are reported illustrating the usefulness of the proposed methodology / Mestrado / Mestre em Estatística Algoritmos de esperança-maximização Distribuição (Probabilidades) Misturas finitas Distribuição normal assimétrica Misturas de escala (Estatística) Expectation-maximization algorithms Distribution (Probability) Finite mixtures Skew-normal distribution Scale mixtures
262	Analise de confiabilidade em fadiga : estudo de caso : braço de controle de suspensão automotiva / Fadigue reliability analusis : case study automotive suspension control arm Alves, Clever Gama 15 July 2008 (has links) Orientador: Itamar Ferreira / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Mecanica / Made available in DSpace on 2018-08-11T17:15:29Z (GMT). No. of bitstreams: 1 Alves_CleverGama_M.pdf: 6160446 bytes, checksum: 5afa2cd3848388247de70ceee21a3cf8 (MD5) Previous issue date: 2008 / Resumo: O presente trabalho descreve um procedimento de aprovação de um braço de controle de suspensão automotiva sujeito a fadiga de alto ciclo, ao mesmo tempo em que propõe uma sistemática alternativa de validação baseada em conceitos e teorias estatísticas de confiabilidade. Nesse aspecto, a pesquisa não só avalia o procedimento seguido pelo fabricante, como também executa comparações gráfico-analíticas de distribuições probabilísticas (normal, lognormal e Weibull) a fim de caracterizar a massa de dados completos e suspensos obtidos em ensaios acelerados de bancada. Um espaço amostral constituído por quatro observações completas da configuração final da peça e oito da inicial, complementado por doze dados suspensos, foi usado para determinar os parâmetros dos modelos. Essa análise levou à escolha do modelo de Weibull bi-paramétrico para o tempo até a falha para as duas configurações em foco. A estimação final dos parâmetros foi feita pelo método da máxima verossimilhança, o qual superou um método alternativo específico para Weibull na comparação com a distribuição referencial de categoria. Dessa forma, calculou-se o ganho efetivo em confiabilidade conseguido com o esforço adicional de desenvolvimento da peça. O teste de hipóteses de Kruskal-Wallis permitiu concluir que as duas configurações realmente possuem performances de durabilidade diferentes. É notável o ganho em confiabilidade obtido por meio das mudanças que levaram à configuração final: em um universo de um milhão de peças, o número de falhas esperadas aos 30.000 ciclos caiu de 96.384 para 5 partes por milhão / Abstract: This dissertation aims at describing a procedure for approval of a suspension control arm subjected to high-cycle fatigue and, simultaneously, at proposing a validation alternative method based on reliability concepts and statistical theories. In that manner, the research provides not only an assessment of the procedure followed by the manufacturer, but also analytical and graphical comparisons of probabilistic distributions (normal, lognormal, Weibull) in order to characterize the set of complete and suspended data from bench accelerated tests. A sample space comprised by four complete final configuration observations and eight complete primary configuration ones, in addition to twelve suspended figures, was the basis for determining the model parameters. Such an analysis led to choose the bi-parametric Weibull for both focused configurations¿ time to failure. The ultimate estimation of the parameters was performed through the maximum likelihood method, which beat a specific alternative method for Weibull when compared with the referential category distribution. Thus, the effective gain in reliability resulting from the product development additional effort was calculated. The Kruskal-Wallis hypothesis testing guided the conclusion that the two configurations actually have different durability performances. It is impressive the gain in reliability brought by the changes that led towards the final configuration: taking an amount of one million parts into consideration, the expected number of failures at 30,000 cycles dropped from 96,384 to 5 parts per million / Mestrado / Materiais e Processos de Fabricação / Mestre em Engenharia Mecânica Distribuição (Probabilidades) Confiabilidade (Engenharia) Durabilidade (Engenharia) Aço - Fadiga Automoveis - Molas e suspensão Distribution (Probability theory) Reliability Durability Steel - Fatigue Automobiles - Suspension Weibull
263	Extensões da distribuição gama generalizada: propriedades e aplicações / Extensions of the generalized gamma distribution: properties and applications Marcelino Alves Rosa de Pascoa 25 April 2012 (has links) A distribuição gama generalizada (GG) possui, como casos particulares, distribuição Weibull, log-normal, gama, qui-quadrado, entre outras. Por essa razão, ela e considerada uma distribuição exvel no ajuste dos dados. A ideia de Cordeiro e Castro (2011) foi utilizada para o desenvolvimento de duas novas distribuições de probabilidade a partir da distribuição GG. Uma delas e denominada de Kumaraswamy gama generalizada (KumGG) e possui cinco parâmetros; a outra distribuição e uma modificação de um dos parmetros de forma da distribuição KumGG e foi denominada de distribuição Kumaraswamy gama generalizada estendida (KumGGE). Desenvolveu-se o modelo de regressão log-Kumaraswamy gama generalizada estendida. Alem disso, a ideia de Adamidis e Loukas (1998) para modicar distribuições foi utilizada para a distribuição GG; essa nova distribuição foi nomeada de gama generalizada geometrica (GGG). A vantagem desses novos modelos reside na capacidade de acomodar varias formas da função risco eles tambem se mostraram uteis na discriminação de modelos. Para cada um dos modelos foram calculados os momentos, função geradora de momentos, os desvios medios, a conabilidade e a função densidade de probabilidade da estatistica de ordem. Para a estimação dos parâmetros, foram utilizados os metodos de maxima verossimilhanca e bayesiano e, finalmente, para ilustrar a aplicação das novas distribuições foram analisados alguns conjuntos de dados reais. / The generalized gamma (GG) distribution has as particular cases the Weibull, log-normal, gamma and Chi-square distributions, among others. For this reason, it is considered a exible distribution for tting data. In this paper, the idea of Cordeiro and Castro (2011) is used to develop two new probability distributions based on the GG distribution. The rst is called the generalized gamma Kumaraswamy (KumGG) and has ve parameters, while the other involves a modication of one of the shape parameters of the KumGG distribution and is called the extended generalized gamma Kumaraswamy (KumGGE). Based in these, we develop the extended generalized log-Kumaraswamy regression model. Besides this, we employ the idea regarding modifying distributions of Adamidis and Loukas (1998) for the GG distribution, calling this new distribution the geometric generalized gamma (GGG). The advantage of these new models rests in their capacity to accommodate various risk function forms. They are also useful in model discrimination. We calculate the moments, moments generating function, mean deviations, reliability and probability density function of the order statistics. To estimate the parameters we use the maximum likelihood and Bayesian methods. Finally, to illustrate the application of the new distributions, we analyze some real data sets. Análise de sobrevivência Dados censurados Distribuições (Probabilidade) Modelos matemáticos Regressão linear Verossimilhança Censored data Distribution (probability) Likelihood Linear regression Mahematical models Survival analysis
264	Modelo de regressão para dados com censura intervalar e dados de sobrevivência grupados / Regression model for interval-censored data and grouped survival data Elizabeth Mie Hashimoto 04 February 2009 (has links) Neste trabalho foi proposto um modelo de regressão para dados com censura intervalar utilizando a distribuição Weibull-exponenciada, que possui como característica principal a função de taxa de falha que assume diferentes formas (unimodal, forma de banheira, crescente e decrescente). O atrativo desse modelo de regressão é a sua utilização para discriminar modelos, uma vez que o mesmo possui como casos particulares os modelos de regressão Exponencial, Weibull, Exponencial-exponenciada, entre outros. Também foi estudado um modelo de regressão para dados de sobrevivência grupados na qual a abordagem é fundamentada em modelos de tempo discreto e em tabelas de vida. A estrutura de regressão representada por uma probabilidade é modelada adotando-se diferentes funções de ligação, tais como, logito, complemento log-log, log-log e probito. Em ambas as pesquisas, métodos de validação dos modelos estatísticos propostos são descritos e fundamentados na análise de sensibilidade. Para detectar observações influentes nos modelos propostos, foram utilizadas medidas de diagnóstico baseadas na deleção de casos, denominadas de influência global e medidas baseadas em pequenas perturbações nos dados ou no modelo proposto, denominada de influência local. Para verificar a qualidade de ajuste do modelo e detectar pontos discrepantes foi realizada uma análise de resíduos nos modelos propostos. Os resultados desenvolvidos foram aplicados a dois conjuntos de dados reais. / In this study, a regression model for interval-censored data were developed, using the Exponentiated- Weibull distribution, that has as main characteristic the hazard function which assumes different forms (unimodal, bathtub shape, increase, decrease). A good feature of that regression model is their use to discriminate models, that have as particular cases, the models of regression: Exponential, Weibull, Exponential-exponentiated, amongst others. Also a regression model were studied for grouped survival data in which the approach is based in models of discrete time and in life tables, the regression structure represented by a probability is modeled through the use of different link function, logit, complementary log-log, log-log or probit. In both studies, validation methods for the statistical models studied are described and based on the sensitivity analysis. To find influential observations in the studied models, diagnostic measures were used based on case deletion, denominated as global influence and measures based on small perturbations on the data or in the studied model, denominated as local influence. To verify the goodness of fitting of the model and to detect outliers it was performed residual analysis for the proposed models. The developed results were applied to two real data sets. Análise de regressão e correlação Análise de sobrevivência Boostrap Jackkinife re-amostragem Dados censurados Distribuições (Probabilidade) Verosimilhança. Censored data Correlation and regression analysis Distribution (Probability) Likelihood. Resampling Bootstrap Jackknife Survival analysis
265	Atributos ecofisiológicos do híbrido DKB-390 e modelo estocástico para previsão da produtividade de grãos / Ecophysiological attributes of hybrid DKB-390 and sthocastic model for predicting grain productivity Euro Roberto Detomini 02 April 2008 (has links) O milho é uma das culturas mais importantes do mundo, pois os produtos dele oriundos são largamente utilizados na indústria de amidos, na alimentação animal e humana, e também na produção de energia proveniente de biomassa. Por esse motivo, há sempre um grande interesse em conhecer a potencialidade de uso dos principais materiais genéticos disponíveis em relação aos ambientes em que serão inseridos. Este trabalho teve como objetivo central caracterizar, para o genótipo DKB-390 conduzido sob condição irrigada, atributos ecofisiológicos como área foliar, eficiência de uso da radiação, coeficiente de extinção, coeficientes de cultura, consumo hídrico e componentes de espiga; bem como conceitualizar modelos norteadores de manejo e de planejamento para cultura do milho, no intuito de obter a produtividade de grãos contemplada pelas incertezas climáticas diárias dos principais elementos do clima e suas correlações, para posteriormente se obter as correspondentes necessidades de água e de nitrogênio pela cultura. Para tanto, um experimento de campo foi conduzido, informações da literatura foram revisadas e levantadas, e modelos de previsão foram concebidos para a produtividade de grãos e para as demais variáveis de interesse. Como principais resultados, obteve-se: (i) sob condições adequadas de suprimento hídrico e de nitrogênio, o híbrido DKB-390 requer cerca de 573 litros de água para kg de grão que produz; (ii) o genótipo responde significativamente à segunda cobertura com nitrogênio, caso a cultura seja conduzida sob elevada população de plantas e adequado suprimento hídrico; (iii) a segunda cobertura com nitrogênio promoveu melhor manutenção da área foliar durante a fase de enchimento de grãos; (iv) o incremento da segunda cobertura de nitrogênio promoveu maior eficiência de uso da água pela cultura, bem como um leve aumento nos valores modais do número de grãos por fileira (da espiga) e da massa de 1000 grãos; (v) sob condições de adequado suprimento hídrico, o coeficiente de extinção médio, generalizado para todo o ciclo, é da ordem de 0,4267; valor que tende a ser maior na medida em que o suprimento de nitrogênio é menor; (vi) a eficiência de uso da radiação foi calculada em 3,52 g (fitomassa seca de parte aérea) MJ-1 (radiação solar fotossinteticamente ativa interceptada), tendo sido menor em função do emprego do regime de nitrogênio mais restritivo; (vii) os coeficientes de cultura obtidos do experimento podem ser utilizados para o manejo da irrigação do híbrido DKB-390, para os principais subperíodos, para que a produtividade não seja penalizada por déficit hídrico; (viii) o índice de colheita (expresso em relação à parte aérea) foi da ordem de 40% (variando entre 37% e 43%) sob condições de suprimento adequado de água e nitrogênio, valores que tenderam a ser maiores quando da restrição da segunda cobertura; (ix) o modelo determinístico proposto simulou adequadamente a evolução da produtividade de fitomassa de parte aérea do híbrido empregado, bem como sua produtividade de grãos sob adequadas condições de suprimento hídrico e de nitrogênio; (x) o modelo determinístico simulou adequadamente as evapotranspirações diárias o consumo hídrico através do método de Penman-Monteith; (xi) o modelo estocástico sugerido mostrou-se satisfatório, mediante o uso da distribuição normal bivariada das variáveis radiação solar e temperatura média do ar, para simular a produtividade de grãos sob condições de suprimento hídrico adequado e sob déficit moderado; e (xii) aparentemente, o modelo estocástico necessita ser melhorado quanto à capacidade de previsão das necessidades hídricas e de nitrogênio, pois tende claramente a subestimar as primeiras e superestimar as segundas. / Maize is on of the world most important crops, given that the products generated from this cereal are largely used by sectors like starch industry, animal and human nutrition, as well as biomass energy production and refineries. For these reasons, there is frequently a huge interest in knowing the potential adoption of the main available genotypes in relation to the environment in which they will be supposedly subjected. Considering the hybrid DKB-390 under full irrigated conditions, this work has as the central objective to characterize the most important ecophysiological attributes such as leaf area, radiation use efficiency, extinction coefficient, crop coefficients, water use and ear yield components. Additionaly, specif goals were to conceptualize models applicable for both management and planning of maize crops in order to predict the grain productivity contemplated by daily climate incertainties of the driven climate variables (i.e. radiation and temperature) and their correlation, then to achieve the water and nitrogen requirement corresponding to the predicted productivity. A field experiment was carried out, useful information from literature were obtained and reviewed, and models were created towards to support the prediction tools. The following outcomes might be highligthed: (i) under suitable conditions of both nitrogen and water supply, hybrid DKB-390 requires about 573 litters of water per each kilogram of produced grain; (ii) the genotype is significantly responsive to the second nitrogen covering when growing under high plant population and suitable water supply; (iii) the second nitrogen covering has enhanced better leaf area maintainance during grain filling stage; (iv) the second nitrogen covering has led to a better water use efficiency, as well as slightly increased modal values of the number of kernels per row (of ear) and the mass of a thousand kernels; (v) under suitable water supply, averaged extinction coefficient might be generalized as 0.4267 throughout the whole cycle, whereas tending to be higher as the nitrogen supply is restricted; (vi) the radiation use efficiency as calculated as 3.52 g (above-ground dry matter) MJ-1 (intercepted photossyntheticaly active radiation), being smaller as the nitrogen supply is restricted; (vii) some crop coefficients were found for the main phenological stages and may be adopted for irrigation management of hybrid DKB-390, when one aims to not deplet the productivity; (viii) the harvest index (above-ground based) was found about 40% (varying from 37% to 43%) if water and nitrogen are added sufficiently, and is likely to be higher provided that the second covering is not done; (ix) the proposed determinist model has performed well when simulating above-ground dry matter time course and its corresponding grain productivity under full and moderated water deficit conditions; (x) by using Penman-Montheit method, the deterministic model apparently simulates well both daily evapotranspiration and water uses; (xi) through bivariate normal distribution of averaged daily solar radiation and air temperature, the suggested stochastic model has simulated grain productivity in a satisfactory way; and (xii) the suggested stochastic model need to be improved in terms of its water and nitrogen requirement predictability, given that it clearly tends to underestimate the former and overestimate the latter. Agrometeorologia Balanço hídrico Distribuição (probabilidade) Ecofisiologia vegetal Milho Modelagem matemática Simulação estatística. Agrometeorology Crop ecophysiology Distribution (probability) Maize Mathematical modelling Statistic simulation. Water balance
266	Função de acoplamento t-Student assimetrica : modelagem de dependencia assimetrica / Skewed t-Student copula function : skewed dependence modelling Busato, Erick Andrade 12 March 2008 (has links) Orientador: Luiz Koodi Hotta / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-12T14:00:24Z (GMT). No. of bitstreams: 1 Busato_ErickAndrade_M.pdf: 4413458 bytes, checksum: b9c4c39b4639c19e685bae736fc86c4f (MD5) Previous issue date: 2008 / Resumo: A família de distribuições t-Student Assimétrica, construída a partir da mistura em média e variância da distribuição normal multivariada com a distribuição Inversa Gama possui propriedades desejáveis de flexibilidade para as mais diversas formas de assimetria. Essas propriedades são exploradas na construção de funções de acoplamento que possuem dependência assimétrica. Neste trabalho são estudadas as características e propriedades da distribuição t-Student Assimétrica e a construção da respectiva função de acoplamento, fazendo-se uma apresentação de diferentes estruturas de dependência que pode originar, incluindo assimetrias da dependência nas caudas. São apresentados métodos de estimação de parâmetros das funções de acoplamento, com aplicações até a terceira dimensão da cópula. Essa função de acoplamento é utilizada para compor um modelo ARMA-GARCHCópula com marginais de distribuição t-Student Assimétrica, que será ajustado para os logretornos de preços do Petróleo e da Gasolina, e log-retornos do Índice de Óleo AMEX, buscando o melhor ajuste, principalmente, para a dependência nas caudas das distribuições de preços. Esse modelo será comparado, através de medidas de Valor em Risco e AIC, além de outras medidas de bondade de ajuste, com o modelo de Função de Acoplamento t-Student Simétrico. / Abstract: The Skewed t-Student distribution family, constructed upon the multivariate normal mixture distribution, known as mean-variance mixture, composed with the Inverse-Gamma distribution, has many desirable flexibility properties for many distribution asymmetry structures. These properties are explored by constructing copula functions with asymmetric dependence. In this work the properties and characteristics of the Skewed t-Student distribution and the construction of a respective copula function are studied, presenting different dependence structures that the copula function generates, including tail dependence asymmetry. Parameter estimation methods are presented for the copula, with applications up to the 3rd dimension. This copula function is used to compose an ARMAGARCH- Copula model with Skewed t-Student marginal distribution that is adjusted to logreturns of Petroleum and Gasoline prices and log-returns of the AMEX Oil Index, emphasizing the return's tail distribution. The model will be compared, by the means of the VaR (Value at Risk) and Akaike's Information Criterion, along with other Goodness-of-fit measures, with models based on the Symmetric t-Student Copula. / Mestrado / Mestre em Estatística Cópulas (Estatística matemática) Risco (Economia) - Modelos matemáticos Distribuição (Probabilidades) Análise multivariada Copulas (Mathematical statistics) Risk (Economics) - Mathematical models Distribution (Probability) Multivariate analysis
267	Modelo de regressão Birnbaum-Saunders bivariado / Bivariate Birnbaum-Saunders regression model Romeiro, Renata Guimarães, 1987- 24 August 2018 (has links) Orientador: Filidor Edilfonso Vilca Labra / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-24T16:29:00Z (GMT). No. of bitstreams: 1 Romeiro_RenataGuimaraes_M.pdf: 10761224 bytes, checksum: 3606332b6846c959d076e318f1667133 (MD5) Previous issue date: 2014 / Resumo: O modelo de regressão Birnbaum-Saunders de Rieck e Nedelman (1991) tem sido amplamente discutido por vários autores, com aplicações na área de sobrevivência e confiabilidade. Neste trabalho, desenvolvemos um modelo de regressão Birnbaum-Saunders bivariado através do uso da distribuição Senh-Normal proposta por Rieck (1989). Este modelo de regressão pode ser utilizado para analisar logaritmos de tempos de vida de duas unidades correlacionadas, e gera marginais correspondentes aos modelos de regressão Birnbaum-Saunders univariados. Apresentamos um estudo de inferência e análise de diagnóstico para modelo de regressão Birnbaum-Saunders bivariado proposto. Em primeiro lugar, apresentamos os estimadores obtidos através do método dos momentos e de máxima verossimilhança, e a matriz de informação observada de Fisher. Além disso, discutimos testes de hipóteses com base na normalidade assintótica dos estimadores de máxima verossimilhança. Em segundo lugar, desenvolvemos um método de diagnóstico para o modelo de regressão Birnbaum- Saunders bivariado baseado na metodologia de Cook (1986). Finalmente, apresentamos alguns resultados de estudos de simulações e aplicações em dados reais / Abstract: The Birnbaum-Saunders regression model of Rieck and Nedelman (1991) has been extensively discussed by various authors with application in survival and reliability studies. In this work a bivariate Birnbaum-Saunders regression model is developed through the use of Sinh-Normal distribution proposed by Rieck (1989). This bivariate regression model can be used to analyze correlated log-time of two units, it bivariate regression model has its marginal as the Birnbaum- Saunders regression model. For the bivariate Birnbaum-Saunders regression model is discussed some of its properties, in the moment estimation, the maximum likelihood estimation and the observed Fisher information matrix. Hypothesis testing is performed by using the asymptotic normality of the maximum-likelihood estimators. Influence diagnostic methods are developed for this model based on the Cook¿s(1986) approach. Finally, the results of a simulation study as well as an application to a real data set are presented / Mestrado / Estatistica / Mestra em Estatística Birnbaum-Saunders, Distribuição de Análise de regressão Distribuição (Probabilidades) Testes de hipóteses estatísticas Verossimilhança (Estatística) Birnbaum-Saunders distribution Regression analysis Distribution (Probability theory) Statistical hypothesis Likelihood (Statistic)
268	Contributions to robust methods in nonparametric frontier models Bruffaerts, Christopher 10 September 2014 (has links) Les modèles de frontières sont actuellement très utilisés par beaucoup d’économistes, gestionnaires ou toute personne dite « decision-maker ». Dans ces modèles de frontières, le but du chercheur consiste à attribuer à des unités de production (des firmes, des hôpitaux ou des universités par exemple) une mesure de leur efficacité en terme de production. Ces unités (dénotées DMU-Decision-Making Units) utilisent-elles à bon escient leurs « inputs » et « outputs »? Font-elles usage de tout leur potentiel dans le processus de production? <p>L’ensemble de production est l’ensemble contenant toutes les combinaisons d’inputs et d’outputs qui sont physiquement réalisables dans une économie. De cet ensemble contenant p inputs et q outputs, la notion d’efficacité d ‘une unité de production peut être définie. Celle-ci se définie comme une distance séparant le DMU de la frontière de l’ensemble de production. A partir d’un échantillon de DMUs, le but est de reconstruire cette frontière de production afin de pouvoir y évaluer l’efficacité des DMUs. A cette fin, le chercheur utilise très souvent des méthodes dites « classiques » telles que le « Data Envelopment Analysis » (DEA).<p><p>De nos jours, le statisticien bénéficie de plus en plus de données, ce qui veut également dire qu’il n’a pas l’opportunité de faire attention aux données qui font partie de sa base de données. Il se peut en effet que certaines valeurs aberrantes s’immiscent dans les jeux de données sans que nous y fassions particulièrement attention. En particulier, les modèles de frontières sont extrêmement sensibles aux valeurs aberrantes et peuvent fortement influencer l’inférence qui s’en suit. Pour éviter que certaines données n’entravent une analyse correcte, des méthodes robustes sont utilisées.<p><p>Allier le côté robuste au problème d’évaluation d’efficacité est l’objectif général de cette thèse. Le premier chapitre plante le décor en présentant la littérature existante dans ce domaine. Les quatre chapitres suivants sont organisés sous forme d’articles scientifiques. <p>Le chapitre 2 étudie les propriétés de robustesse d’un estimateur d’efficacité particulier. Cet estimateur mesure la distance entre le DMU analysé et la frontière de production le long d’un chemin hyperbolique passant par l’unité. Ce type de distance très spécifique s’avère très utile pour définir l’efficacité de type directionnel. <p>Le chapitre 3 est l’extension du premier article au cas de l’efficacité directionnelle. Ce type de distance généralise toutes les distances de type linéaires pour évaluer l’efficacité d’un DMU. En plus d’étudier les propriétés de robustesse de l’estimateur d’efficacité de type directionnel, une méthode de détection de valeurs aberrantes est présentée. Celle-ci s’avère très utile afin d’identifier les unités de production influençantes dans cet espace multidimensionnel (dimension p+q). <p>Le chapitre 4 présente les méthodes d’inférence pour les efficacités dans les modèles nonparamétriques de frontière. En particulier, les méthodes de rééchantillonnage comme le bootstrap ou le subsampling s’avère être très utiles. Dans un premier temps, cet article montre comment améliorer l’inférence sur les efficacités grâce au subsampling et prouve qu’il n’est pas suffisant d’utiliser un estimateur d’efficacité robuste dans les méthodes de rééchantillonnage pour avoir une inférence qui soit fiable. C’est pourquoi, dans un second temps, cet article propose une méthode robuste de rééchantillonnage qui est adaptée au problème d’évaluation d’efficacité. <p>Finalement, le dernier chapitre est une application empirique. Plus précisément, cette analyse s’intéresse à l ‘efficacité des universités américaines publiques et privées au niveau de leur recherche. Des méthodes classiques et robustes sont utilisées afin de montrer comment tous les outils étudiés précédemment peuvent s’appliquer en pratique. En particulier, cette étude permet d’étudier l’impact sur l’efficacité des institutions américaines de certaines variables telles que l’enseignement, l’internationalisation ou la collaboration avec le monde de l’industrie.<p> / Doctorat en sciences, Orientation statistique / info:eu-repo/semantics/nonPublished Mathématiques Sciences exactes et naturelles Nonparametric statistics Resampling (Statistics) Distribution (Probability theory) Statistique non-paramétrique Rééchantillonnage (Statistique) Frontier models Nonparametric DEA Robustness
269	Quantile-based inference and estimation of heavy-tailed distributions Dominicy, Yves 18 April 2014 (has links) This thesis is divided in four chapters. The two first chapters introduce a parametric quantile-based estimation method of univariate heavy-tailed distributions and elliptical distributions, respectively. If one is interested in estimating the tail index without imposing a parametric form for the entire distribution function, but only on the tail behaviour, we propose a multivariate Hill estimator for elliptical distributions in chapter three. In the first three chapters we assume an independent and identically distributed setting, and so as a first step to a dependent setting, using quantiles, we prove in the last chapter the asymptotic normality of marginal sample quantiles for stationary processes under the S-mixing condition.<p><p><p>The first chapter introduces a quantile- and simulation-based estimation method, which we call the Method of Simulated Quantiles, or simply MSQ. Since it is based on quantiles, it is a moment-free approach. And since it is based on simulations, we do not need closed form expressions of any function that represents the probability law of the process. Thus, it is useful in case the probability density functions has no closed form or/and moments do not exist. It is based on a vector of functions of quantiles. The principle consists in matching functions of theoretical quantiles, which depend on the parameters of the assumed probability law, with those of empirical quantiles, which depend on the data. Since the theoretical functions of quantiles may not have a closed form expression, we rely on simulations.<p><p><p>The second chapter deals with the estimation of the parameters of elliptical distributions by means of a multivariate extension of MSQ. In this chapter we propose inference for vast dimensional elliptical distributions. Estimation is based on quantiles, which always exist regardless of the thickness of the tails, and testing is based on the geometry of the elliptical family. The multivariate extension of MSQ faces the difficulty of constructing a function of quantiles that is informative about the covariation parameters. We show that the interquartile range of a projection of pairwise random variables onto the 45 degree line is very informative about the covariation.<p><p><p>The third chapter consists in constructing a multivariate tail index estimator. In the univariate case, the most popular estimator for the tail exponent is the Hill estimator introduced by Bruce Hill in 1975. The aim of this chapter is to propose an estimator of the tail index in a multivariate context; more precisely, in the case of regularly varying elliptical distributions. Since, for univariate random variables, our estimator boils down to the Hill estimator, we name it after Bruce Hill. Our estimator is based on the distance between an elliptical probability contour and the exceedance observations. <p><p><p>Finally, the fourth chapter investigates the asymptotic behaviour of the marginal sample quantiles for p-dimensional stationary processes and we obtain the asymptotic normality of the empirical quantile vector. We assume that the processes are S-mixing, a recently introduced and widely applicable notion of dependence. A remarkable property of S-mixing is the fact that it doesn't require any higher order moment assumptions to be verified. Since we are interested in quantiles and processes that are probably heavy-tailed, this is of particular interest.<p> / Doctorat en Sciences économiques et de gestion / info:eu-repo/semantics/nonPublished Economie Finance -- Econometric models Distribution (Probability theory) Estimation theory Finances -- Modèles économétriques Théorie de l'estimation Tail index Quantiles Simulation Elliptical distributions Heavy-tailed distributions Estimation
270	Modelos de regressão beta retangular heteroscedásticos aumentados em zeros e uns / Zero-one augmented heteroscedastic rectangular beta regression models Silva, Ana Roberta dos Santos, 1989- 26 August 2018 (has links) Orientador: Caio Lucidius Naberezny Azevedo / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-26T19:30:15Z (GMT). No. of bitstreams: 1 Silva_AnaRobertadosSantos_M.pdf: 4052475 bytes, checksum: 08fb6f3f7b4ed838df4eea2dbcf06a29 (MD5) Previous issue date: 2015 / Resumo: Neste trabalho desenvolvemos a distribuição beta retangular aumentada em zero e um, bem como um correspondente modelo de regressão beta retangular aumentado em zero e um para analisar dados limitados-aumentados (representados por variáveis aleatórias mistas com suporte limitado), que apresentam valores discrepantes. Desenvolvemos ferramentas de inferência sob as abordagens bayesiana e frequentista. No que diz respeito à inferência bayesiana, devido à impossibilidade de obtenção analítica das posteriores de interesse, utilizou-se algoritmos MCMC. Com relação à estimação frequentista, utilizamos o algoritmo EM. Desenvolvemos técnicas de análise de resíduos, utilizando o resíduo quantil aleatorizado, tanto sob o enfoque frequentista quanto bayesiano. Desenvolvemos, também, medidas de influência, somente sob o enfoque bayesiano, utilizando a medida de Kullback Leibler. Além disso, adaptamos métodos de checagem preditiva à posteriori existentes na literatura, ao nosso modelo, utilizando medidas de discrepância apropriadas. Para a comparação de modelos, utilizamos os critérios usuais na literatura, como AIC, BIC e DIC. Realizamos diversos estudos de simulação, considerando algumas situações de interesse prático, com o intuito de comparar as estimativas bayesianas com as frequentistas, bem como avaliar o comportamento das ferramentas de diagnóstico desenvolvidas. Um conjunto de dados da área psicométrica foi analisado para ilustrar o potencial do ferramental desenvolvido / Abstract: In this work we developed the zero-one augmented rectangular beta distribution, as well as a correspondent zero-one augmented rectangular beta regression model to analyze limited-augmented data (represented by mixed random variables with limited support), which present outliers. We develop inference tools under the Bayesian and frequentist approaches. Regarding to the Bayesian inference, due the impossibility of obtaining analytically the posterior distributions of interest, we used MCMC algorithms. Concerning the frequentist estimation, we use the EM algorithm. We develop techniques of residual analysis, by using the randomized quantile residuals, under both frequentist and Bayesian approaches. We also developed influence measures, only under the Bayesian approach, by using the measure of Kullback Leibler. In addition, we adapt methods of posterior predictive checking available in the literature, to our model, using appropriate discrepancy measures. For model selection, we use the criteria commonly employed in the literature, such as AIC, BIC and DIC. We performed several simulation studies, considering some situations of practical interest, in order to compare the Bayesian and frequentist estimates, as well as to evaluate the behavior of the developed diagnostic tools. A psychometric real data set was analyzed to illustrate the performance of the developed tools / Mestrado / Estatistica / Mestra em Estatística Inferência bayesiana Inferencia estatistica Distribuição (Probabilidades) Modelos lineares generalizados Dados de proporção Bayesian inference Statistical inference Distribution (Probability theory) Generalized linear models Proportional data

Search results