• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 30
  • 4
  • Tagged with
  • 36
  • 36
  • 17
  • 17
  • 15
  • 11
  • 11
  • 10
  • 9
  • 8
  • 7
  • 7
  • 7
  • 7
  • 6
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Testes de Independência "Distribution-Free"

Rocha, Loyane Christina Soares 02 July 2014 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2014. / Submitted by Larissa Stefane Vieira Rodrigues (larissarodrigues@bce.unb.br) on 2014-10-24T13:41:32Z No. of bitstreams: 1 2014_LoyaneChristinaSoaresRocha.pdf: 3190724 bytes, checksum: e656867872b59e12b28939a4ef274bf6 (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2014-10-31T09:59:32Z (GMT) No. of bitstreams: 1 2014_LoyaneChristinaSoaresRocha.pdf: 3190724 bytes, checksum: e656867872b59e12b28939a4ef274bf6 (MD5) / Made available in DSpace on 2014-10-31T09:59:32Z (GMT). No. of bitstreams: 1 2014_LoyaneChristinaSoaresRocha.pdf: 3190724 bytes, checksum: e656867872b59e12b28939a4ef274bf6 (MD5) / Este trabalho trata de testes estatísticos não paramétricos para a detecção de dependência não-linear entre duas variáveis. Estudos de Monte Carlo foram realizados para avaliar e comparar o desempenho de testes do tipo distribution-free. Foram considerados testes que se baseiam no critério de Cramér-von Mises e também uma variação do teste de Kolmogorov-Smirnov (KS). Os resultados mostram que o teste proposto por Matsushita et al. (2012) e o de KS apresentam bom poder para detecção de estruturas de dependência não-linear. _______________________________________________________________________________________ ABSTRACT / This dissertation deals with nonparametric tests for the detection of nonlinear dependence between two variables. Monte Carlo studies were performed to evaluate and compare the performance of some distribution-free tests. Here, we considered test that are based on the criterion of Cramér-von Mises and also a variation of the Kolmogorov-Smirnov (KS) test. The results show that the our new suggested tests have good power to detect nonlinear bivariate dependence.
12

Testes de hipoteses para dados funcionais baseados em distancias : um estudo usando splines / Distances approach to test hypothesis for functional data

Souza, Camila Pedroso Estevam de 25 April 2008 (has links)
Orientador: Ronaldo Dias / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-10T22:55:48Z (GMT). No. of bitstreams: 1 Souza_CamilaPedrosoEstevamde_M.pdf: 4239065 bytes, checksum: 099f19df22c0b40a411d07eacc2fe0d1 (MD5) Previous issue date: 2008 / Resumo: Avanços na tecnologia moderna têm facilitado a coleta e análise de dados de alta dimensão, ou dados que são formados por medidas repetidas de um mesmo objeto. Quando os dados são registrados densamente ao longo do tempo, freqüentemente por máquinas, eles são tipicamente chamados de dados funcionais, com uma curva (ou função) observada por objeto em estudo. A análise estatística de uma amostra de n curvas como essas é comumente chamada de análise de dados funcionais, ou ADF. Conceitualmente, dados funcionais são continuamente definidos. Claro que na prática eles geralmente são observados em pontos discretos. Não há exigência para que os dados sejam suaves, mas freqüentemente a suavidade ou outra regularidade será um aspecto chave da análise, em alguns casos derivadas das funções observadas serão importantes. Nessa dissertação diferentes técnicas de suavização serão apresentadas e discutidas, principalmente aquelas baseadas em funções splines...Observação: O resumo, na íntegra, poderá ser visualizado no texto completo da tese digital / Abstract: Advances in modern technology have facilitated the collection and analysis of high-dimensional data, or data that are repeated measurements of the same subject. When the data are recorded densely over time, often by machine, they are typically termed functional or curve data, with one observed curve (or function) per subject. The statistical analysis of a sample of n such curves is commonly termed functional data analysis, or FDA. Conceptually, functional data are continuously defined. Of course, in practice they are usually observed at discrete points. There is no general requirement that the data be smooth, but often smoothness or other regularity will be a key aspect of the analysis, in some cases derivatives of the observed functions will be important. In this project different smooth techniques are presented and discussed, mainly those based on splines functions...Note: The complete abstract is available with the full electronic digital thesis or dissertations / Mestrado / Estatistica Não Parametrica / Mestre em Estatística
13

Teste grafico para o ajuste de copulas arquimedianas usando variaveis BIPIT : um estudo de simulação / Test chart for the adjustment Archimedean copulas using variables BIPIT : a study of simulation

Bianchi, Marta Cristina Colozza 07 July 2008 (has links)
Orientador: Veronica Andrea Gonzales-Lopez / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-11T07:35:52Z (GMT). No. of bitstreams: 1 Bianchi_MartaCristinaColozza_M.pdf: 1867659 bytes, checksum: dbaca8bf802bf1568b0603fd248dc31f (MD5) Previous issue date: 2008 / Resumo: A crescente utilização de cópulas para modelagem de dependência em dados multivariados leva ao estudo de metodologias para o ajuste de cópulas. Este estudo é recente, assim como a plena utilização da teoria de cópulas para modelagem padrão. Grande parte das metodologias existentes ainda encontra-se em fase de estudo e somente alguns métodos foram validados recentemente. Há a necessidade de mecanismos de fácil acesso a detecção de estruturas de dependência ainda escassos na literatura. Nesta dissertação, é apresentado um método gráfico para o ajuste de cópulas, adaptado do QQplot, denominado Kendall Plot. Este método torna-se mais completo que o QQplot ao se postular a adição de bandas de confiança ao gráfico Kendall Plot, que permitem tomar uma decisão em relação a uma estrutura de dependência fixa, expressa por uma cópula, a ser testada para a amostra disponível. A redução de dimensão dos dados a uma variável unidimensional denominada BIPIT, que carrega informação a respeito da estrutura de dependência dos dados, permite a utilização da adaptação do QQplot com o fim de se testar estruturas de dependência / Abstract: The growing utilization of copulas to the dependency fitting of multi-variated data leads to the study of methodologies for copulas fitting. This study is recent, such as the complete utilization of the theory of copulas to standard fitting. Many of the existing methodologies are still in studies and only some have been recently validated. There is a need for easy-access mechanisms to detect dependency structures still missing in the statistical literature. It is presented in this dissertation a graphic method to the copulas fitting adapted from QQplot denominated Kendall Plot. This method is more complete than the QQplot due to the addition of confidence bands to the Kendall Plot graphic that allows the researcher to make a decision related to a fixed dependency structure, expressed by a copula, to be tested to the available sample. The reduction of the data dimension to a one-dimensional random variable, called BIPIT, which carries information about dependency data structure, allows the utilization of the QQplot adaptation for testing dependency structures / Mestrado / Teoria de Copulas / Mestre em Estatística
14

Monotonicidade em testes de hipóteses / Monotonicity in hypothesis tests

Gustavo Miranda da Silva 09 March 2010 (has links)
A maioria dos textos na literatura de testes de hipóteses trata de critérios de otimalidade para um determinado problema de decisão. No entanto, existem, em menor quantidade, alguns textos sobre os problemas de se realizar testes de hipóteses simultâneos e sobre a concordância lógica de suas soluções ótimas. Algo que se espera de testes de hipóteses simultâneos e que, se uma hipótese H1 implica uma hipótese H0, então é desejável que a rejeição da hipótese H0 necessariamente implique na rejeição da hipótese H1, para uma mesma amostra observada. Essa propriedade é chamada aqui de monotonicidade. A fim de estudar essa propriedade sob um ponto de vista mais geral, neste trabalho é definida a nocão de classe de testes de hipóteses, que estende a funcão de teste para uma sigma-álgebra de possíveis hipóteses nulas, e introduzida uma definição de monotonicidade. Também é mostrado, por meio de alguns exemplos simples, que, para um nível de signicância fixado, a classe de testes Razão de Verossimilhanças Generalizada (RVG) não apresenta monotonicidade, ao contrário de testes formulados sob a perspectiva bayesiana, como o teste de Bayes baseado em probabilidades a posteriori, o teste de Lindley e o FBST. Porém, são verificadas, sob a teoria da decisão, quando possível, quais as condições suficientes para que uma classe de testes de hipóteses tenha monotonicidade. / Most of the texts in the literature of hypothesis testing deal with optimality criteria for a single decision problem. However, there are, to a lesser extent, texts on the problem of simultaneous hypothesis testing and the logical consistency of the optimal solutions of such procedures. For instance, the following property should be observed in simultaneous hypothesis testing: if a hypothesis H implies a hypothesis H0, then, on the basis of the same sample observation, the rejection of the hypothesis H0 necessarily should imply the rejection of the hypothesis H. Here, this property is called monotonicity. To investigate this property under a more general point of view, in this work, it is dened rst the notion of a class of hypothesis testing, which extends the test function to a sigma-eld of possible null hypotheses, and then the concept of monotonicity is introduced properly. It is also shown, through some simple examples, that for a xed signicance level, the class of Generalized Likelihood Ratio tests (GLR) does not meet monotonicity, as opposed to tests developed under the Bayesian perspective, such as Bayes tests based on posterior probabilities, Lindleys tests and Full Bayesian Signicance Tests (FBST). Finally, sucient conditions for a class of hypothesis testing to have monotonicity are determined, when possible, under a decision-theoretic approach.
15

Propriedades lógicas de classes de testes de hipóteses / Logical properties of classes of hypotheses tests

Gustavo Miranda da Silva 03 November 2014 (has links)
Ao realizar testes de hipóteses simultâneos espera-se que a decisões obtidas neles sejam logicamente consistentes entre si. Neste trabalho, verifica-se sob quais condições testes de Bayes simultâneos atendem às condições lógicas isoladamente ou em conjunto. Demonstra-se que as restrições para que os testes simultâneos atendam essas condições isoladamente são bastante intuitivas. No entanto, ao tentar obedecer as condições conjuntamente, perde-se otimalidade. Além disso, avalia-se a relação entre esses testes de Bayes simultâneos e os testes gerados por estimadores, isto é, mostra-se que, sob algumas condições, tomar uma decisão baseado em um estimador de Bayes é equivalente a tomar uma decisão baseada em um teste de Bayes. Por fim, mostra-se que, se tomamos uma decisão baseada em Estimadores de Máxima Verossimilhança, então essa decisão deve ser igual à tomada por um teste de Bayes e concluímos que essas decisões são admissíveis e obedecem ao Princípio da Verossimilhança. / When performing simultaneous hypotheses testing is expected that the decisions obtained therein are logically consistent with each other. In this work, we find restrictions under which simultaneous Bayes tests meet logical conditions separately or jointly. It is shown that the conditions for the simultaneous tests meet these conditions alone are quite intuitive. However, when trying to obey the conditions jointly, we lose optimality. Furthermore, we evaluate the relationship between these tests and simultaneous Bayes tests generated by estimators, ie, we show that, under some conditions, to choose an estimator based on Bayes decision is equivalent to choosing a decision based on a Bayes test. Finally, we show that if we take a decision based on Maximum Likelihood Estimators, then that decision should be equal to taking a Bayes test and concluded that these decisions are admissible and obey the Likelihood Principle.
16

Métodos alternativos para realização de testes de hipóteses em delineamentos experimentais. / Alternative methods for testing hypotheses in experimental designs.

Nesi, Cristiano Nunes 17 July 2002 (has links)
Na estatística experimental, especificamente quando se faz análise de variância, os testes de hipóteses têm sido amplamente utilizados para se concluir a respeito das fontes de variação consideradas nos modelos lineares. Para tanto, é comum a utilização de sistemas estatísticos que fornecem análises de variância e a estatística F, entre outras, para a tomada de decisões. Entretanto, o teste F numa análise de variância para tratamentos com mais de um grau de liberdade proporciona informações gerais, relacionadas com o comportamento médio dos tratamentos. Por essa razão, deve-se planejar comparações objetivas, fazendo-se desdobramentos dos graus de liberdade de tratamentos para obter informações mais específicas. Nesse sentido, uma técnica usada para esses desdobramentos baseia-se na utilização de contrastes, sendo necessário que cada componente seja explicado por um contraste, com todos os contrastes sendo ortogonais entre si, para que as comparações sejam independentes. Entretanto, essa técnica torna-se complexa à medida que o número de tratamentos aumenta. Frente a isso, utilizando-se os dados provenientes de um experimento de competição entre dois grupos de variedades de cana-de-açúcar, inteiramente ao acaso com seis tratamentos e cinco repetições, e também nos dados obtidos de um experimento fictício de competição entre híbridos de milho no delineamento blocos casualizados, propôs-se uma técnica, empregando variáveis auxiliares, para facilitar o desdobramento ortogonal dos graus de liberdade de tratamentos, procurando-se evidenciar que essa técnica facilita o desdobramento ortogonal dos graus de liberdade de tratamentos e tem resultados equivalentes aos obtidos utilizando-se a função CONTRAST do PROC GLM do SAS. Outro problema refere-se à análise de experimentos fatoriais com desbalanceamento das amostras, tendo em vista que as técnicas de estimação de parcelas perdidas não resolvem satisfatoriamente o problema, principalmente se existem muitas parcelas perdidas. Quando os dados são desbalanceados, há necessidade de se conhecer que hipóteses estão sendo testadas e se estas são de interesse do pesquisador, devido à complexidade dessas hipóteses, principalmente em presença de caselas vazias. Além disso, muito têm sido escrito sobre os diferentes resultados da análise de variância apresentados por sistemas estatísticos para dados desbalanceados com caselas vazias, o que tem gerado confusão entre os pesquisadores. Com a finalidade de propor um método alternativo para a obtenção de hipóteses de interesse, utilizaram-se os resultados de um experimento fatorial 2x3, inteiramente ao acaso, com quatro repetições, para testar os efeitos de três reguladores de crescimento (hormônios), sobre a propagação "in vitro" de dois porta-enxertos (cultivares) de macieira. Assim, diante do fato que testar uma hipótese é equivalente a impor uma restrição estimável aos parâmetros do modelo, utilizaram-se restrições paramétricas estimáveis como um critério alternativo para realizar testes de hipóteses de interesse em modelos lineares com dados desbalanceados. Os resultados mostram que esse método permite que o pesquisador teste diretamente hipóteses de seu interesse, com resultados equivalentes aos encontrados com a função CONTRAST do PROC GLM do SAS. / For experimental designs, it is usually necessary to do tests of hypotheses to conclude about effects considered in the linear models. In these cases, it is common to use statistical softwares that supply the analyses of variance and F statistics, among others, for taking decisions. However, the test F in an analysis of variance for sources of variation with more than a degree of freedom provides general information, about significant differences of levels of the factor. Therefore, it should be planned objective comparisons, making orthogonal decompositions of the degrees of the effects of interest to get more specific information. One technique used frequently based on the orthogonal contrasts, so that the comparisons are independent. However, this technique becomes complex as the number of levels of the factor increases. To study alternative methods to do these comparisons, we use data from a yield trail experiment considering two groups of varieties of sugarcane, in a complete randomized design with 6 treatments and 5 repetitions. Also, we use data from a fictitious experiment comparing hybrids of maize in the randomized complete block design. The technique of analysis using dummy variables to facilitate the orthogonal decomposition of degrees of freedom of treatments was proposed. This technique facilitates the orthogonal decomposition and has the same results of those obtained the function CONTRAST of PROC GLM of SAS. Another situation considered involves experiments with unbalanced data. In this case, it is possible to suppose that there is the necessity of knowing what hypotheses are being tested and if they are useful. Much has been written on the different results of analysis of variance presented by statistical software for unbalanced data. This can create confusion to the researcher. To illustrate, we used the results of an 2x3 factorial experiment with 4 replicates, to test the effect of 3 hormones, on the propagation of 2 in vitro cultivars of apple trees. Thus, considering that to test a hypotheses is equivalent to impose an estimable restriction to the parameters of the model, we use these restrictions as an alternative criteria to directly carry out tests of hypotheses in linear models with unbalanced data. The results showed that this procedure is equivalent of that used by the function CONTRAST of PROC GLM/SAS.
17

Modelo de otimização de processos para melhoria da qualidade dos serviços em uma Instituição de ensino público

Paula, Izabel Alinne Alves de 23 July 2013 (has links)
Made available in DSpace on 2015-04-22T22:10:49Z (GMT). No. of bitstreams: 1 izabel.pdf: 5133966 bytes, checksum: 81bc090cf4739c9ffa486ed8ede553e1 (MD5) Previous issue date: 2013-07-23 / The quality since the advent of globalization has become one of the keywords most widespread in society. In the public sector is associated to the rapidity, reliability, precision and security, however, the general perception that the individuals have on the provision of public services in Brazil is not consistent with these adjectives quality. The literature suggests several tools to evaluate and improve the quality in services, but is subjective mechanisms predominate, which are summed to measure customer satisfaction. Admittedly, the quality has focused on the customer, but in the current Era of Quality is assumed that it is generated in the production process. Considering this gap, the question arose: how to optimize processes of the service sector, while focusing on quality improvement, especially processes executed in the public sector of education? To answer this question, it was adapted a model of analysis and processes improvement through the concatenation phases of Method of Analysis and Solution of Problems (MASP) with the phases of Design of Experiments. It was applied the proposed model in the Coordination of Integration Business-School (CIE-E) of IFAM Campus Manaus Donwtown, evaluating 397 records of stages finalized in the year 2012, where the duration of the process was portrayed as the villain. Thus, it was developed an experimental research characterized as exploratory and descriptive in nature and applied qualitative and quantitative approach. It was used Quality Tools for collection and evaluation of the data, as well the Nonparametric Tests for data analysis. Finally, supported on quality criteria and statistician identified that the combination high time load and no labour experience was the ideal combination of controllable factors that interfered in the records stage studied, resulting in lower process time, ie, it determined the optimal region. Thus, with this study, we evaluated the implantation procedure of statistical techniques in the service sector for the optimization and improvement of its processes. / A qualidade desde o surgimento da globalização tornou-se uma das palavras-chave mais difundidas junto à sociedade. No setor público sua concepção está associada à rapidez, confiabilidade, precisão e segurança, contudo, a percepção que os indivíduos têm sobre a prestação de serviços públicos no Brasil, não condiz com estes adjetivos de qualidade. A literatura aponta diversas ferramentas capazes de avaliar e melhorar a qualidade em serviços, entretanto predominam-se mecanismos subjetivos, que se resumem a mensurar a satisfação do cliente. É certo que, a qualidade tem foco no cliente, mas na atual Era da Qualidade assume-se que ela é gerada no processo produtivo. Considerando esta lacuna, surgiu o questionamento: de que forma pode-se otimizar processos do setor de serviço, mantendo o foco na melhoria da qualidade, em especial os processos executados no setor público de ensino? Para responder tal pergunta, adaptou-se um modelo de análise e melhoria de processos, através da concatenação das fases do Método de Análise e Solução de Problemas (MASP) com as etapas de Planejamento Experimental. Aplicou-se o modelo proposto na Coordenação de Integração Empresa-Escola (CIE-E) do IFAM Campus Manaus Centro, avaliando 397 registros de estágios finalizados no ano de 2012, onde o tempo de duração do processo foi apontado como o vilão. Deste modo, desenvolveu-se uma pesquisa experimental caracterizada como exploratória e descritiva, de natureza aplicada e abordagem qualitativa e quantitativa. Fez-se uso das Ferramentas da Qualidade para a coleta e disposição dos dados, como também de Testes Não Paramétricos para a análise dos dados. Ao fim, respaldado em critérios de qualidade e estatístico, identificou-se que a combinação carga horária alta e não experiência trabalhista constituía a combinação ideal dos fatores controláveis que interferiam nos registros de estágio estudados, resultando no menor tempo do processo, ou seja, determinou-se a região ótima. Assim, com esse estudo, pode-se avaliar o procedimento de implantação de técnicas estatísticas no setor de serviço para a otimização e melhoria de seus processos.
18

Métodos alternativos para realização de testes de hipóteses em delineamentos experimentais. / Alternative methods for testing hypotheses in experimental designs.

Cristiano Nunes Nesi 17 July 2002 (has links)
Na estatística experimental, especificamente quando se faz análise de variância, os testes de hipóteses têm sido amplamente utilizados para se concluir a respeito das fontes de variação consideradas nos modelos lineares. Para tanto, é comum a utilização de sistemas estatísticos que fornecem análises de variância e a estatística F, entre outras, para a tomada de decisões. Entretanto, o teste F numa análise de variância para tratamentos com mais de um grau de liberdade proporciona informações gerais, relacionadas com o comportamento médio dos tratamentos. Por essa razão, deve-se planejar comparações objetivas, fazendo-se desdobramentos dos graus de liberdade de tratamentos para obter informações mais específicas. Nesse sentido, uma técnica usada para esses desdobramentos baseia-se na utilização de contrastes, sendo necessário que cada componente seja explicado por um contraste, com todos os contrastes sendo ortogonais entre si, para que as comparações sejam independentes. Entretanto, essa técnica torna-se complexa à medida que o número de tratamentos aumenta. Frente a isso, utilizando-se os dados provenientes de um experimento de competição entre dois grupos de variedades de cana-de-açúcar, inteiramente ao acaso com seis tratamentos e cinco repetições, e também nos dados obtidos de um experimento fictício de competição entre híbridos de milho no delineamento blocos casualizados, propôs-se uma técnica, empregando variáveis auxiliares, para facilitar o desdobramento ortogonal dos graus de liberdade de tratamentos, procurando-se evidenciar que essa técnica facilita o desdobramento ortogonal dos graus de liberdade de tratamentos e tem resultados equivalentes aos obtidos utilizando-se a função CONTRAST do PROC GLM do SAS. Outro problema refere-se à análise de experimentos fatoriais com desbalanceamento das amostras, tendo em vista que as técnicas de estimação de parcelas perdidas não resolvem satisfatoriamente o problema, principalmente se existem muitas parcelas perdidas. Quando os dados são desbalanceados, há necessidade de se conhecer que hipóteses estão sendo testadas e se estas são de interesse do pesquisador, devido à complexidade dessas hipóteses, principalmente em presença de caselas vazias. Além disso, muito têm sido escrito sobre os diferentes resultados da análise de variância apresentados por sistemas estatísticos para dados desbalanceados com caselas vazias, o que tem gerado confusão entre os pesquisadores. Com a finalidade de propor um método alternativo para a obtenção de hipóteses de interesse, utilizaram-se os resultados de um experimento fatorial 2x3, inteiramente ao acaso, com quatro repetições, para testar os efeitos de três reguladores de crescimento (hormônios), sobre a propagação “in vitro” de dois porta-enxertos (cultivares) de macieira. Assim, diante do fato que testar uma hipótese é equivalente a impor uma restrição estimável aos parâmetros do modelo, utilizaram-se restrições paramétricas estimáveis como um critério alternativo para realizar testes de hipóteses de interesse em modelos lineares com dados desbalanceados. Os resultados mostram que esse método permite que o pesquisador teste diretamente hipóteses de seu interesse, com resultados equivalentes aos encontrados com a função CONTRAST do PROC GLM do SAS. / For experimental designs, it is usually necessary to do tests of hypotheses to conclude about effects considered in the linear models. In these cases, it is common to use statistical softwares that supply the analyses of variance and F statistics, among others, for taking decisions. However, the test F in an analysis of variance for sources of variation with more than a degree of freedom provides general information, about significant differences of levels of the factor. Therefore, it should be planned objective comparisons, making orthogonal decompositions of the degrees of the effects of interest to get more specific information. One technique used frequently based on the orthogonal contrasts, so that the comparisons are independent. However, this technique becomes complex as the number of levels of the factor increases. To study alternative methods to do these comparisons, we use data from a yield trail experiment considering two groups of varieties of sugarcane, in a complete randomized design with 6 treatments and 5 repetitions. Also, we use data from a fictitious experiment comparing hybrids of maize in the randomized complete block design. The technique of analysis using dummy variables to facilitate the orthogonal decomposition of degrees of freedom of treatments was proposed. This technique facilitates the orthogonal decomposition and has the same results of those obtained the function CONTRAST of PROC GLM of SAS. Another situation considered involves experiments with unbalanced data. In this case, it is possible to suppose that there is the necessity of knowing what hypotheses are being tested and if they are useful. Much has been written on the different results of analysis of variance presented by statistical software for unbalanced data. This can create confusion to the researcher. To illustrate, we used the results of an 2x3 factorial experiment with 4 replicates, to test the effect of 3 hormones, on the propagation of 2 in vitro cultivars of apple trees. Thus, considering that to test a hypotheses is equivalent to impose an estimable restriction to the parameters of the model, we use these restrictions as an alternative criteria to directly carry out tests of hypotheses in linear models with unbalanced data. The results showed that this procedure is equivalent of that used by the function CONTRAST of PROC GLM/SAS.
19

Contribuições em inferência e modelagem de valores extremos / Contributions to extreme value inference and modeling.

Pinheiro, Eliane Cantinho 04 December 2013 (has links)
A teoria do valor extremo é aplicada em áreas de pesquisa tais como hidrologia, estudos de poluição, engenharia de materiais, controle de tráfego e economia. A distribuição valor extremo ou Gumbel é amplamente utilizada na modelagem de valores extremos de fenômenos da natureza e no contexto de análise de sobrevivência para modelar o logaritmo do tempo de vida. A modelagem de valores extremos de fenômenos da natureza tais como velocidade de vento, nível da água de rio ou mar, altura de onda ou umidade é importante em estatística ambiental pois o conhecimento de valores extremos de tais eventos é crucial na prevenção de catátrofes. Ultimamente esta teoria é de particular interesse pois fenômenos extremos da natureza têm sido mais comuns e intensos. A maioria dos artigos sobre teoria do valor extremo para modelagem de dados considera amostras de tamanho moderado ou grande. A distribuição Gumbel é frequentemente incluída nas análises mas a qualidade do ajuste pode ser pobre em função de presença de ouliers. Investigamos modelagem estatística de eventos extremos com base na teoria de valores extremos. Consideramos um modelo de regressão valor extremo introduzido por Barreto-Souza & Vasconcellos (2011). Os autores trataram da questão de corrigir o viés do estimador de máxima verossimilhança para pequenas amostras. Nosso primeiro objetivo é deduzir ajustes para testes de hipótese nesta classe de modelos. Derivamos a estatística da razão de verossimilhanças ajustada de Skovgaard (2001) e cinco ajustes da estatística da razão de verossimilhanças sinalizada, que foram propostos por Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) e Fraser et al. (1999). As estatísticas ajustadas são aproximadamente distribuídas como uma distribuição $\\chi^2$ e normal padrão com alto grau de acurácia. Os termos dos ajustes têm formas compactas simples que podem ser facilmente implementadas em softwares disponíveis. Comparamos a performance do teste da razão de verossimilhanças, do teste da razão de verossimilanças sinalizada e dos testes ajustados obtidos neste trabalho em amostras pequenas. Ilustramos uma aplicação dos testes usuais e suas versões modificadas em conjuntos de dados reais. As distribuições das estatísticas ajustadas são mais próximas das respectivas distribuições limites comparadas com as distribuições das estatísticas usuais quando o tamanho da amostra é relativamente pequeno. Os resultados de simulação indicaram que as estatísticas ajustadas são recomendadas para inferência em modelo de regressão valor extremo quando o tamanho da amostra é moderado ou pequeno. Parcimônia é importante quando os dados são escassos, mas flexibilidade também é crucial pois um ajuste pobre pode levar a uma conclusão completamente errada. Uma revisão da literatura foi feita para listar as distribuições que são generalizações da distribuição Gumbel. Nosso segundo objetivo é avaliar a parcimônia e flexibilidade destas distribuições. Com este propósito, comparamos tais distribuições através de momentos, coeficientes de assimetria e de curtose e índice da cauda. As famílias mais amplas obtidas pela inclusão de parâmetros adicionais, que têm a distribuição Gumbel como caso particular, apresentam assimetria e curtose flexíveis enquanto a distribuição Gumbel apresenta tais características constantes. Dentre estas distribuições, a distribuição valor extremo generalizada é a única com índice da cauda que pode ser qualquer número real positivo enquanto os índices da cauda das outras distribuições são zero. Observamos que algumas generalizações da distribuição Gumbel estudadas na literatura são não identificáveis. Portanto, para estes modelos a interpretação e estimação de parâmetros individuais não é factível. Selecionamos as distribuições identificáveis e as ajustamos a um conjunto de dados simulado e a um conjunto de dados reais de velocidade de vento. Como esperado, tais distribuições se ajustaram bastante bem ao conjunto de dados simulados de uma distribuição Gumbel. A distribuição valor extremo generalizada e a mistura de duas distribuições Gumbel produziram melhores ajustes aos dados do que as outras distribuições na presença não desprezível de observações discrepantes que não podem ser acomodadas pela distribuição Gumbel e, portanto, sugerimos que tais distribuições devem ser utilizadas neste contexto. / The extreme value theory is applied in research fields such as hydrology, pollution studies, materials engineering, traffic management, economics and finance. The Gumbel distribution is widely used in statistical modeling of extreme values of a natural process such as rainfall and wind. Also, the Gumbel distribution is important in the context of survival analysis for modeling lifetime in logarithmic scale. The statistical modeling of extreme values of a natural process such as wind or humidity is important in environmental statistics; for example, understanding extreme wind speed is crucial in catastrophe/disaster protection. Lately this is of particular interest as extreme natural phenomena/episodes are more common and intense. The majority of papers on extreme value theory for modeling extreme data is supported by moderate or large sample sizes. The Gumbel distribution is often considered but the resulting fit may be poor in the presence of ouliers since its skewness and kurtosis are constant. We deal with statistical modeling of extreme events data based on extreme value theory. We consider a general extreme-value regression model family introduced by Barreto-Souza & Vasconcellos (2011). The authors addressed the issue of correcting the bias of the maximum likelihood estimators in small samples. Here, our first goal is to derive hypothesis test adjustments in this class of models. We derive Skovgaard\'s adjusted likelihood ratio statistics Skovgaard (2001) and five adjusted signed likelihood ratio statistics, which have been proposed by Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) and Fraser et al. (1999). The adjusted statistics are approximately distributed as $\\chi^2$ and standard normal with high accuracy. The adjustment terms have simple compact forms which may be easily implemented by readily available software. We compare the finite sample performance of the likelihood ratio test, the signed likelihood ratio test and the adjusted tests obtained in this work. We illustrate the application of the usual tests and their modified versions in real datasets. The adjusted statistics are closer to the respective limiting distribution compared to the usual ones when the sample size is relatively small. Simulation results indicate that the adjusted statistics can be recommended for inference in extreme value regression model with small or moderate sample size. Parsimony is important when data are scarce, but flexibility is also crucial since a poor fit may lead to a completely wrong conclusion. A literature review was conducted to list distributions which nest the Gumbel distribution. Our second goal is to evaluate their parsimony and flexibility. For this purpose, we compare such distributions regarding moments, skewness, kurtosis and tail index. The larger families obtained by introducing additional parameters, which have Gumbel embedded in, present flexible skewness and kurtosis while the Gumbel distribution skewness and kurtosis are constant. Among these distributions the generalized extreme value is the only one with tail index that can be any positive real number while the tail indeces of the other distributions investigated here are zero. We notice that some generalizations of the Gumbel distribution studied in the literature are not indetifiable. Hence, for these models meaningful interpretation and estimation of individual parameters are not feasible. We select the identifiable distributions and fit them to a simulated dataset and to real wind speed data. As expected, such distributions fit the Gumbel simulated data quite well. The generalized extreme value distribution and the two-component extreme value distribution fit the data better than the others in the non-negligible presence of outliers that cannot be accommodated by the Gumbel distribution, and therefore we suggest them to be applied in this context.
20

Contribuições em inferência e modelagem de valores extremos / Contributions to extreme value inference and modeling.

Eliane Cantinho Pinheiro 04 December 2013 (has links)
A teoria do valor extremo é aplicada em áreas de pesquisa tais como hidrologia, estudos de poluição, engenharia de materiais, controle de tráfego e economia. A distribuição valor extremo ou Gumbel é amplamente utilizada na modelagem de valores extremos de fenômenos da natureza e no contexto de análise de sobrevivência para modelar o logaritmo do tempo de vida. A modelagem de valores extremos de fenômenos da natureza tais como velocidade de vento, nível da água de rio ou mar, altura de onda ou umidade é importante em estatística ambiental pois o conhecimento de valores extremos de tais eventos é crucial na prevenção de catátrofes. Ultimamente esta teoria é de particular interesse pois fenômenos extremos da natureza têm sido mais comuns e intensos. A maioria dos artigos sobre teoria do valor extremo para modelagem de dados considera amostras de tamanho moderado ou grande. A distribuição Gumbel é frequentemente incluída nas análises mas a qualidade do ajuste pode ser pobre em função de presença de ouliers. Investigamos modelagem estatística de eventos extremos com base na teoria de valores extremos. Consideramos um modelo de regressão valor extremo introduzido por Barreto-Souza & Vasconcellos (2011). Os autores trataram da questão de corrigir o viés do estimador de máxima verossimilhança para pequenas amostras. Nosso primeiro objetivo é deduzir ajustes para testes de hipótese nesta classe de modelos. Derivamos a estatística da razão de verossimilhanças ajustada de Skovgaard (2001) e cinco ajustes da estatística da razão de verossimilhanças sinalizada, que foram propostos por Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) e Fraser et al. (1999). As estatísticas ajustadas são aproximadamente distribuídas como uma distribuição $\\chi^2$ e normal padrão com alto grau de acurácia. Os termos dos ajustes têm formas compactas simples que podem ser facilmente implementadas em softwares disponíveis. Comparamos a performance do teste da razão de verossimilhanças, do teste da razão de verossimilanças sinalizada e dos testes ajustados obtidos neste trabalho em amostras pequenas. Ilustramos uma aplicação dos testes usuais e suas versões modificadas em conjuntos de dados reais. As distribuições das estatísticas ajustadas são mais próximas das respectivas distribuições limites comparadas com as distribuições das estatísticas usuais quando o tamanho da amostra é relativamente pequeno. Os resultados de simulação indicaram que as estatísticas ajustadas são recomendadas para inferência em modelo de regressão valor extremo quando o tamanho da amostra é moderado ou pequeno. Parcimônia é importante quando os dados são escassos, mas flexibilidade também é crucial pois um ajuste pobre pode levar a uma conclusão completamente errada. Uma revisão da literatura foi feita para listar as distribuições que são generalizações da distribuição Gumbel. Nosso segundo objetivo é avaliar a parcimônia e flexibilidade destas distribuições. Com este propósito, comparamos tais distribuições através de momentos, coeficientes de assimetria e de curtose e índice da cauda. As famílias mais amplas obtidas pela inclusão de parâmetros adicionais, que têm a distribuição Gumbel como caso particular, apresentam assimetria e curtose flexíveis enquanto a distribuição Gumbel apresenta tais características constantes. Dentre estas distribuições, a distribuição valor extremo generalizada é a única com índice da cauda que pode ser qualquer número real positivo enquanto os índices da cauda das outras distribuições são zero. Observamos que algumas generalizações da distribuição Gumbel estudadas na literatura são não identificáveis. Portanto, para estes modelos a interpretação e estimação de parâmetros individuais não é factível. Selecionamos as distribuições identificáveis e as ajustamos a um conjunto de dados simulado e a um conjunto de dados reais de velocidade de vento. Como esperado, tais distribuições se ajustaram bastante bem ao conjunto de dados simulados de uma distribuição Gumbel. A distribuição valor extremo generalizada e a mistura de duas distribuições Gumbel produziram melhores ajustes aos dados do que as outras distribuições na presença não desprezível de observações discrepantes que não podem ser acomodadas pela distribuição Gumbel e, portanto, sugerimos que tais distribuições devem ser utilizadas neste contexto. / The extreme value theory is applied in research fields such as hydrology, pollution studies, materials engineering, traffic management, economics and finance. The Gumbel distribution is widely used in statistical modeling of extreme values of a natural process such as rainfall and wind. Also, the Gumbel distribution is important in the context of survival analysis for modeling lifetime in logarithmic scale. The statistical modeling of extreme values of a natural process such as wind or humidity is important in environmental statistics; for example, understanding extreme wind speed is crucial in catastrophe/disaster protection. Lately this is of particular interest as extreme natural phenomena/episodes are more common and intense. The majority of papers on extreme value theory for modeling extreme data is supported by moderate or large sample sizes. The Gumbel distribution is often considered but the resulting fit may be poor in the presence of ouliers since its skewness and kurtosis are constant. We deal with statistical modeling of extreme events data based on extreme value theory. We consider a general extreme-value regression model family introduced by Barreto-Souza & Vasconcellos (2011). The authors addressed the issue of correcting the bias of the maximum likelihood estimators in small samples. Here, our first goal is to derive hypothesis test adjustments in this class of models. We derive Skovgaard\'s adjusted likelihood ratio statistics Skovgaard (2001) and five adjusted signed likelihood ratio statistics, which have been proposed by Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) and Fraser et al. (1999). The adjusted statistics are approximately distributed as $\\chi^2$ and standard normal with high accuracy. The adjustment terms have simple compact forms which may be easily implemented by readily available software. We compare the finite sample performance of the likelihood ratio test, the signed likelihood ratio test and the adjusted tests obtained in this work. We illustrate the application of the usual tests and their modified versions in real datasets. The adjusted statistics are closer to the respective limiting distribution compared to the usual ones when the sample size is relatively small. Simulation results indicate that the adjusted statistics can be recommended for inference in extreme value regression model with small or moderate sample size. Parsimony is important when data are scarce, but flexibility is also crucial since a poor fit may lead to a completely wrong conclusion. A literature review was conducted to list distributions which nest the Gumbel distribution. Our second goal is to evaluate their parsimony and flexibility. For this purpose, we compare such distributions regarding moments, skewness, kurtosis and tail index. The larger families obtained by introducing additional parameters, which have Gumbel embedded in, present flexible skewness and kurtosis while the Gumbel distribution skewness and kurtosis are constant. Among these distributions the generalized extreme value is the only one with tail index that can be any positive real number while the tail indeces of the other distributions investigated here are zero. We notice that some generalizations of the Gumbel distribution studied in the literature are not indetifiable. Hence, for these models meaningful interpretation and estimation of individual parameters are not feasible. We select the identifiable distributions and fit them to a simulated dataset and to real wind speed data. As expected, such distributions fit the Gumbel simulated data quite well. The generalized extreme value distribution and the two-component extreme value distribution fit the data better than the others in the non-negligible presence of outliers that cannot be accommodated by the Gumbel distribution, and therefore we suggest them to be applied in this context.

Page generated in 0.0917 seconds