Spelling suggestions: "subject:"bootstrap."" "subject:"gbootstrap.""
111 |
Análise do número de grupos em bases de dados incompletas utilizando agrupamentos nebulosos e reamostragem Bootstrap / Analysis the number of clusters present in incomplete datasets using a combination of the fuzzy clustering and resampling bootstrappingSelma Terezinha Milagre 18 July 2008 (has links)
A técnica de agrupamento de dados é amplamente utilizada em análise exploratória, a qual é frequentemente necessária em diversas áreas de pesquisa tais como medicina, biologia e estatística, para avaliar potenciais hipóteses a serem utilizadas em estudos subseqüentes. Em bases de dados reais, a ocorrência de dados incompletos, nos quais os valores de um ou mais atributos do dado são desconhecidos, é bastante comum. Este trabalho apresenta um método capaz de identificar o número de grupos presentes em bases de dados incompletas, utilizando a combinação das técnicas de agrupamentos nebulosos e reamostragem bootstrap. A qualidade da classificação é baseada em medidas de comparação tradicionais como F1, Classificação Cruzada, Hubert e outras. Os estudos foram feitos em oito bases de dados. As quatro primeiras são bases de dados artificiais, a quinta e a sexta são a wine e íris. A sétima e oitava bases são formadas por uma coleção brasileira de 119 estirpes de Bradyrhizobium. Para avaliar toda informação sem introduzir estimativas, fez-se a modificação do algoritmo Fuzzy C-Means (FCM) utilizando-se um vetor de índices de atributos, os quais indicam onde o valor de um atributo é observado ou não, modificando-se ento, os cálculos do centro e distância ao centro. As simulações foram feitas de 2 até 8 grupos utilizando-se 100 sub-amostras. Os percentuais de valores faltando utilizados foram 2%, 5%, 10%, 20% e 30%. Os resultados deste trabalho demonstraram que nosso método é capaz de identificar participações relevantes, até em presença de altos índices de dados incompletos, sem a necessidade de se fazer nenhuma suposição sobre a base de dados. As medidas Hubert e índice randômico ajustado encontraram os melhores resultados experimentais. / Clustering in exploratory data analysis is often necessary in several areas of the survey such as medicine, biology and statistics, to evaluate potential hypotheses for subsequent studies. In real datasets the occurrence of incompleteness, where the values of some of the attributes are unknown, is very common. This work presents a method capable to identifying the number of clusters present in incomplete datasets, using a combination of the fuzzy clustering and resampling (bootstrapping). The quality of classification is based on the traditional measures, like F1, Cross-Classification, Hubert and others. The studies were made on eigth datasets. The first four are artificial datasets, the fifth and sixth are the wine and iris datasets. The seventh and eighth databases are composed of the brazilian collection of 119 Bradyrhizobium strains. To evaluate all information without introducing estimates, a modification of the Fuzzy C-Means (FCM) algorithm was developed using an index vector of attributes, which indicates whether an attribute value is observed or not, and changing the center and distance calculations. The simulations were made from 2 to 8 clusters using 100 sub-samples. The percentages of the missing values used were 2%, 5%, 10%, 20% and 30%. Even lacking data and with no special requirements of the database, the results of this work demonstrate that the proposed method is capable to identifying relevant partitions. The best experimental results were found using Hubert and corrected randomness measures.
|
112 |
[en] AN INFERENTIAL PROCEDURE FOR FACTOR ANALYSIS USING BOOTSTRAP AND JACKKNIFE TECHNIQUES: CONSTRUCTION OF CONFIDENCE INTERVALS AND TESTS OF HYPOTHESES / [pt] UM PROCEDIMENTO INFERENCIAL PARA ANÁLISE FATORIAL UTILIZANDO AS TÉCNICAS BOOTSTRAP E JACKKNIFE: CONSTRUÇÃO DE INTERVALOS DE CONFIANÇA E TESTES DE HIPÓTESESGIOVANI GLAUCIO DE OLIVEIRA COSTA 27 July 2006 (has links)
[pt] A análise fatorial é a denominação atribuída às técnicas
estatísticas
paramétricas multivariadas utilizadas para estudar o inter-
relacionamento entre
um conjunto de variáveis observadas. É um processo
destinado essencialmente à
redução e à sumarização dos dados, tornando-se em vários
campos da pesquisa
científica uma boa opção para um melhor gerenciamento de
informações reais,
gerando variáveis remanescentes mais significativas e
fáceis de serem trabalhadas.
Ainda assim, uma possível limitação da análise fatorial é
que não existem testes
estatísticos conclusivos ou satisfatoriamente eficazes e
que possam ser
regularmente empregados, portanto, para a sua
significância. Conseqüentemente,
é difícil saber se os resultados são meramente acidentais,
ou realmente refletem
algo significativo. Por esse motivo, esta tese de
doutorado visa estabelecer um
procedimento inferencial para a análise fatorial
utilizando-se de técnicas CIS
(Computer Intensive Statistics), tais como o bootstrap e o
jackknife, que permitam
que a análise fatorial saia do terreno puramente
descritivo e ladeando a
insuficiência da teoria da distribuição de amostragem que
se faz sentir em técnicas
multivariadas. / [en] Factor analysis is the denomination attributed to the
multivariate
parametric statistical techniques used to study the inter-
relationship between a set
of observed variables. It is a process essentially
intended to reduce and summarize
data, thus becoming a good option for a better management
of real information,
generating remainder variables that are more significant
and easier to work with,
in various fields of scientific research. However, a
possible limitation of factor
analysis is that there are no conclusive statistical tests
regularly employed in
testing the hypotheses. Consequently, it is difficult to
know if the results are
merely accidents, or indeed, reflect something of
significance. For this reason, this
study intends to establish an inferential procedure for
factor analysis, using CIS
(Computer Intensive Statistics) techniques, such as the
bootstrap and jackknife,
which allow factor analysis to pass out of the purely
descriptive, solving the
problem of the insufficiency of sample distribution theory
as seen in multivariate
techniques.
|
113 |
Application of Block Sieve Bootstrap to Change-Point detection in time seriesZaman, Saad 30 August 2010 (has links)
Since the introduction of CUSUM statistic by E.S. Page (1951), detection of change or a structural break in time series has gained significant interest as its applications span across various disciplines including economics, industrial applications, and environmental data sets. However, many of the early suggested statistics, such as CUSUM or MOSUM, lose their effectiveness when applied to time series data. Either the size or power of the test statistic gets distorted, especially for higher order autoregressive moving average processes. We use the test statistic from Gombay and Serban (2009) for detecting change in the mean of an autoregressive process and show how the application of sieve bootstrap to the time series data can improve the performance of our test to detect change. The effectiveness of the proposed method is illustrated by applying it to economic data sets.
|
114 |
Application of Block Sieve Bootstrap to Change-Point detection in time seriesZaman, Saad 30 August 2010 (has links)
Since the introduction of CUSUM statistic by E.S. Page (1951), detection of change or a structural break in time series has gained significant interest as its applications span across various disciplines including economics, industrial applications, and environmental data sets. However, many of the early suggested statistics, such as CUSUM or MOSUM, lose their effectiveness when applied to time series data. Either the size or power of the test statistic gets distorted, especially for higher order autoregressive moving average processes. We use the test statistic from Gombay and Serban (2009) for detecting change in the mean of an autoregressive process and show how the application of sieve bootstrap to the time series data can improve the performance of our test to detect change. The effectiveness of the proposed method is illustrated by applying it to economic data sets.
|
115 |
Robust critical values for unit root tests for series with conditional heteroskedasticity errors using wild bootstrapDuras, Toni January 2013 (has links)
No description available.
|
116 |
Ensaios em matemática aplicada: estimação e trajetórias bootstrap de oferta de sangue e estudo de desempenho de extensões do algoritmo de Programação Dinâmica Dual EstocásticaCosta, Michelle Bandarra Marques 26 September 2017 (has links)
Submitted by Michelle Bandarra (michelle.bandarra@gmail.com) on 2017-11-09T12:55:55Z
No. of bitstreams: 1
Dissertação EMAp Michelle Bandarra_correcoes_bib.pdf: 10393257 bytes, checksum: 31966b31b85e1d4936e9244bc9cbf592 (MD5) / Approved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2017-11-22T17:42:42Z (GMT) No. of bitstreams: 1
Dissertação EMAp Michelle Bandarra_correcoes_bib.pdf: 10393257 bytes, checksum: 31966b31b85e1d4936e9244bc9cbf592 (MD5) / Made available in DSpace on 2017-11-29T13:56:40Z (GMT). No. of bitstreams: 1
Dissertação EMAp Michelle Bandarra_correcoes_bib.pdf: 10393257 bytes, checksum: 31966b31b85e1d4936e9244bc9cbf592 (MD5)
Previous issue date: 2017-09-26 / We study two topics of applied mathematics. The first topic is devoted to the estimation of blood supply time series and the generation of simulated trajectories. The main goal is to contribute to the literature of stock management of perishable goods. We use Autoregressive Vetors models and two bootstrap techniques when residuals are nonGaussian. We conclude that both techniques are suitable for the problem at hand and are good approaches to enhance predictability of the blood supply time series. The second topic is devoted to the study of different extensions of the Stochastic Dual Dynamic Programming algorithm (SDDP). We compare the computational performance of two algorithms applied to portfolio selection models. The first one is Multicut Decomposition Algorithm (MuDA) which modifies SDDP by including multiple cuts (instead of just one) per stage and per iteration. The second, Cut Selection Multicut Decomposition Algorithms (CuSMuDA), combines MuDA with cut selection strategies and, to the best of our knowledge, has not been proposed so far in the literature. We compare two Cut Selection strategies, CS1 and CS2. We run simulations for 6 different instances of the portfolio problem. Results show the attractiveness of CuSMuDA CS2, which was much quicker than MuDA (between 5,1 and 12,6 times quicker) and much quicker than the other cut selection strategy, CuSMuDA CS1 (between 10,3 and 21,9 times quicker). / Estudamos dois tópicos distintos da matemática aplicada. O primeiro tópico dedica-se à estimação e geração de trajetórias futuras de séries de oferta de sangue, contribuindo para a literatura de gestão de estoque de bens perecíveis. São utilizados modelos de Vetores Auto Regressivos (VAR) e as trajetórias são geradas por duas técnicas distintas de bootstrap presentes na literatura que consideram a não-normalidade dos erros do modelo. Conclui-se que ambas técnicas são adequadas e abordagens possíveis para melhorar a previsibilidade das séries de oferta de sangue. O segundo tópico dedica-se ao estudo de diferentes extensões do algoritmo de Programação Dinâmica Dual Estocástica (Stochastic Dual Dynamic Programming, SDDP). Sob a ótica de modelos de seleção de carteira, são comparados os desempenhos computacionais de dois algoritmos. O primeiro é uma modificação do SDDP que calcula múltiplos cortes por iteração, Multicut Decomposition Algorithm (MuDA). O segundo introduz estratégias de seleção de corte ao MuDA, no que denominamos de Cut Selection Multicut Decomposition Algorithm, CuSMuDA e, até onde sabemos, ainda não foi proposto pela literatura. São comparadas duas estratégias de seleção de corte distintas, CS1 e CS2. Foram rodadas simulações para 6 casos do problema de seleção de carteira e os resultados mostram a atratividade do modelo proposto CuSMuDA CS2, que obteve tempos computacionais entre 5,1 e 12,6 vezes menores que o MuDA e entre 10,3 e 21,9 vezes menores que o CuSMuDA CS1.
|
117 |
Comparação das águas dos rios Jaguari e Atibaia na região de lançamento de efluente de indústria petroquímica / Comparision of the water from rivers Jaguari and Atibaia at the region of wastewater release by a petrochemical industryOliveira, Eduardo Schneider Bueno de [UNESP] 03 February 2016 (has links)
Submitted by EDUARDO SCHNEIDER BUENO DE OLIVEIRA null (eduardosbdeoliveira@hotmail.com) on 2016-04-14T17:34:57Z
No. of bitstreams: 1
Dissertação Final - Eduardo Schneider.pdf: 4265629 bytes, checksum: 4e5da4135aad7da51adb68c347b376b1 (MD5) / Approved for entry into archive by Felipe Augusto Arakaki (arakaki@reitoria.unesp.br) on 2016-04-18T13:08:57Z (GMT) No. of bitstreams: 1
oliveira_esb_me_bot.pdf: 4265629 bytes, checksum: 4e5da4135aad7da51adb68c347b376b1 (MD5) / Made available in DSpace on 2016-04-18T13:08:57Z (GMT). No. of bitstreams: 1
oliveira_esb_me_bot.pdf: 4265629 bytes, checksum: 4e5da4135aad7da51adb68c347b376b1 (MD5)
Previous issue date: 2016-02-03 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / A ação antrópica na natureza é algo muito constante ao longo de toda
a história, mas cada vez mais notam-se os efeitos negativos que por vezes ela pode
trazer. Verificar esses efeitos, suas implicações, e aquilo que pode ser feito para evitar
maiores problemas é de suma importância para a manutenção de nosso planeta
em boas condições e consequentemente para a qualidade de vida do ser humano.
O presente estudo realiza uma an álise da qualidade da água dos Rios Jaguari e
Atibaia, entre os quais há o despejo de resíduos de uma indústria, além da qualidade
da água após o processo de utilização pela indústria, antes de sua devolução ao rio.
Com isso, pode-se verificar a qualidade do tratamento de resíduo de tal indústria e
analisar possíveis efeitos que possa haver na qualidade da água após o despejo dos
resíduos no rio. Para isso, com base em dados sobre características físicas, químicas e
microbiológicas da água, são utilizadas técnicas estatísticas adequadas para realizar
a análise necessária ao intuito anteriormente exposto. Como os dados possuem
dependência entre si, é necessário que sejam utilizados métodos que permitam tal
ocorrência, como o Bootstrap em Blocos não param étrico (Künsch, 1989; Politis
& Romano, 1994). Também há a realização de imputação múltipla de dados,
uma vez que há diversos meses do estudo com dados ausentes, através da técnica
de Imputação de Dados Livre de Distribuição (Bergamo, 2007; Bergamo et al., 2008). / The anthropic action in nature is a constant factor along the history, but each day the negative effects that it brings can be increasingly seen. Check these effects, its implications and what can be done in order to avoid bigger problems has a great importance to the manteinance of our planet in good conditions and, consequently, to the human being life quality. This study performs an analysis of the water quality of the Jaguari and Atibaia rivers, among which happens the dumping of residuals from a petrochemical industry, as well as of the quality of the water after its utilization process by the industry, before its devolution to the river. Thus, it is possible to verify this industry’s residual treatment quality and to analyze possible effects to the water quality after the residual dumping at the river. For this, based on data about fisical, chemical and microbiological characteristics of the water, appropriate statistical techniques are used, aiming to do the necessary analysis to fullfill the exposed intention. Because of the existence of dependency, methods that allow this ocurrence shall be used, such as the non parametric Blocks Bootstrap (K¨unsch, 1989; Politis & Romano, 1994). There is also the realization of multiple imputation, using the technique of the Distribution-free Multiple Imputation (Bergamo, 2007; Bergamo et al., 2008), once for some months there are missing data.
|
118 |
Comparação das águas dos rios Jaguari e Atibaia na região de lançamento de efluente de indústria petroquímicaOliveira, Eduardo Schneider Bueno de January 2016 (has links)
Orientador: Antonio Carlos Simões Pião / Resumo: A ação antrópica na natureza é algo muito constante ao longo de todaa história, mas cada vez mais notam-se os efeitos negativos que por vezes ela podetrazer. Verificar esses efeitos, suas implicações, e aquilo que pode ser feito para evitarmaiores problemas é de suma importância para a manutenção de nosso planetaem boas condições e consequentemente para a qualidade de vida do ser humano.O presente estudo realiza uma an álise da qualidade da água dos Rios Jaguari eAtibaia, entre os quais há o despejo de resíduos de uma indústria, além da qualidadeda água após o processo de utilização pela indústria, antes de sua devolução ao rio.Com isso, pode-se verificar a qualidade do tratamento de resíduo de tal indústria eanalisar possíveis efeitos que possa haver na qualidade da água após o despejo dosresíduos no rio. Para isso, com base em dados sobre características físicas, químicas emicrobiológicas da água, são utilizadas técnicas estatísticas adequadas para realizara análise necessária ao intuito anteriormente exposto. Como os dados possuemdependência entre si, é necessário que sejam utilizados métodos que permitam talocorrência, como o Bootstrap em Blocos não param étrico (Künsch, 1989; Politis& Romano, 1994). Também há a realização de imputação múltipla de dados,uma vez que há diversos meses do estudo com dados ausentes, através da técnicade Imputação de Dados Livre de Distribuição (Bergamo, 2007; Bergamo et al., 2008). / Abstract: The anthropic action in nature is a constant factor along the history, but each day the negative effects that it brings can be increasingly seen. Check these effects, its implications and what can be done in order to avoid bigger problems has a great importance to the manteinance of our planet in good conditions and, consequently, to the human being life quality. This study performs an analysis of the water quality of the Jaguari and Atibaia rivers, among which happens the dumping of residuals from a petrochemical industry, as well as of the quality of the water after its utilization process by the industry, before its devolution to the river. Thus, it is possible to verify this industry’s residual treatment quality and to analyze possible effects to the water quality after the residual dumping at the river. For this, based on data about fisical, chemical and microbiological characteristics of the water, appropriate statistical techniques are used, aiming to do the necessary analysis to fullfill the exposed intention. Because of the existence of dependency, methods that allow this ocurrence shall be used, such as the non parametric Blocks Bootstrap (K¨unsch, 1989; Politis & Romano, 1994). There is also the realization of multiple imputation, using the technique of the Distribution-free Multiple Imputation (Bergamo, 2007; Bergamo et al., 2008), once for some months there are missing data. / Mestre
|
119 |
Um teste baseado em influência local para avaliar qualidade do ajuste em modelos de Regressão BetaRIBEIRO, Terezinha Késsia de Assis 12 February 2016 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-07-26T12:10:38Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
dissertação_final_cd_TT.pdf: 4588819 bytes, checksum: 5127176322bfc06990cbd3eaa1fc5687 (MD5) / Made available in DSpace on 2016-07-26T12:10:38Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
dissertação_final_cd_TT.pdf: 4588819 bytes, checksum: 5127176322bfc06990cbd3eaa1fc5687 (MD5)
Previous issue date: 2016-02-12 / CAPEs / A classe de modelos de regressão beta introduzida por Ferrari & Cribari-Neto (2004) é
muito útil para modelar taxas e proporções. O modelo proposto pelos autores é baseado
na suposição de que a variável resposta tem distribuição beta com uma parametrização
que é indexada pela média e por um parâmetro de precisão. Após a construção de um
modelo de regressão é de extrema importância realizar a análise de diagnóstico, objetivando
verificar possíveis afastamentos das suposições feitas para o modelo apresentado,
bem como detectar possíveis observações que causem influência desproporcional nas estimativas
dos parâmetros. A análise de influência local introduzida por Cook (1986) é
uma abordagem que objetiva avaliar a influência das observações. Com base no método
de influência local, Zhu & Zhang (2004) propuseram um teste de hipóteses para detectar
o grau de discrepância entre o modelo suposto e o modelo subjacente do qual dos dados
são gerados. Nesse trabalho, foi densenvolvido esse teste para o modelo de regressão beta
com dispersão fixa e variável, como também, foram propostos um melhoramento nesse
teste baseados na metodologia bootstrap e um novo teste, também com base em influência
local, mas considerando outro esquema de perturbação, a perturbação no parâmetro
de precisão no modelo de regressão beta com dispersão fixa. O desempenho desses testes
foram avaliados com base no tamanho e poder. Por fim, aplicamos a teoria desenvolvida
a um conjunto de dados reais. / The class of beta regression models introduced by Ferrari & Cribari-Neto (2004) is very
useful for modelling rates and proportions. The proposed model by the authors is based on
the assumption that the response variable is beta distributed with indexed by mean and
dispersion parameters. After fitting a regression model is very important to carry out the
diagnostic analysis in sense that, verifying possible deviations of the model assumptions, as
well as detect possible observations that cause disproportionate influence on the parameter
estimates. The local influence analysis introduced by Cook (1986) is an approach that
objective assess the influence of observations. Based on local influence method, Zhu &
Zhang (2004) proposed a hypothesis test to detect the degree of discrepancy between
the supposed model and the underlying model from which the data is generated. In
this work, was developed this test for the beta regression model with fixed and varying
dispersion, as well as, we proposed in addition, an improvement of this test based on
bootstrap methodology and a new test, also based on local influence, but considering
other perturbation scheme, the perturbation of the precision parameter in beta regression
model with fixed dispersion. The performance of these tests were evaluated based on size
and power. Finally, we applied the theory developed to a set of real data.
|
120 |
Algoritmos de estimação para Cadeias de Markov de alcance variavel : aplicações a detecção do ritmo em textos escritos / Estimation of algorithms for variable length Markov chains : applications in the detection of rhythm in written textsMatta, David Henriques da 25 March 2008 (has links)
Orientador: Nancy Lopes Garcia / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-10T20:09:07Z (GMT). No. of bitstreams: 1
Matta_DavidHenriquesda_M.pdf: 974440 bytes, checksum: 6d2fc35e3a33e3e3bbee24baf377bfdb (MD5)
Previous issue date: 2008 / Resumo: No presente trabalho, direcionamos nossos estudos à questão de se encontrar evidências estatísticas na detecção de ritmos em textos escritos, apresentando para isso ferramentas probabilísticas que nos permitam discriminar textos brasileiros e portugueses. Para alcançarmos tais objetivos, abordamos alguns resultados teóricos e práticos em modelagem, reamostragem e estimação das cadeias de Markov de alcance variável. Sendo que na parte de reamostragem, propomos um novo método para conjuntos de dados com um ponto de renovação / Abstract: In this project, we focus our studies on the question of finding statistical evidences in detecting rhythm in written texts by presenting probabilistic tools that allow us to discriminate Brazilian and Portuguese texts. To achieve such goals, we some present theoretical and practical results in modeling, resampling and estimation of variable length Markov Chains. More over in the part, we propose a new method of resampling for data sets with a renewal point / Mestrado / Estatistica e Probabilidade / Mestre em Estatística
|
Page generated in 0.0565 seconds