Spelling suggestions: "subject:"inferencia estatisticamente"" "subject:"conferencia estatisticamente""
1 |
Distancia de matusita e comparação de duas amostrasVillanueva Rojas, Oscar 12 September 1984 (has links)
Orientador: Jose Antonio Cordeiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Ciencia da Computação / Made available in DSpace on 2018-07-17T00:27:55Z (GMT). No. of bitstreams: 1
VillanuevaRojas_Oscar_M.pdf: 1222307 bytes, checksum: 253624851090b21ceac7582fb124fa28 (MD5)
Previous issue date: 1984 / Resumo: Não informado. / Abstract: Not informed. / Mestrado / Mestre em Estatística
|
2 |
[en] AN INFERENTIAL PROCEDURE FOR FACTOR ANALYSIS USING BOOTSTRAP AND JACKKNIFE TECHNIQUES: CONSTRUCTION OF CONFIDENCE INTERVALS AND TESTS OF HYPOTHESES / [pt] UM PROCEDIMENTO INFERENCIAL PARA ANÁLISE FATORIAL UTILIZANDO AS TÉCNICAS BOOTSTRAP E JACKKNIFE: CONSTRUÇÃO DE INTERVALOS DE CONFIANÇA E TESTES DE HIPÓTESESGIOVANI GLAUCIO DE OLIVEIRA COSTA 27 July 2006 (has links)
[pt] A análise fatorial é a denominação atribuída às técnicas
estatísticas
paramétricas multivariadas utilizadas para estudar o inter-
relacionamento entre
um conjunto de variáveis observadas. É um processo
destinado essencialmente à
redução e à sumarização dos dados, tornando-se em vários
campos da pesquisa
científica uma boa opção para um melhor gerenciamento de
informações reais,
gerando variáveis remanescentes mais significativas e
fáceis de serem trabalhadas.
Ainda assim, uma possível limitação da análise fatorial é
que não existem testes
estatísticos conclusivos ou satisfatoriamente eficazes e
que possam ser
regularmente empregados, portanto, para a sua
significância. Conseqüentemente,
é difícil saber se os resultados são meramente acidentais,
ou realmente refletem
algo significativo. Por esse motivo, esta tese de
doutorado visa estabelecer um
procedimento inferencial para a análise fatorial
utilizando-se de técnicas CIS
(Computer Intensive Statistics), tais como o bootstrap e o
jackknife, que permitam
que a análise fatorial saia do terreno puramente
descritivo e ladeando a
insuficiência da teoria da distribuição de amostragem que
se faz sentir em técnicas
multivariadas. / [en] Factor analysis is the denomination attributed to the
multivariate
parametric statistical techniques used to study the inter-
relationship between a set
of observed variables. It is a process essentially
intended to reduce and summarize
data, thus becoming a good option for a better management
of real information,
generating remainder variables that are more significant
and easier to work with,
in various fields of scientific research. However, a
possible limitation of factor
analysis is that there are no conclusive statistical tests
regularly employed in
testing the hypotheses. Consequently, it is difficult to
know if the results are
merely accidents, or indeed, reflect something of
significance. For this reason, this
study intends to establish an inferential procedure for
factor analysis, using CIS
(Computer Intensive Statistics) techniques, such as the
bootstrap and jackknife,
which allow factor analysis to pass out of the purely
descriptive, solving the
problem of the insufficiency of sample distribution theory
as seen in multivariate
techniques.
|
3 |
Modelo de Grubbs em grupos / Grubbs' model with subgroupsZeller, Camila Borelli 23 February 2006 (has links)
Orientador: Filidor Edilfonso Vilca Labra / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-05T23:55:16Z (GMT). No. of bitstreams: 1
Zeller_CamilaBorelli_M.pdf: 3683998 bytes, checksum: 26267086098b12bd76b1d5069f688223 (MD5)
Previous issue date: 2006 / Resumo: Neste trabalho, apresentamos um estudo de inferência estatística no modelo de Grubbs em grupos, que representa uma extensão do modelo proposto por Grubbs (1948,1973) que é freqüentemente usado para comparar instrumentos ou métodos de medição. Nós consideramos a parametrização proposta por Bedrick (2001). O estudo é baseado no método de máxima verossimilhança. Testes de hipóteses são considerados e baseados nas estatísticas de wald, escore e razão de verossimilhanças. As estimativas de máxima verossimilhança do modelo de Grubbs em grupos são obtidas usando o algoritmo EM e considerando que as observações seguem uma distribuição normal. Apresentamos um estudo de análise de diagnóstico no modelo de Grubbs em grupos com o interesse de avaliar o impacto que um determinado subgrupo exerce na estimativa dos parâmetros. Vamos utilizar a metodologia de influência local proposta por Cook (1986), considerando o esquema de perturbação: ponderação de casos. Finalmente, apresentamos alguns estudos de simulação e ilustramos os resultados teóricos obtidos usando dados encontrados na literatura / Abstract: In this work, we presented a study of statistical inference in the Grubbs's model with subgroups, that represents an extension of the model proposed by Grubbs (1948,1973) that is frequently used to compare instruments or measurement methods. We considered the parametrization proposed by Bedrick (2001). The study is based on the maximum likelihood method. Tests of hypotheses are considered and based on the wald statistics, score and likelihood ratio statistics. The maximum likelihood estimators of the Grubbs's model with subgroups are obtained using the algorithm EM and considering that the observations follow a normal distribution. We also presented a study of diagnostic analysis in the Grubb's model with subgroups with the interest of evaluating the effect that a certain one subgroup exercises in the estimate of the parameters. We will use the methodology of local influence proposed by Cook (1986) considering the schemes of perturbation of case weights. Finally, we presented some simulation studies and we illustrated the obtained theoretical results using data found in the literature / Mestrado / Mestre em Estatística
|
4 |
Avaliação de transcritos diferencialmente expressos neoplasias humanas com ORESTES / Evaluation of differential expression profiles across neoplasic human samples using ORESTES (Opening reading frame)Peres, Tarcisio de Souza 30 August 2006 (has links)
Orientador: Fernando Lopes Alberto / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciencias Medicas / Made available in DSpace on 2018-08-07T09:04:32Z (GMT). No. of bitstreams: 1
Peres_TarcisiodeSouza_M.pdf: 2330056 bytes, checksum: 66c1d9241ad60e2d973cfb7361a5eb7c (MD5)
Previous issue date: 2006 / Resumo: Durante todo o século XX, a pesquisa do câncer se desenvolveu de maneira sistemática, porém os últimos 25 anos foram notadamente caracterizados por rápidos avanços que geraram uma rica e complexa base de conhecimentos, evidenciando a doença dentro de um conjunto dinâmico de alterações no genoma. Desta forma, o entendimento completo dos fenômenos moleculares envolvidos na fisiopatologia das neoplasias depende do conhecimento dos diversos processos celulares e bioquímicos característicos da célula tumoral e que, porventura, a diferenciem da célula normal (GOLUB e SLONIM, 1999). Nesse trabalho buscamos o melhor entendimento das vias moleculares no processo neoplásico por meio da análise dos dados do Projeto Genoma Humano do Câncer (CAMARGO, 2001) com vistas à identificação de genes diferencialmente expressos nas neoplasias dos seguintes tecidos: mama, cólon, cabeça e pescoço, pulmão, sistema nervoso central, próstata, estômago, testículo e útero. A metodologia de geração dos transcritos utilizada pelo Projeto Genoma Humano do Câncer é conhecida como ORESTES (DIAS et al, 2000). Inicialmente, os dados de seqüenciamento (fragmentos ORESTES) foram agrupados por meio de uma técnica conhecida em Bioinformática como ¿montagem¿, utilizando o pacote de programas de computador PHRED/PHRAP (EWING e GREEN P., 1998). A comparação de cada agrupamento com seqüências conhecidas (depositadas em bases públicas) foi realizada por meio do algoritmo BLAST (ALTSCHUL et al, 1990). Um subconjunto de genes foi selecionado com base em critérios específicos e submetido à avaliação de seus níveis de expressão em diferentes tecidos com base em abordagem de inferência Bayesiana (CHEN et al, 1998), em contraposição às abordagens mais clássicas, como testes de hipótese nula (AUDIC e CLAVERIE, 1997). A inferência Bayesiana foi viabilizada pelo desenvolvimento de uma ferramenta computacional escrita em linguagem PERL (PERES et al, 2005). Com o apoio da literatura, foi criada uma lista de genes relacionados ao fenômeno neoplásico. Esta lista foi confrontada com as informações de expressão gênica, constituindo-se em um dos parâmetros de um sistema de classificação (definido para a seleção dos genes de interesse). Desta forma, parte da base de conhecimento sobre câncer foi utilizada em conjunto com os dados de expressão gênica inferidos a partir dos fragmentos ORESTES. Para contextualização biológica da informação gerada, os genes foram classificados segundo nomenclatura GO (ASHBURNER et al, 2000) e KEGG (OGATA et al, 1999). Parte dos genes apontados como diferencialmente expressos em pelo menos um tecido tumoral, em relação ao seu equivalente normal, integram vias relacionadas ao fenômeno neoplásico (HAHN e WEINBERG, 2002). Dos genes associados a estas vias, 52% deles possuíam fator de expressão diferencial (em módulo) superior a cinco. Finalmente, dez entre os genes classificados foram escolhidos para confirmação experimental dos achados. Os resultados de qPCR em amostras de tecido gástrico normal e neoplásico foram compatíveis com com os dados de expressão gênica inferidos a partir dos fragmentos ORESTES / Abstract: The XXth century showed the development in cancer research in a systematic way, most notably in the last 25 years that were characterized by rapid advances that generated a rich and complex body of knowledge, highlighting the disease within a dynamic group of changes in the genome. The complete understanding of the molecular phenomena involved in the physiopathology of neoplasia is based upon the knowledge of the varied cellular and biochemical processes which are characteristic of the tumor and which make it different from the normal cell (GOLUB e SLONIM, 1999) In this work, we investigated the molecular pathways in the neoplasic process through data analyses of the cDNA sequences generated on the Human Cancer Genome Project (CAMARGO, 2001). The following neoplasias were included: breast, colon, head and neck, lungs, central nervous system, prostate gland, stomach, testicle and womb. The methodology of generation of transcripts used by the Genome Project of Human Cancer is known as ORESTES (DIAS et al, 2000). Initially, the sequence of data (ORESTES fragments) were grouped and assembled according to similarity scores. For this purpose, we used the package of computer programs PHRED/PHRAP (EWING e GREEN P., 1998). The resulting consensus sequences, each representing a cluster, were compared to known sequences (deposited in public databanks) through the BLAST algorithm (ALTSCHUL et al, 1990). A subgroup of genes was selected based on specific criteria and their levels of expression in different tissues were evaluated by a bayesian inference approach (CHEN et al, 1998), as compared to more classical approaches such as null hypothesis tests (AUDIC e CLAVERIE, 1997). The Bayesian inference tool was represented as a PERL script developed for this work. A list of genes, putatively related to the neoplasic phenotype, was created with the support of the literature. This list was compared to the gene expression information, becoming one of the parameters of a ranking system (defined for the selection of genes of interest). Therefore, part of the knowledge related to cancer was used together with the data of gene expression inferred from ORESTES fragments. For a more accurate understanding of the molecular pathways involved in the generated information, the genes were classified according to the Gene Ontology (ASHBURNER et al, 2000) and KEGG (OGATA et al, 1999) nomenclatures. Additional global analyses by pathways related to the neoplasic phenomenon (HAHN e WEINBERG, 2002) demonstrated differential expression of the selected genes. About 52% of the genes in this pathways were differentially expressed in tumor tissue with at least a 5-fold. Finally, ten genes were selected for experimental validation (in vitro) of the findings with real-time quantitative PCR, confirming in silico results / Mestrado / Ciencias Biomedicas / Mestre em Ciências Médicas
|
5 |
Modelos lineares generalizados mistos multivariados para caracterização genética de doenças / Multivariate generalized linear mixed models for genetic characterization of diseasesBaldoni, Pedro Luiz, 1989- 24 August 2018 (has links)
Orientador: Hildete Prisco Pinheiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação / Made available in DSpace on 2018-08-24T09:34:36Z (GMT). No. of bitstreams: 1
Baldoni_PedroLuiz_M.pdf: 4328843 bytes, checksum: 0ab04f375988e62ac31097716ac0eaa5 (MD5)
Previous issue date: 2014 / Resumo: Os Modelos Lineares Generalizados Mistos (MLGM) são uma generalização natural dos Modelos Lineares Mistos (MLM) e dos Modelos Lineares Generalizados (MLG). A classe dos MLGM estende a suposição de normalidade dos dados permitindo o uso de várias outras distribuições bem como acomoda a superdispersão frequentemente observada e também a correlação existente entre observações em estudos longitudiais ou com medidas repetidas. Entretanto, a teoria de verossimilhança para MLGM não é imediata uma vez que a função de verossimilhança marginal não possui forma fechada e envolve integrais de alta dimensão. Para solucionar este problema, diversas metodologias foram propostas na literatura, desde técnicas clássicas como quadraturas numéricas, por exemplo, até métodos sofisticados envolvendo algoritmo EM, métodos MCMC e quase-verossimilhança penalizada. Tais metodologias possuem vantagens e desvantagens que devem ser avaliadas em cada tipo de problema. Neste trabalho, o método de quase-verossimilhança penalizada (\cite{breslow1993approximate}) foi utilizado para modelar dados de ocorrência de doença em uma população de vacas leiteiras pois demonstrou ser robusto aos problemas encontrados na teoria de verossimilhança deste conjunto de dados. Além disto, os demais métodos não se mostram calculáveis frente à complexidade dos problemas existentes em genética quantitativa. Adicionalmente, estudos de simulação são apresentados para verificar a robustez de tal metodologia. A estabilidade dos estimadores e a teoria de robustez para este problema não estão completamente desenvolvidos na literatura / Abstract: Generalized Linear Mixed Models (GLMM) are a generalization of Linear Mixed Models (LMM) and of Generalized Linear Models (GLM). The class of models GLMM extends the normality assumption of the data and allows the use of several other probability distributions, for example, accommodating the over dispersion often observed and also the correlation among observations in longitudinal or repeated measures studies. However, the likelihood theory of the GLMM class is not straightforward since its likelihood function has not closed form and involves a high order dimensional integral. In order to solve this problem, several methodologies were proposed in the literature, from classical techniques as numerical quadrature¿s, for example, up to sophisticated methods involving EM algorithm, MCMC methods and penalized quasi-likelihood. These methods have advantages and disadvantages that must be evaluated in each problem. In this work, the penalized quasi-likelihood method (\cite{breslow1993approximate}) was used to model infection data in a population of dairy cattle because demonstrated to be robust in the problems faced in the likelihood theory of this data. Moreover, the other methods do not show to be treatable faced to the complexity existing in quantitative genetics. Additionally, simulation studies are presented in order to verify the robustness of this methodology. The stability of these estimators and the robust theory of this problem are not completely studied in the literature / Mestrado / Estatistica / Mestre em Estatística
|
6 |
Modelos de regressão Birnbaum-Saunders baseados na distribuição normal assimétrica centrada / Birnbaum-Saunders regression models based on skew-normal centered distributionChaves, Nathalia Lima, 1989- 26 August 2018 (has links)
Orientadores: Caio Lucidius Naberezny Azevedo, Filidor Edilfonso Vilca Labra / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-26T22:33:37Z (GMT). No. of bitstreams: 1
Chaves_NathaliaLima_M.pdf: 3044792 bytes, checksum: 8fea3cd9d074997b605026a7a4526c35 (MD5)
Previous issue date: 2015 / Resumo: A classe de modelos Birnbaum-Saunders (BS) foi desenvolvida a partir de problemas que surgiram na área de confiabilidade de materiais. Tais problemas, em geral, são ligados ao estudo de fadiga de materiais. No entanto, nos últimos tempos, essa classe de modelos tem sido aplicada em áreas fora do referido contexto como, por exemplo, em ciências da saúde, ambiental, florestal, demográficas, atuariais, financeira, entre outras, devido à sua grande versatilidade. Neste trabalho desenvolvemos a distribuição Birnbaum-Saunders (BS) baseada na normal assimétrica padrão sob a parametrização centrada (BSNAC) que, além de representar uma extensão da distribuição BS usual, apresenta diversas vantagens em relação à distribuição BS baseada na distribuição normal assimétrica sob a parametrização usual. Desenvolvemos também um modelo de regressão linear log-Birnbaum-Saunders. Apresentamos, tanto para a distribuição BSNAC quanto para o respectivo modelo de regressão, diversas propriedades. Desenvolvemos procedimentos de estimação sob os enfoques frenquentista e bayesiano, bem como ferramentas de diagnóstico para os modelos propostos, contemplando análise residual e medidas de influência. Realizamos estudos de simulação, considerando diferentes cenários, com o intuito de comparar as estimativas frequentistas e bayesianas, bem como avaliar o desempenho das medidas de diagnóstico. A metodologia aqui proposta foi ilustrada tanto com dados provenientes de estudos de simulação, quanto com conjuntos de dados reais / Abstract: The class of Birnbaum-Saunders (BS) models was developed from problems that arose in the field of material reliability. These problems generally are related to the study of material fatigue. However, in the last years, this class of models has been applied in areas outside that context, such as in health sciences, environmental, forestry, demographic, actuarial, financial, among others, due to its great versatility. In this work, we developed the skew-normal Birnbaum-Saunders distribution under the centered parameterization (BSNAC), which also represents an extension of the usual BS distribution and presents several advantages over the BS distribution based on the skew-normal distribution under the usual parameterization. We also developed a log-Birnbaum-Saunders linear regression model. We present several properties of both BSNAC distribution and the related regression model. We develop estimation procedures under the frequentist and Bayesian approaches, as well as diagnostic tools for the proposed models, contemplating residual analysis and measures of influence. We conducted simulation studies considering different scenarios, in order to compare the frequentist and Bayesian estimates and evaluate the performance of diagnostic measures. The methodology proposed here is illustrated with data sets from both simulation studies and real data sets / Mestrado / Estatistica / Mestra em Estatística
|
7 |
[en] IDENTIFICATION OF MECHANICAL SYSTEMS PARAMETERS THROUGH INVERSE PROBLEM S RESOLUTION WITH BAYESIAN STATISTICAL INFERENCE / [pt] IDENTIFICAÇÃO DE PARÂMETROS EM SISTEMAS MECÂNICOS ATRAVÉS DA RESOLUÇÃO DO PROBLEMA INVERSO COM INFERÊNCIA ESTATÍSTICA BAYESIANAMARIO GERMAN SANDOVAL 12 January 2015 (has links)
[pt] O problema de estimação pode ser entendido como um caso particular
dos problemas inversos. Dadas observações da resposta de um sistema
para certas causas, deseja-se estimar certas características do sistema. Essas
características, em um sistema dinâmico, geralmente são representadas
por parâmetros. Assim, para uma representação físico-matemática do sistema,
dada uma excitação e observando a resposta, é possível obter uma
estimação dos parâmetros. A estimação paramétrica é de grande importância
e utilizada em diversas situações, desde experimentalistas, ao observar
fenômenos no laboratório, até quem estuda o comportamento de setores
sociais por amostras populacionais. A parte inicial desta dissertação apresenta
uma breve introdução ao problema inverso do marco da estatística
Bayesiana. Neste marco trata-se a estimação paramétrica como resultado da
resolução de um problema inverso. Duas técnicas de estimação s ao deduzidas
a partir da inferência estatística Bayesiana. A primeira delas, mínimos
quadrados, coleta todos os dados e logo faz a estimação. A segunda, filtro
de Kalman (e filtro de Kalman extendido), melhora o estado do conhecimento
dos parâmetros a serem estimados a cada nova observação. Para a
abordagem destas técnicas de estimação, de modo de poder compará-las, é
apresentada a resolução analítica de um sistema harmônico de um e dois
graus de liberdade. Por último, é apresentada uma modelagem de uma bancada
experimental, em escala de laboratório, que emula uma coluna de perfura
ção acoplada a um motor. Esta bancada foi desenvolvida para estudos
de dinâmica torcional, na dissertação de mestrado de Bruno C. Cayres A.,
de modo que aqui só é de interesse a caracterização da mesma. As técnicas
de estimação paramétrica são usadas de forma teórica, simulando os dados
a partir de soluções analíticas para diferentes parâmetros da modelagem do
motor e da coluna. Também usa-se medições feitas na bancada para estimar
os parâmetros da modelagem, obtendo assim um conhecimento melhorado
dos parâmetros envolvidos no sistema coluna-motor. / [en] The estimation problem can be understood as a particular case of
an inverse problem. Given observations of the response of a system, due
to certain causes, one wants to estimate certain characteristics of the
problem. These features, in a dynamic system, are usually represented by
parameters. Thus, for a mathematical representation of the physical system,
given an excitation and given the observing response, it is possible to give
an estimation of the parameters. The parameter estimation is of great
importance and used in countless situations, such as experimental obseration
of a phenomena in the laboratory or even by those who study the behaviors
social sectors by population samples. The initial part of this dissertation
presents a brief introduction to the inverse problem the framework of the
Bayesian statistics. In this context, the parametric estimation is a result of
the resolution of an inverse problem. Two estimation techniques are derived
from the Bayesian statistical inference. The first of these, least squares,
collects all the data and then makes the estimation. The second, Kalman
filter (and extended filter Kalman), improves the state of knowledge of the
parameters to be estimated, with each new observation. To address these
estimation techniques, in order to be able to compare them, presents the
analytical resolution of a harmonious system of one and two degrees of
freedom. Finally, it is presented a model for an experimental setup, in
laboratory scale, which emulates a drillstring coupled to a motor. This
experimental setup was developed to study the dynamic torsional and by the
author of the dissertation of Bruno C. Cayres A., the mode that is of interest
here only the characterization of it. These techniques are used for parameter
estimation in theoretical way, simulating data from the analytical solutions,
for different parameters involved in the column-motor modeling. Also, we
use measurements obtained from the experimental setup to estimate the
parameters of the column-motor model. Thereby, we obtain an improved
knowledge of the parameters involved in the column-motor.
|
8 |
Medidas de dependência entre séries temporais: estudo comparativo, análise estatística e aplicações em neurociências / Measures of dependence between time series: Comparative study, statistical analysis and applications in neuroscienceBrito, Carlos Stein Naves de 29 July 2010 (has links)
Medidas de dependência entre séries temporais são estudadas com a perspectiva de evidenciar como diferentes regiões do cérebro interagem, por meio da aplicação a sinais eletrofisiológicos. Baseado na representação auto-regressiva e espectral de séries temporais, diferentes medidas são comparadas entre si, incluindo coerência espectral e a coerência parcial direcionada, e introduz-se uma nova medida, denominada transferência parcial direcionada. As medidas são analisadas pelas propriedades de parcialização, relações diretas ou indiretas e direcionalidade temporal, e são mostradas suas relações com a correlação quadrática. Conclui-se que, entre as medidas analisadas, a coerência parcial direcionada e a transferência parcial direcionada possuem o maior número de características desejáveis, fundamentadas no conceito de causalidade de Granger. A estatística assintótica é desenvolvida para todas as medidas, incluindo intervalo de confiança e teste de hipótese nula, assim como sua implementação computacional. A aplicação a séries simuladas e a análise de dados eletrofisiológicos reais ilustram o estudo comparativo e a aplicabilidade das novas estatísticas apresentadas. / Measures of dependence between temporal series are studied in the context of revealing how different brain regions interact, through their application to electrophysiology. Based on the spectral and autoregressive model of time series, different measures are compared, including coherence and partial directed coherence, and a new measure is introduced, named partial directed transfer. The measures are analyzed through the properties of partialization, direct or indirect relations and temporal directionality, and their relation to quadratic correlation is shown. It results that among the presented measures, partial directed coherence and partial directed transfer reveal the highest number of desirable properties, being grounded on the concept of Granger causality. The asymptotic statistics for all measures are developed, including confidence intervals and null hypothesis testing, as well as their computational implementation. The application to simulated series and the analysis of electrophysiological data illustrate the comparative study and the applicability of the newly presented statistics.
|
9 |
Modelos de regressão beta retangular heteroscedásticos aumentados em zeros e uns / Zero-one augmented heteroscedastic rectangular beta regression modelsSilva, Ana Roberta dos Santos, 1989- 26 August 2018 (has links)
Orientador: Caio Lucidius Naberezny Azevedo / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-26T19:30:15Z (GMT). No. of bitstreams: 1
Silva_AnaRobertadosSantos_M.pdf: 4052475 bytes, checksum: 08fb6f3f7b4ed838df4eea2dbcf06a29 (MD5)
Previous issue date: 2015 / Resumo: Neste trabalho desenvolvemos a distribuição beta retangular aumentada em zero e um, bem como um correspondente modelo de regressão beta retangular aumentado em zero e um para analisar dados limitados-aumentados (representados por variáveis aleatórias mistas com suporte limitado), que apresentam valores discrepantes. Desenvolvemos ferramentas de inferência sob as abordagens bayesiana e frequentista. No que diz respeito à inferência bayesiana, devido à impossibilidade de obtenção analítica das posteriores de interesse, utilizou-se algoritmos MCMC. Com relação à estimação frequentista, utilizamos o algoritmo EM. Desenvolvemos técnicas de análise de resíduos, utilizando o resíduo quantil aleatorizado, tanto sob o enfoque frequentista quanto bayesiano. Desenvolvemos, também, medidas de influência, somente sob o enfoque bayesiano, utilizando a medida de Kullback Leibler. Além disso, adaptamos métodos de checagem preditiva à posteriori existentes na literatura, ao nosso modelo, utilizando medidas de discrepância apropriadas. Para a comparação de modelos, utilizamos os critérios usuais na literatura, como AIC, BIC e DIC. Realizamos diversos estudos de simulação, considerando algumas situações de interesse prático, com o intuito de comparar as estimativas bayesianas com as frequentistas, bem como avaliar o comportamento das ferramentas de diagnóstico desenvolvidas. Um conjunto de dados da área psicométrica foi analisado para ilustrar o potencial do ferramental desenvolvido / Abstract: In this work we developed the zero-one augmented rectangular beta distribution, as well as a correspondent zero-one augmented rectangular beta regression model to analyze limited-augmented data (represented by mixed random variables with limited support), which present outliers. We develop inference tools under the Bayesian and frequentist approaches. Regarding to the Bayesian inference, due the impossibility of obtaining analytically the posterior distributions of interest, we used MCMC algorithms. Concerning the frequentist estimation, we use the EM algorithm. We develop techniques of residual analysis, by using the randomized quantile residuals, under both frequentist and Bayesian approaches. We also developed influence measures, only under the Bayesian approach, by using the measure of Kullback Leibler. In addition, we adapt methods of posterior predictive checking available in the literature, to our model, using appropriate discrepancy measures. For model selection, we use the criteria commonly employed in the literature, such as AIC, BIC and DIC. We performed several simulation studies, considering some situations of practical interest, in order to compare the Bayesian and frequentist estimates, as well as to evaluate the behavior of the developed diagnostic tools. A psychometric real data set was analyzed to illustrate the performance of the developed tools / Mestrado / Estatistica / Mestra em Estatística
|
10 |
Medidas de dependência entre séries temporais: estudo comparativo, análise estatística e aplicações em neurociências / Measures of dependence between time series: Comparative study, statistical analysis and applications in neuroscienceCarlos Stein Naves de Brito 29 July 2010 (has links)
Medidas de dependência entre séries temporais são estudadas com a perspectiva de evidenciar como diferentes regiões do cérebro interagem, por meio da aplicação a sinais eletrofisiológicos. Baseado na representação auto-regressiva e espectral de séries temporais, diferentes medidas são comparadas entre si, incluindo coerência espectral e a coerência parcial direcionada, e introduz-se uma nova medida, denominada transferência parcial direcionada. As medidas são analisadas pelas propriedades de parcialização, relações diretas ou indiretas e direcionalidade temporal, e são mostradas suas relações com a correlação quadrática. Conclui-se que, entre as medidas analisadas, a coerência parcial direcionada e a transferência parcial direcionada possuem o maior número de características desejáveis, fundamentadas no conceito de causalidade de Granger. A estatística assintótica é desenvolvida para todas as medidas, incluindo intervalo de confiança e teste de hipótese nula, assim como sua implementação computacional. A aplicação a séries simuladas e a análise de dados eletrofisiológicos reais ilustram o estudo comparativo e a aplicabilidade das novas estatísticas apresentadas. / Measures of dependence between temporal series are studied in the context of revealing how different brain regions interact, through their application to electrophysiology. Based on the spectral and autoregressive model of time series, different measures are compared, including coherence and partial directed coherence, and a new measure is introduced, named partial directed transfer. The measures are analyzed through the properties of partialization, direct or indirect relations and temporal directionality, and their relation to quadratic correlation is shown. It results that among the presented measures, partial directed coherence and partial directed transfer reveal the highest number of desirable properties, being grounded on the concept of Granger causality. The asymptotic statistics for all measures are developed, including confidence intervals and null hypothesis testing, as well as their computational implementation. The application to simulated series and the analysis of electrophysiological data illustrate the comparative study and the applicability of the newly presented statistics.
|
Page generated in 0.1395 seconds