• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 99
  • 42
  • 9
  • 6
  • 3
  • 3
  • 1
  • 1
  • Tagged with
  • 179
  • 179
  • 91
  • 88
  • 33
  • 32
  • 22
  • 22
  • 20
  • 19
  • 18
  • 17
  • 17
  • 16
  • 15
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
101

Modelos de regressão com e sem fração de cura para dados bivariados em análise de sobrevivência / Models with and without fraction of cure for bivariate data in survival analysis

Fachini, Juliana Betini 19 August 2011 (has links)
Neste trabalho são reunidos diferentes modelos e técnicas para representar situações experimentais ou observacionais de análise de sobrevivência. Para modelar respostas bivariadas e covariáveis foi proposto o modelo de regressão Kumaraswamy-Weibull bivariado. A presen»ca de indivíduos curados foi considerada sob duas diferentes abordagens, originando o modelo de regressão com fração de cura para dados bivariados por meio de cópulas e o modelo de regressão log-linear bivariado com fração de cura. Os parâmetros dos modelos foram esti- mados pelo método de máxima verossimilhança sujeito a restriçãoo nos parâmetros por meio da função barreira adaptada. Adaptou-se uma análise de sensibilidade de forma a considerar as metodologias de Influência Global, Influência Local e Influência Local Total para verificar vários aspectos que envolvem a formulação e ajuste dos modelos propostos. Utilizou-se um conjunto de dados de insuficiência renal e retinopatia diabética são utilizados para exemplificar a aplicação dos modelos propostos. / This work brought together di®erent models and techniques to represent expe- rimental or observational situations in survival analysis. To model bivariate responses and covariates was proposed Kumaraswamy Weibull bivariate regression model. The presence of cured individuals was considered under two di®erent approaches originating the regression model with a cured fraction for bivariate data through copulas and the log-linear bivariate regression model with cured fraction. The parameters of the models were estimated by ma- ximum likelihood method subject to the restriction on the parameters through the adapted barrier function. A sensitivity analysis was adapted considering the methodologies of Global In°uence, Local In°uence and Total Local In°uence to check various aspects of the formulation and adjustment of the models proposed. Data set of renal failure and diabetic retinopathy are used to exemplify the application of the proposed models.
102

Modelos de regressão linear heteroscedásticos com erros t-Student: uma abordagem bayesiana objetiva / Heteroscedastics linear regression models with Student t erros: an objective bayesian analysis.

Souza, Aline Campos Reis de 18 February 2016 (has links)
Neste trabalho, apresentamos uma extensão da análise bayesiana objetiva feita em Fonseca et al. (2008), baseada nas distribuições a priori de Jeffreys para o modelo de regressão linear com erros t-Student, para os quais consideramos a suposição de heteoscedasticidade. Mostramos que a distribuição a posteriori dos parâmetros do modelo regressão gerada pela distribuição a priori é própria. Através de um estudo de simulação, avaliamos as propriedades frequentistas dos estimadores bayesianos e comparamos os resultados com outras distribuições a priori encontradas na literatura. Além disso, uma análise de diagnóstico baseada na medida de divergência Kullback-Leiber é desenvolvida com a finalidade de estudar a robustez das estimativas na presença de observações atípicas. Finalmente, um conjunto de dados reais é utilizado para o ajuste do modelo proposto. / In this work , we present an extension of the objective bayesian analysis made in Fonseca et al. (2008), based on Jeffreys priors for linear regression models with Student t errors, for which we consider the heteroscedasticity assumption. We show that the posterior distribution generated by the proposed Jeffreys prior, is proper. Through simulation study , we analyzed the frequentist properties of the bayesian estimators obtained. Then we tested the robustness of the model through disturbances in the response variable by comparing its performance with those obtained under another prior distributions proposed in the literature. Finally, a real data set is used to analyze the performance of the proposed model . We detected possible in uential points through the Kullback -Leibler divergence measure, and used the selection model criterias EAIC, EBIC, DIC and LPML in order to compare the models.
103

[en] THE E SCORE MODEL FOR THE PREDICTION OF BANKRUPTCY OF INTERNET COMPANIES / [pt] O MODELO E SCORE DE PREVISÃO DE FALÊNCIAS PARA EMPRESAS DE INTERNET

ORLANDO MANSUR T S A PEREIRA 10 March 2003 (has links)
[pt] O objetivo desta pesquisa é propor um modelo estatístico que possa estimar a probabilidade de ocorrência de falências ou concordatas em empresas de Internet. Após as recentes e drásticas perdas de capital em investimentos nas empresas desta nova indústria, instituições financeiras, pessoas físicas e todos os investidores desejam ter o conhecimento da real situação financeira das empresas denominadas pontocom. Esta pesquisa selecionou empresas norte-americanas que pediram falência ou concordata nas Cortes Norte-Americanas de Falências,entre 1999 e 2001, e empresas que não o fizeram, por amostragem de conveniência, que possuem ações listadas em bolsa e operam no e-commerce, isto é que vendem seus produtos ou serviços através da Internet. Utilizou, ainda, as demonstrações financeiras destas empresas para identificar, por intermédio de um teste T de amostras independentes, as variáveis mais significantes na discriminação dos dois grupos de empresas observados na amostra: o de empresas falidas e o de não-falidas. Analisadas as distribuições estatísticas das variáveis,o modelo de regressão logística demonstra ser o mais apropriado à pesquisa, por não possuir a premissa de normalidade multivariada. A conclusão final da pesquisa é a proposição de um modelo estatístico que indica a probabilidade de uma empresa de Internet falir ou não, com índice R2 de Nagelkerke de 0,887, percentual máximo de acerto na classificação de 97,4 por cento e que utiliza ainda não utilizadas em pesquisas anteriores similares. / [en] The objective of this research is to propose a statistical model that could estimate the probability of occurrence of bankruptcy for Internet companies. After the recent and drastic losses of investment capital in companies in this new sector of the economy, financial institutions, individuals and all investors wish to know the real financial position of these companies called dotcom. This research selected American companies that have filed a petition under the United States Bankruptcy Code, between 1999 and 2001, and companies which have not done it, by convenience sampling, that list their shares on stock markets and operate in e-commerce, i.e. companies that sell their products or services through the Internet. The financial statements of these companies were also used to identify,by analyzing a T test of independent samples, the most significant variables for discriminating the two observed groups in the sample: the bankrupt and the nonbankrupt companies. After analyzing the variables statistical distributions, a logistic regression model revealed to be the more appropriate for the research, for not having the multivariate normality assumption. The conclusion of this research proposes a statistical model which indicates the probability of an Internet company becoming bankrupt or not, with a Nagelkerke R Squared of 0,887, and an overall percentage of correct prediction of 97,4 percent. The model uses several variables not previously included in similar previous financial difficulties prediction models.
104

Modeling Patterns of Small Scale Spatial Variation in Soil

Huang, Fang 11 January 2006 (has links)
The microbial communities found in soils are inherently heterogeneous and often exhibit spatial variations on a small scale. Becker et al. (2006) investigate this phenomenon and present statistical analyses to support their findings. In this project, alternative statistical methods and models are considered and employed in a re-analysis of the data from Becker. First, parametric nested random effects models are considered as an alternative to the nonparametric semivariogram models and kriging methods employed by Becker to analyze patterns of spatial variation. Second, multiple logistic regression models are employed to investigate factors influencing microbial community structure as an alternative to the simple logistic models used by Becker. Additionally, the microbial community profile data of Becker were unobservable at several points in the spatial grid. The Becker analysis assumes that the data are missing completely at random and as such have relatively little impact on inference. In this re-analysis, this assumption is investigated and it is shown that the pattern of missingness is correlated with both metabolic potential and spatial coordinates and thus provides useful information that was previously ignored by Becker. Multiple imputation methods are employed to incorporate the information present in the missing data pattern and results are compared with those of Becker.
105

Redução da dimensionalidade para estimativa de teores de nutrientes em folhas e grãos de soja com espectroscopia no infravermelho

Ferreira, Pablo Henrique 27 April 2017 (has links)
Submitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2017-11-30T19:05:51Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Pablo Henrique Ferreira.pdf: 12205608 bytes, checksum: a2f75e7cec618577bfd7fddda3302b17 (MD5) / Made available in DSpace on 2017-11-30T19:05:51Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Pablo Henrique Ferreira.pdf: 12205608 bytes, checksum: a2f75e7cec618577bfd7fddda3302b17 (MD5) Previous issue date: 2017-04-27 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A alta dimensionalidade em bases de dados é um problema que pode estar presente em diversos segmentos, inclusive nas análises do estado de nutrientes em plantas. Atualmente essas análises são baseadas em metodologias que demandam tempo e reagentes. A espectroscopia do infravermelho próximo (NIR – NearInfrared) e médio (MIR – MiddleInfrared) têm se mostrado uma alternativa mais rápida e limpa em relação a quantificação simultânea de compostos. Os dados obtidos por esses equipamentos apresentam alta dimensão. A leitura ocorre em comprimentos de onda gerando centenas atributos para o NIR e milhares para o MIR. Uma das dificuldades está em identificar quais atributos são mais relevantes para análise dos nutrientes. Este trabalho teve como objetivo verificar o ganho de correlação obtido com o emprego de redução de dimensionalidade em dados obtidos por espectroscopia NIR e MIR, para estimativa de teores de 11 nutrientes em grãos e folhas de soja, sendo eles: Nitrogênio (N), Fósforo (P), Potássio (K), Cálcio (Ca), Magnésio (Mg), Enxofre (S), Cobre (Cu), Manganês (Mn), Ferro (Fe), Zinco (Zn) e Boro (B). Para isto, 231 amostras de folhas de soja e 285 de grãos de soja foram utilizadas para geração de modelos de regressão, sendo os espectros obtidos através dos espectrofotômetros NIR e MIR. Os modelos de regressão foram gerados pelos algoritmos de aprendizado de máquina SMOReg que implementa a máquina de vetor de suporte para regressão, o algoritmo baseado em árvores de decisão com funções de regressão M5Rules e o algoritmo LinearRegression. Os resultados foram avaliados através do coeficiente de correlação (r) e o erro quadrático (RRSE). A estimativa de nutrientes para folhas foi satisfatória tanto para espectroscopia NIR e MIR, onde correlações acima de 0,80 foram obtidas para os nutrientes P, K, Mg, S, Mn, Cu, Fe e Zn. Não houve correlações para B e Ca em folhas de soja. A estimativa de teores de nutrientes foi também satisfatória para grãos de soja, mas apenas em dados de espectroscopia NIR, onde correlações acima de 0,7 foram obtidas para N, P, K, Ca e S. O uso da redução de dimensionalidade proporcionou os altos valores para correlação de P, K e S em folhas de soja, fazendo uso do algoritmo LinearRegression. Para os grãos de soja, a redução de dimensionalidade foi imprescindível na obtenção de correlações satisfatórias, exceto para N, sempre utilizando o algoritmo LinearRegression. Quando a redução da dimensionalidade não foi usada, os resultados satisfatórios foram obtidos pelo algoritmo SMOREg a partir de dados foliares para os nutrientes N, Mg, Cu, Mn, Fe e Zn. A utilização da redução de dimensionalidade junto ao algoritmo LinearRegression auxiliou na obtenção de melhores correlações para três nutrientes em folhas e para os índices satisfatórios de grãos. Os resultados observados demonstram uma maior eficiência no uso do NIR para análises foliares do que para análises de grãos. As técnicas computacionais SMOReg e LinearRegression obtiveram os melhores resultados, sendo a SMOReg indicada para grandes quantidades de atributos e LinearRegression para quantidades menores de atributos. / The high dimensionality in databases is a problem that can occur in several fields, including the plants nutrients state analysis. These analyses are currently based on methodologies that spend time and reagents. (NIR-NearInfrared) and (MIR-MiddleInfrared) spectroscopy have been shown to be a faster and clean alternative to simultaneous quantification of compounds. Since reading occurs at wavelengths generating hundreds attributes for the NIR and thousands to the MIR the data obtained by such equipment have a high dimensionality. One of the difficulties is to identify which attributes are more relevant for the nutrient analysis. This work aimed to verify the correlation gain obtained with the use of dimensionality reduction techniques with data obtained by NIR and MIR spectroscopy. The goal is to estimated levels of 11 nutrients in grains and leaves of soybean: Nitrogen (N), Phosphorus (P), Potassium (K), Calcium (Ca), Magnesium (Mg), Sulfur (S), Copper (Cu), Manganese (Mn), Iron (Fe), Zinc (Zn) and Boron (B). For that, 231 soybean leaves and 285 soybeans samples were analysed by spectroscopy in the mid-infrared and nearinfrared region. The regression models were generated by machine learning algorithms: SMOReg which implements the support vector machine for regression; M5Rules that is based on decision trees with regression functions; and LinearRegression algorithm for linear regression. The results were evaluated by correlation coefficient (r) and the quadratic error (RRSE). Estimating leaf nutrients was satisfactory for both NIR and MIR spectroscopy, where correlations of 0.80 above were obtained for P, K, Mg, S, Mn, Cu, Fe and Zn. There were no correlations for B and Ca in soybean leaves. Estimating nutrient was also satisfactory for soybeans, but only in NIR spectroscopy data, where correlations above 0.7 were obtained for N, P, K, Ca, and S. Using dimensionality reduction techniques provided the high values for correlation of P, K, and S in soybean leaves, making use of the LinearRegression algorithm. For soybeans, the dimensionality reduction was essential in obtaining satisfactory correlations, except for N, always using the LinearRegression algorithm. When reducing the dimensionality was not used, satisfactory results were obtained by the SMOREg algorithm from foliar data to N, Mg, Cu, Mn, Fe, and Zn. Reducing dimensionality associated to the use of LinearRegression algorithm resulted in better correlations for three nutrients in leaves and satisfactory rates of grain. The observed results demonstrate a greater efficiency in the use of the NIR for foliar analysis than for grain analysis. SMOReg computational techniques and LinearRegression algorithm presented the best results, being the SMOReg indicated for large quantities of attributes and Linear- Regression for smaller quantities
106

Modelos de regressão com coeficientes funcionais para séries temporais / Functional-coefficient regression models for time series

Montoril, Michel Helcias 28 February 2013 (has links)
Nesta tese, consideramos o ajuste de modelos de regressão com coeficientes funcionais para séries temporais, por meio de splines, ondaletas clássicas e ondaletas deformadas. Consideramos os casos em que os erros do modelo são independentes e correlacionados. Através das três abordagens de estimação, obtemos taxas de convergência a zero para distâncias médias entre as funções do modelo e seus respectivos estimadores, propostos neste trabalho. No caso das abordagens de ondaletas (clássicas e deformadas), obtemos também resultados assintóticos em situações mais específicas, nas quais as funções do modelo pertencem a espaços de Sobolev e espaços de Besov. Além disso, estudos de simulação de Monte Carlo e aplicações a dados reais são apresentados. Por meio desses estudos numéricos, fazemos comparações entre as três abordagens de estimação propostas, e comparações entre outras abordagens já conhecidas na literatura, onde verificamos desempenhos satisfatórios, no sentido das abordagens propostas fornecerem resultados competitivos, quando comparados aos resultados oriundos de metodologias já utilizadas na literatura. / In this thesis, we study about fitting functional-coefficient regression models for time series, by splines, wavelets and warped wavelets. We consider models with independent and correlated errors. Through the three estimation approaches, we obtain rates of convergence to zero for average distances between the functions of the model and their estimators proposed in this work. In the case of (warped) wavelets approach, we also obtain asymptotic results in more specific situations, in which the functions of the model belong to Sobolev and Besov spaces. Moreover, Monte Carlo simulation studies and applications to real data sets are presented. Through these numerical results, we make comparisons between the three estimation approaches proposed here and comparisons between other approaches known in the literature, where we verify interesting performances in the sense that the proposed approaches provide competitive results compared to the results from methodologies used in literature.
107

Resposta hiperespectral na determinação do conteúdo de água na folha em diferentes espécies de Eucalyptus spp. / Hyperespectral response for determining the water content in leaves of different species of Eucalyptus spp.

Taila Fernanda Strabeli 27 September 2016 (has links)
Avaliar o estado hídrico das plantas é essencial para o monitoramento das culturas agrícolas e florestais. A interação da radiação eletromagnética com as plantas é um processo estudado por sensoriamento remoto (SR). Através da técnica de SR é possível interpretar os fatores que influenciam na quantidade de energia absorvida, transmitida e refletida pela planta. Neste estudo, buscou-se estabelecer as relações existentes entre variações nos parâmetros da água com o comportamento espectral e gerar modelos matemáticos que sejam capazes de predizer o conteúdo relativo da água (CRA) e espessura equivalente da água (EEA) em 11 diferentes espécies de Eucalyptus, utilizando um sensor hiperespectral. Os dados foram obtidos por meio da pesagem e respectiva leitura espectral das folhas, sendo que estas passaram por uma metodologia de desidratação. Tal metodologia permitiu encontrar uma diferença de reflectância média de 26% entre o máximo e mínimo teor de água na folha, provando a influência do CRA no comportamento espectral, sendo a água um dos fatores de maior domínio na reflectância na região do infravermelho médio (1300nm - 2500nm). A partir das curvas espectrais foi possível avaliar que os comprimentos de onda próximo ao 1400 nm e 1900 nm foram os mais sensíveis ao conteúdo de água. A análise de componentes principais permitiu reforçar estes resultados, uma vez que as pontuações (scores) dos componentes que apresentaram correlações significativas com o CRA tiveram maiores pesos (loadings) nas regiões espectrais citadas anteriormente. A partir das respostas espectrais também foram realizados os cálculos dos índices espectrais já descritos em literatura, e estes submetidos a análise de regressão simples para predição do CRA e EEA. O índice espectral calculado com a combinação de bandas do infravermelho médio (1300nm e 1450nm) foi o que apresentou melhores resultados ao predizer os parâmetros da água, sendo que o SR1300,1450 teve um R2=0,72 para o CRA e R2=0,81 para o EEA. Os dados espectrais foram correlacionados com os parâmetros da água, e encontrou-se que para o CRA o comprimento de onda 1881 nm apresentou um coeficiente de correlação máximo negativo de r= -0,89, enquanto que o EEA apresentou um coeficiente de correlação máximo negativo de r= -0,79 no comprimento de onda 2165 nm. Foram testados três métodos de seleção das variáveis hiperespectrais para gerar um modelo matemático por meio de uma regressão linear. Para o parâmetro CRA, o método de seleção de variáveis stepwise foi o que gerou o maior (R2= 0,86) e um RMSE = 13,85%, sendo que neste método restaram apenas seis variáveis preditoras. Enquanto que o método de seleção de variáveis pelas regiões do espectro foi o mais preciso ao predizer o parâmetro EEA, com um R2= 0,87 e um RMSE = 0,00012 g/cm2, sendo necessárias apenas 5 variáveis espectrais. / The hydric condition assessment of plants is essential for monitoring agricultural and forest cultures. The interaction of electromagnetic radiation with plants is a process studied by remote sensing. Through this technique it is possible to interpret the factors that plays influence on the quantity of energy absorbed, transmitted and reflected by the plant. In this study was sought the establishment of existing relations between variations on the water parameters and the spectral behavior and then to generate mathematical models capable of predictiong the relative water content (RWC) and equivalent water thickness (EWT) among 11 different Eucalyptus species using a hyperespectral sensor. The data was obtained through weighting followed by reflectance readings of leaves in which the leaves had gone through a dehydrating methodology. The dehydrating methodology allowed finding a average reflectance difference of 26% between the maximum and the minimum water content on the leaf, proving the influence of the RWC in the spectral behavior in which the water plays great influence in the medium infrared reflectance region (1300 nm - 2500 nm). From the spectral curves it was possible to conclude that the wavelengths near 1400 nm and 1900 nm were the most sensitive to the water content. The principal content analyses reinforced these results once the scores of the components that showed significant relations with the RWC had the bigger loadings in the mentioned spectral regions. Spectral indices already described in literature were calculated using the spectral responses and their results were submitted to a simple regression for predicting RWC and EWT. The spectral index calculated by the combination of medium infrared (1300 nm and 1450 nm) was the one which had better results when prediction water parameters in which SR... had an R2=0,72 for RWC and R2=0,81 for EWT The spectral data was correlated to the water parameters and it was observed that for the RWC at 1881 nm showed a maximum negative coefficient of correlation of r=-0,89 whereas the EWT showed a maximum negative coefficient of correlation of r=-0,79 at 2165 nm. Three selection methods were tested for the hyperespectral variables in order to generate a mathematical model through linear regression. For the RWC parameter, the selection method of stepwise variables was the one which generated and R2=0,86 and a RSMSE = 13,85%. For this method just 6 predicting variables were left. While the variables selection method by spectral regions was the most precise when predicting the EWTparameter with a R2 = 0,87 and a RMSE = 0,00012 g/cm2 being just 5 spectral variables necessary.
108

Modelos alométricos para estimativa da produção de frutos em Jatropha curcas L. / Allometric models to estimate the production of fruit Jatropha curcas L.

Ignácio, Vanessa Leonardo 07 August 2009 (has links)
Made available in DSpace on 2017-07-10T17:37:36Z (GMT). No. of bitstreams: 1 Vanessa_Leonardo_Ignacio.pdf: 1068394 bytes, checksum: 5be940540f3888021f7182b44e755e2b (MD5) Previous issue date: 2009-08-07 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The objective was to correlate easy measurement variables and determine various regression equations to achieve allometric patterns in culture of pinion manso (Jatropha curcas L.). Thus, two different spacings (3 x 2 m 5 x 2 m) were compared to obtain the data that best represent the culture. Data collection occurred in the municipality of Eldorado-MS. The correlated variables were: total height of the plant (ALT), number of primary branches (NG), average diameter of primary branch (DG), total number of leaves per plant (NFL), leaf area (LPA), total number of fruits (NF) and fresh mass of fruit (MF). Comparing the average of spacing, the variables height and number of primary branches did not show significant difference, while all others did. For the spacing 5 x 2 m, the correlations were higher compared with the spacing 3 x 2 m. For variable number of fruits in function of the number of leaves and plant height the models that stood out were: NFtotal = -599.046 + 0.4549 + 0.00025 NFL2 NFL ALT + 300.032 - 0.3185 * NFL ALT for treatment 1 and NFtotal = -201.106 - 0.3691 + 0.000179 NFL NFL2 + 170.389 ALT for treatment 2. For other variables, the correlation that most stood out was between leaf area and number of leaves which the models stood out from logarithmic equations / Objetivou-se correlacionar variáveis de fácil mensuração e determinar diferentes equações de regressão para a obtenção de padrões alométricos na cultura do pinhão manso (Jatropha curcas L.). Para isso, comparou-se dois diferentes espaçamentos (3 x 2 m e 5 x 2 m) na obtenção dos dados que melhor representam a cultura. A coleta dos dados se deu no município de Eldorado-MS. As variáveis correlacionadas foram: altura total da planta (ALT), número de galhos primários (NG), diâmetro médio do galho primário (DG), número total de folhas por planta (NFL), área foliar (AFL), o número de frutos total (NF) e massa fresca dos frutos (MF). Comparando-se as médias dos espaçamentos as variáveis altura e número de galhos primários não apresentam diferença significativa, enquanto todas as outras apresentaram. Para o espaçamento 5 x 2 m as correlações foram maiores comparando-se com o espaçamento 3 x 2 m. Para a variável número de frutos em função do número de folhas e altura de planta os modelos que se destacaram foram: NFtotal= -599,046 + 0,4549NFL + 0,00025NFL2 + 300,032ALT 0,3185NFL*ALT, para o tratamento 1 e NFtotal= -201,106 0,3691NFL + 0,000179NFL2 + 170,389ALT, para o tratamento 2. Para as outras variáveis, a correlação que mais se destacou foi a entre área foliar e número de folhas, das quais destacou-se os modelos logarítmicos de equações
109

Inferência em um modelo de regressão com resposta binária na presença de sobredispersão e erros de medição / Inference in a regression model with overdispersed binary response and measurement errors

Tieppo, Sandra Maria 15 February 2007 (has links)
Modelos de regressão com resposta binária são utilizados na solução de problemas nas mais diversas áreas. Neste trabalho enfocamos dois problemas comuns em certos conjuntos de dados e que requerem técnicas apropriadas que forneçam inferências satisfatórias. Primeiro, em certas aplicações uma mesma unidade amostral é utilizada mais de uma vez, acarretando respostas positivamente correlacionadas, responsáveis por uma variância na variável resposta superior ao que comporta a distribuição binomial, fenômeno conhecido como sobredispersão. Por outro lado, também encontramos situações em que a variável explicativa contém erros de medição. É sabido que utilizar técnicas que desconsideram esses erros conduz a resultados inadequados (estimadores viesados e inconsistentes, por exemplo). Considerando um modelo com resposta binária, utilizaremos a distribuição beta-binomial para representar a sobredispersão. Os métodos de máxima verossimilhança, SIMEX, calibração da regressão e máxima pseudo-verossimilhança foram usados na estimação dos parâmetros do modelo, que são comparados através de um estudo de simulação. O estudo de simulação sugere que os métodos de máxima verossimilhança e calibração da regressão são melhores no sentido de correção do viés, especialmente para amostras de tamanho 50 e 100. Também estudaremos testes de hipóteses assintóticos (como razão de verossimilhanças, Wald e escore) a fim de testar hipóteses de interesse. Apresentaremos também um exemplo com dados reais / Regression models with binary response are used for solving problems in several areas. In this work we approach two common problems in some data sets and they need appropriate techniques to achieve satisfactory inference. First, in some applications, the same sample unity is utilized more than once, bringing positively correlated responses, which are responsible for the response variable variance be greater than an assumption binomial distribution, phenomenon known as overdispersion. On the other hand, also we find situations where the explanatory variable has measurement errors. It is known that the use of techniques which ignores these measurement errors brings inadequate results (e. g., biased and inconsistent estimators). Taking a model with binary response, we will use a beta-binomial distribution for modeling the overdispersion. The methods of maximum likelihood, SIMEX, regression calibration and maximum pseudo-likelihood were used in the estimation of the parameters, which are compared through a simulation study. The simulation studies suggest that the maximum likelihood and regression calibration methods are better for bias correcting, especially for larger sample size. Likelihood ratio, Wald and score statistics are used in order to test hypothesis of interest. We will illustrate the techniques with an application to a real data set
110

Modelo geométrico de ordem k correlacionado / Correlated Geometric Model of Order k

Souza, Roberta de 29 August 2019 (has links)
Neste trabalho propomos a distribuição geométrica de ordem k correlacionada, k ≥ 1, de parâmetros π e ρ π ∈ (0;1), max{-1, -1-π / π } ≤ ρ < 1, como uma extensão da generalização da distribuição geométrica proposta por Philippou e Muwafi (1980) e utilizando as idéias de Kolev, Minkova e Neytchev (2000) para generalizações de distribuições discretas provenientes de sequências de variáveis binárias. Sendo assim, é também uma releitura da distribuição geométrica de ordem k apresentada por Aki e Hirano (1993). Algumas propriedades da distribuição são demonstradas. Modelos de regressão foram desenvolvidos por ambos os métodos de estimação, clássico e bayesiano. Estudos de dados simulados mostram o comportamento das distribuições e algumas propriedades dos estimadores. A principal motivação em propor este modelo, além de contribuir para generalizações de distribuições discretas, é ter uma alternativa ainda mais adequada para análise de dados reais, pois considera-se o efeito da correlação individual existente pelo parâmetro ρ. Os ajustes dos modelos foram avaliados e análise de resíduos e de diagnóstico de influência ou divergência também é apresentada. / In this work we propose the correlated geometric distribution of order k, k ≥ 1, with parameters π e ρ π ∈ (0;1), max{-1, -1-π / π } ≤ ρ < 1, as an extension of the generalized geometric distribution proposed by Philippou e Muwafi (1980) and considering the ideas of Kolev, Minkova e Neytchev (2000) for generalizations of discrete distributions by including an additional parameter ρ. Thus, it is also a re-reading of the geometric distribution of order k by Aki e Hirano (1993). Some properties of the proposed distribution are presented. Regression models are developed using classical and Bayesian estimation methods. Simulated data studies show the behavior of the distributions and some properties of the estimators. The main motivation in this research, besides contribute to generalizations of discrete distributions, is to propose an alternative analysis and even more suitable for real data, since the effect of the individual correlation is taken into account through the existence of the parameter. The fitted models are evaluated and the residual analysis and diagnosis of influence or divergence are also presented.

Page generated in 0.1722 seconds