• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 9
  • 3
  • 2
  • 2
  • 2
  • Tagged with
  • 17
  • 17
  • 6
  • 5
  • 5
  • 5
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Modeling longitudinal data with interval censored anchoring events

Chu, Chenghao 01 March 2018 (has links)
Indiana University-Purdue University Indianapolis (IUPUI) / In many longitudinal studies, the time scales upon which we assess the primary outcomes are anchored by pre-specified events. However, these anchoring events are often not observable and they are randomly distributed with unknown distribution. Without direct observations of the anchoring events, the time scale used for analysis are not available, and analysts will not be able to use the traditional longitudinal models to describe the temporal changes as desired. Existing methods often make either ad hoc or strong assumptions on the anchoring events, which are unveri able and prone to biased estimation and invalid inference. Although not able to directly observe, researchers can often ascertain an interval that includes the unobserved anchoring events, i.e., the anchoring events are interval censored. In this research, we proposed a two-stage method to fit commonly used longitudinal models with interval censored anchoring events. In the first stage, we obtain an estimate of the anchoring events distribution by nonparametric method using the interval censored data; in the second stage, we obtain the parameter estimates as stochastic functionals of the estimated distribution. The construction of the stochastic functional depends on model settings. In this research, we considered two types of models. The first model was a distribution-free model, in which no parametric assumption was made on the distribution of the error term. The second model was likelihood based, which extended the classic mixed-effects models to the situation that the origin of the time scale for analysis was interval censored. For the purpose of large-sample statistical inference in both models, we studied the asymptotic properties of the proposed functional estimator using empirical process theory. Theoretically, our method provided a general approach to study semiparametric maximum pseudo-likelihood estimators in similar data situations. Finite sample performance of the proposed method were examined through simulation study. Algorithmically eff- cient algorithms for computing the parameter estimates were provided. We applied the proposed method to a real data analysis and obtained new findings that were incapable using traditional mixed-effects models. / 2 years
2

Statistical Methods for Dealing with Outcome Misclassification in Studies with Competing Risks Survival Outcomes

Mpofu, Philani Brian 02 1900 (has links)
Indiana University-Purdue University Indianapolis (IUPUI) / In studies with competing risks outcomes, misidentifying the event-type responsible for the observed failure is, by definition, an act of misclassification. Several authors have established that such misclassification can bias competing risks statistical analyses, and have proposed statistical remedies to aid correct modeling. Generally, these rely on adjusting the estimation process using information about outcome misclassification, but invariably assume that outcome misclassification is non-differential among study subjects regardless of their individual characteristics. In addition, current methods tend to adjust for the misclassification within a semi-parametric framework of modeling competing risks data. Building on the existing literature, in this dissertation, we explore the parametric modeling of competing risks data in the presence of outcome misclassification, be it differential or non-differential. Specifically, we develop parametric pseudo-likelihood-based approaches for modeling cause-specific hazards while adjusting for misclassification information that is obtained either through data internal or external to the current study (respectively, internal or external-validation sampling). Data from either type of validation sampling are used to model predictive values or misclassification probabilities, which, in turn, are used to adjust the cause-specific hazard models. We show that the resulting pseudo-likelihood estimates are consistent and asymptotically normal, and verify these theoretical properties using simulation studies. Lastly, we illustrate the proposed methods using data from a study involving people living with HIV/AIDS (PLWH)in the East-African consortium of the International Epidemiologic Databases for the Evaluation of HIV/AIDS (IeDEA EA). In this example, death is frequently misclassified as disengagement from care as many deaths go unreported to health facilities caring for these patients. In this application, we model the cause-specific hazards of death and disengagement from care among PLWH after they initiate anti-retroviral treatment, while adjusting for death misclassification. / 2021-03-10
3

Modelo autologístico no estudo de padrões espaciais em doenças de citros / Autologistic model in the study of spatial patterns in citrus diseases

Franciscon, Luziane 03 September 2008 (has links)
A citricultura é uma das principais atividades agrícolas do Brasil e o estado de São Paulo concentra a maior área produtora de laranjas do mundo. O conhecimento de padrões da incidência de doenças cítricas no tempo e no espaço é relevante para o setor e permite a descrição da dinâmica dessas doenças, podendo indicar estratégias para controle de epidemias. Neste trabalho são consideradas duas doenças que afetam a cultura de citros, a leprose e a morte súbita dos citros utilizando dados provenientes do monitoramento de talhões. Um aspecto relevante para estudos de doenças como a leprose dos citros, considerada uma grave virose na citricultura brasileira, é a investigação do padrão espacial e dos efeitos temporais da sua incidência dentro do talhão. Métodos exploratórios para determinar se o padrão espacial é ou não agregado são frequentemente utilizados. Entretanto é possível explorar e descrever os dados adotando um modelo explícito, permitindo discriminar e quantificar os efeitos através de parâmetros para co-variáveis que representam os aspectos de interesse. Uma das alternativas é a adoção de modelos autologísticos, que estendem o modelo de regressão logística para acomodar efeitos espaciais. Para implementar esse modelo é necessário que se reuse os dados para extrair co-variáveis espaciais, o que requer extensões na metodologia e algoritmos para avaliar adequadamente a variância das estimativas. Neste trabalho utiliza-se o modelo autologístico na análise de dados de incidência de doenças em plantas cítricas coletados em pontos referenciados no espaço e no tempo em um talhão. é mostrado como o modelo autologístico é apropriado para investigar doenças desse tipo, bem como é feita uma descrição do modelo e dos aspectos computacionais necessários para a estimação do modelo. São abordados métodos de seleção e avaliação de modelos autologísticos que relacionam fatores que afetam a disseminação da doença com padrões espaciais e efeitos temporais. Desta forma é possível realizar avaliações objetivas dos efeitos dos fatores considerados sobre a incidência da doença através dos parâmetros estimados do modelo proposto e quantificar o efeito da presença da doença em diferentes estruturas de vizinhança. A modelagem dos dados identificou dependência espacial entre as plantas e o modelo adotado permitiu quantificar as variações na probabilidade de doença em função do status das plantas na vizinhança. A metodologia apresentada aqui não se restringe a cultura de citros pode ser usada na avaliação de padrões espaço-temporais e efeitos de fatores que afetem doenças de plantas em condições semelhantes. / The citrus industry is a major agricultural activity in Brazil and the state of Sao Paulo concentrates the largest production area of oranges in the world. The knowledge of incidence patterns of citrus diseases in time and space is relevant to the industry and allows the description of the dynamics of these diseases and may indicate strategies for epidemics control. In this work are considered two diseases that affect the cultivation of citrus, leprosis and citrus sudden death using data from the tracking of stands. An important point when studying diseases such as the citrus leprosis, considered a serious viral disease in the Brazilian citrus industry, is the investigation of the spatial pattern and temporal effects of the disease incidence within a stand. Exploratory methods to determine if the spatial pattern is or not added are frequently used. However it is possible to explore and describe the data adopting an explicit model, allowing to discriminate and quantify the effects through parameters for covariates that represent aspects of interest. To implement this model is necessary to reuse the data in order to extract spatial covariates, which requires extensions in the methodology and algorithms to assess properly the variance of estimates. In this work, the autologistic model is used in the analysis of diseases incidence data in citrus plants collected in points referenced in space and time in a stand. It is shown how the autologistic model is appropriate to investigate such diseases, and there is a description of the model and computational aspects needed to estimate the model. Thus it is possible to achieve objective assessments of the effects of the factors considered on the incidence of the disease through the estimated parameters of the proposed model and quantify the disease presence effects in different neighborhood structures. The modeling of the data has identified a spatial dependence between the plants and the adopted model allowed to quantify the changes in the probability of disease according to the status of the plants in the neighbourhood. The methodology presented here is not restricted to the cultivation of citrus. It can be used in the assessment of spatial-temporal patterns and effects of factors that affect the diseases in plants under similar conditions.
4

Modelo autologístico no estudo de padrões espaciais em doenças de citros / Autologistic model in the study of spatial patterns in citrus diseases

Luziane Franciscon 03 September 2008 (has links)
A citricultura é uma das principais atividades agrícolas do Brasil e o estado de São Paulo concentra a maior área produtora de laranjas do mundo. O conhecimento de padrões da incidência de doenças cítricas no tempo e no espaço é relevante para o setor e permite a descrição da dinâmica dessas doenças, podendo indicar estratégias para controle de epidemias. Neste trabalho são consideradas duas doenças que afetam a cultura de citros, a leprose e a morte súbita dos citros utilizando dados provenientes do monitoramento de talhões. Um aspecto relevante para estudos de doenças como a leprose dos citros, considerada uma grave virose na citricultura brasileira, é a investigação do padrão espacial e dos efeitos temporais da sua incidência dentro do talhão. Métodos exploratórios para determinar se o padrão espacial é ou não agregado são frequentemente utilizados. Entretanto é possível explorar e descrever os dados adotando um modelo explícito, permitindo discriminar e quantificar os efeitos através de parâmetros para co-variáveis que representam os aspectos de interesse. Uma das alternativas é a adoção de modelos autologísticos, que estendem o modelo de regressão logística para acomodar efeitos espaciais. Para implementar esse modelo é necessário que se reuse os dados para extrair co-variáveis espaciais, o que requer extensões na metodologia e algoritmos para avaliar adequadamente a variância das estimativas. Neste trabalho utiliza-se o modelo autologístico na análise de dados de incidência de doenças em plantas cítricas coletados em pontos referenciados no espaço e no tempo em um talhão. é mostrado como o modelo autologístico é apropriado para investigar doenças desse tipo, bem como é feita uma descrição do modelo e dos aspectos computacionais necessários para a estimação do modelo. São abordados métodos de seleção e avaliação de modelos autologísticos que relacionam fatores que afetam a disseminação da doença com padrões espaciais e efeitos temporais. Desta forma é possível realizar avaliações objetivas dos efeitos dos fatores considerados sobre a incidência da doença através dos parâmetros estimados do modelo proposto e quantificar o efeito da presença da doença em diferentes estruturas de vizinhança. A modelagem dos dados identificou dependência espacial entre as plantas e o modelo adotado permitiu quantificar as variações na probabilidade de doença em função do status das plantas na vizinhança. A metodologia apresentada aqui não se restringe a cultura de citros pode ser usada na avaliação de padrões espaço-temporais e efeitos de fatores que afetem doenças de plantas em condições semelhantes. / The citrus industry is a major agricultural activity in Brazil and the state of Sao Paulo concentrates the largest production area of oranges in the world. The knowledge of incidence patterns of citrus diseases in time and space is relevant to the industry and allows the description of the dynamics of these diseases and may indicate strategies for epidemics control. In this work are considered two diseases that affect the cultivation of citrus, leprosis and citrus sudden death using data from the tracking of stands. An important point when studying diseases such as the citrus leprosis, considered a serious viral disease in the Brazilian citrus industry, is the investigation of the spatial pattern and temporal effects of the disease incidence within a stand. Exploratory methods to determine if the spatial pattern is or not added are frequently used. However it is possible to explore and describe the data adopting an explicit model, allowing to discriminate and quantify the effects through parameters for covariates that represent aspects of interest. To implement this model is necessary to reuse the data in order to extract spatial covariates, which requires extensions in the methodology and algorithms to assess properly the variance of estimates. In this work, the autologistic model is used in the analysis of diseases incidence data in citrus plants collected in points referenced in space and time in a stand. It is shown how the autologistic model is appropriate to investigate such diseases, and there is a description of the model and computational aspects needed to estimate the model. Thus it is possible to achieve objective assessments of the effects of the factors considered on the incidence of the disease through the estimated parameters of the proposed model and quantify the disease presence effects in different neighborhood structures. The modeling of the data has identified a spatial dependence between the plants and the adopted model allowed to quantify the changes in the probability of disease according to the status of the plants in the neighbourhood. The methodology presented here is not restricted to the cultivation of citrus. It can be used in the assessment of spatial-temporal patterns and effects of factors that affect the diseases in plants under similar conditions.
5

Spatio-temporal prediction modeling of clusters of influenza cases

Qiu, Weiyu Unknown Date
No description available.
6

Regression Analysis for Zero Inflated Population Under Complex Sampling Designs

Paneru, Khyam Narayan 20 December 2013 (has links)
No description available.
7

[en] A COMPARATIVE STUDY OF METHODOLOGIES FOR MODELLING COMPLEX SURVEYS MODELLING - AN APPLICATION TO SAEB 99 / [es] UN ESTUDIO COMPARATIVO DE LAS METODOLOGÍAS DE MODELAJE DE DATOS PROVENIENTES DE MUESTREOS COMPLEJOS UNA APLICACIÓN AL SAEB 99 / [pt] UM ESTUDO COMPARATIVO DAS METODOLOGIAS DE MODELAGEM DE DADOS AMOSTRAIS COMPLEXOS - UMA APLICAÇÃO AO SAEB 99

MARCEL DE TOLEDO VIEIRA 23 July 2001 (has links)
[pt] A consideração do desenho amostral é fundamental e indispensável em trabalhos que têm como objetivo a análise e modelagem de dados selecionados através de desenhos amostrais complexos. Desta forma torna-se possível a produção de resultados realmente úteis e confiáveis para os gestores de políticas públicas. O principal objetivo desta dissertação é chamar a atenção para a importância da utilização das técnicas adequadas ao tratamento de dados amostrais complexos, discutindo também as conseqüências de sua não adoção. As metodologias adequadas para a análise de dados amostrais complexos podem ser agrupadas em duas abordagens. A primeira, denominada de abordagem agregada, se baseia na incorporação de pesos e efeitos do plano amostral no ajuste dos modelos estatísticos. Através da outra abordagem, que é denominada de abordagem desagregada, a lógica de modelagem é modificada, incorporando os efeitos devidos à amostragem complexa. Isto pode ser feito através do uso de modelos lineares hierárquicos, ou multinível. Os dados analisados nesta dissertação foram coletados pelo Sistema Nacional de Avaliação da Educação Básica (SAEB) no ano de 1999. Esta pesquisa compreende um exame de conhecimentos e um levantamento sobre condições sócio-econômico-demográficas de mais de 200.000 alunos, suas escolas, professores e diretores. A amostra do SAEB 99 foi selecionada a partir de um plano amostral complexo. O desenho amostral do SAEB 99 considera amostragem aleatória estratificada de unidades conglomeradas, com múltiplas etapas. A estimação pontual de estatísticas descritivas a partir de dados amostrais complexos não apresenta grandes dificuldades na medida em que se utiliza de forma adequada os pesos na expansão da amostra. Será ilustrada, através de um exemplo, a importância dos pesos amostrais na estimação. Será verificado que sua não adoção no cálculo da média, na situação em questão, poderia gerar resultados superestimados. Nesta dissertação serão apresentados aspectos teóricos das técnicas (adequadas a dados amostrais complexos) de estimação pontual de parâmetros de modelos de regressão e de suas respectivas variâncias. Também é realizada uma discussão sobre o efeito do plano amostral, intervalos de confiança e testes de hipóteses, e sobre o pacote SUDAAN. Serão apresentados os resultados da aplicação das técnicas estudadas. Paralelamente, será conduzido um estudo dos determinantes da proficiência dos alunos. Ainda, serão apresentadas e analisadas as conseqüências de não se considerar o desenho amostral na estimação dos parâmetros dos modelos e de suas respectivas variâncias, para o SAEB 99. Será realizada uma interpretação educacional dos resultados apresentados. / [en] It is very important to consider the sample design in the analysis and modelling of complex survey data. It permits the production of correct results, which can be used for public political decision making and evaluation. The main objective of this dissertation is to give information about the importance of the use of the techniques for complex survey data. The methodologies for complex survey data analysis can be divided in two different approaches. The first is based on incorporating weights and design effects in the fitting of usual statistical models, such as contingency tables, regression, etc. This approach is called aggregated approach. The other approach, called disaggregated approach, modifies the model attempting to incorporate the complex population structure and/or design effects, for example using hierarchical (or multilevel) linear models. The data analysed in this dissertation were collected by the Brazilian National System of Basic Education Assessment (SAEB), in 1999. This survey applies an exam and asks social-economic-demographic information about more than 200.000 students, schools and teachers. The SAEB 99 sample were selected by a complex survey design, considering stratification and conglomeration, with multiples steps. There is not any problem in estimation of descriptive statistics, such as means, correlation and regression coefficients, provided that we correctly use the sample weights to expand the data. An example will be presented to verify the importance of the use of the sample weights. The theoretical aspects of the techniques for the estimation of regression model parameters and their variances will be presented. The design effect, confidence intervals, significance tests, and SUDAAN characteristics will also be discussed. The application of these techniques will be presented. It will be also conducted a study of the determinants of the student proficiency. It still will be presented and analysed the consequences of the non- consideration of the sample design in the estimation of parameters and their variances, for SAEB 99 data. The results will be educationally interpreted. / [es] La consideración del diseño muestral es fundamental e indispensable en trabajos que tienen como objetivo el análisis y modelaje de datos selecionados a través de diseños muestrales complejos. De esta forma es posible la producción de resultados realmente útiles y confiables para los gestores de políticas públicas. EL objetivo principal de esta disertación es llamar la atención para la importancia de la utilización de las técnicas adecuadas al tratamiento de datos muestrales complejos, discutiendo también las consecuencias de no adoptarlas. Las metodologías adecuadas para el análisis de datos muestrales complejos pueden ser agrupadas en dos abordajes. La primera, denominada de abordaje agregado, consiste en la incorporación de pesos y efectos del plano muestral en el ajuste de los modelos estadísticos. A través del otro abordaje, denominado de abordaje desagregado, se modifica la lógica, incorporando los efectos debidos al muestreo complejo. Esto puede realizarse a través del uso de modelos lineales jerárquicos, o multiníveles. Los datos analizados en esta disertación fueron colectados por el Sistema Nacional de Evaluación de la Educación Básica (SAEB) en el año de 1999. Esta investigación comprende un exámen de conocimientos y un levantamiento sobre condiciones socioeconómicas-demográficas de más de 200.000 alumnos, sus escuelas, profesores y directores. La muestra del SAEB 99 fue seleccionada a partir de un diseño muestral complejo. El diseño muestral del SAEB 99 considera el muestreo aleatório estratificado de unidades conglomeradas, con múltiples etapas. La estimación puntual de estadísticas descriptivas a partir de datos muestrales complejos no presenta grandes dificuldades si se utiliza de forma adecuada los pesos en la expansión de la muestra. Se ilustrará, a través de un ejemplo, la importancia de los pesos muestrales en la estimación. Será verificado que la no adopción de estos pesos en el cálculo de la media, podería generar resultados superestimados. En esta disertación serán presentados aspectos teóricos de las técnicas (adecuadas a datos de muestras complejas) de estimación puntual de parámetros de modelos de regresión y de sus respectivas varianzas. Se discute también el efecto del diseño muestral, intervalos de confianza y testes de hipótesis, y el paquete SUDAAN. Serán presentados los resultados de la aplicación de las técnicas estudiadas. Paralelamente, se estudian los determinantes de la proficiencia de los alumnos. Se presentan y analizan también, las consecuencias de no considerar el diseño muestral en la estimación de los parámetros del modelos y de sus respectivas varianzas, para el SAEB 99. Será realizada una interpretación educacional de los resultados presentados.
8

Combinação de modelos de campos aleatórios markovianos para classificação contextual de imagens multiespectrais / Combining markov random field models for multispectral image contextual classification

Levada, Alexandre Luis Magalhães 05 May 2010 (has links)
Este projeto de doutorado apresenta uma nova abordagem MAP-MRF para a classificação contextual de imagens multiespectrais utilizando combinação de modelos de Campos Aleatórios Markovianos definidos em sistemas de ordens superiores. A modelagem estatística para o problema de classificação segue o paradigma Bayesiano, com a definição de um modelo Markoviano para os dados observados (Gaussian Markov Random Field multiespectral) e outro modelo para representar o conhecimento a priori (Potts). Nesse cenário, o parâmetro β do modelo de Potts atua como um parâmetro de regularização, tendo papel fundamental no compromisso entre as observações e o conhecimento a priori, de modo que seu correto ajuste é necessário para a obtenção de bons resultados. A introdução de sistemas de vizinhança de ordens superiores requer a definição de novos métodos para a estimação dos parâmetros dos modelos Markovianos. Uma das contribuições desse trabalho é justamente propor novas equações de pseudo-verossimilhança para a estimação desses parâmetros no modelo de Potts em sistemas de segunda e terceira ordens. Apesar da abordagem por máxima pseudo-verossimilhança ser amplamente utilizada e conhecida na literatura de campos aleatórios, pouco se conhece acerca da acurácia dessa estimação. Foram derivadas aproximações para a variância assintótica dos estimadores propostos, caracterizando-os completamente no caso limite, com o intuito de realizar inferências e análises quantitativas sobre os parâmetros dos modelos Markovianos. A partir da definição dos modelos e do conhecimento dos parâmetros, o próximo estágio é a classificação das imagens multiespectrais. A solução para esse problema de inferência Bayesiana é dada pelo critério de estimação MAP, onde a solução ótima é determinada maximizando a probabilidade a posteriori, o que define um problema de otimização. Como não há solução analítica para esse problema no caso de prioris Markovianas, algoritmos iterativos de otimização combinatória foram empregados para aproximar a solução ótima. Nesse trabalho, adotam-se três métodos sub-ótimos: Iterated Conditional Modes, Maximizer of the Posterior Marginals e Game Strategy Approach. Porém, é demonstrado na literatura que tais métodos convergem para máximos locais e não globais, pois são altamente dependentes de sua condição inicial. Isto motivou o desenvolvimento de uma nova abordagem para combinação de classificadores contextuais, que utiliza múltiplas inicializações simultâneas providas por diferentes classificadores estatísticos pontuais. A metodologia proposta define um framework MAP-MRF bastante robusto para solução de problemas inversos, pois permite a utilização e a integração de diferentes condições iniciais em aplicações como classificação, filtragem e restauração de imagens. Como medidas quantitativas de desempenho, são adotados o coeficiente Kappa de Cohen e o coeficiente Tau de Kendall para verificar a concordância entre as saídas dos classificadores e a verdade terrestre (amostras pré-rotuladas). Resultados obtidos mostram que a inclusão de sistemas de vizinhança de ordens superiores é de fato capaz de melhorar significativamente não apenas o desempenho da classificação como também a estimação dos parâmetros dos modelos Markovianos, reduzindo tanto o erro de estimação quanto a variância assintótica. Além disso, a combinação de classificadores contextuais através da utilização de múltiplas inicializações simultâneas melhora significativamente o desempenho da classificação se comparada com a abordagem tradicional com apenas uma inicialização. / This work presents a novel MAP-MRF approach for multispectral image contextual classification by combining higher-order Markov Random Field models. The statistical modeling follows the Bayesian paradigm, with the definition of a multispectral Gaussian Markov Random Field model for the observations and a Potts MRF model to represent the a priori knowledge. In this scenario, the Potts MRF model parameter (β) plays the role of a regularization parameter by controlling the tradeoff between the likelihood and the prior knowledge, in a way that a suitable tunning for this parameter is required for a good performance in contextual classification. The introduction of higher-order MRF models requires the specification of novel parameter estimation methods. One of the contributions of this work is the definition of novel pseudo-likelihood equations for the estimation of these MRF parameters in second and third order neighborhood systems. Despite its widely usage in practical MRF applications, little is known about the accuracy of maximum pseudo-likelihood approach. Approximations for the asymptotic variance of the proposed MPL estimators were derived, completely characterizing their behavior in the limiting case, allowing statistical inference and quantitative analysis. From the statistical modeling and having the model parameters estimated, the next step is the multispectral image classification. The solution for this Bayesian inference problem is given by the MAP criterion, where the optimal solution is obtained by maximizing the a posteriori distribution, defining an optimization problem. As there is no analytical solution for this problem in case of Markovian priors, combinatorial optimization algorithms are required to approximate the optimal solution. In this work, we use three suboptimal methods: Iterated Conditional Modes, Maximizer of the Posterior Marginals and Game Strategy Approach, a variant approach based on non-cooperative game theory. However, it has been shown that these methods converge to local maxima solutions, since they are extremelly dependent on the initial condition. This fact motivated the development of a novel approach for combination of contextual classifiers, by making use of multiple initializations at the same time, where each one of these initial conditions is provided by different pointwise pattern classifiers. The proposed methodology defines a robust MAP-MRF framework for the solution of general inverse problems since it allows the use and integration of several initial conditions in a variety of applications as image classification, denoising and restoration. To evaluate the performance of the classification results, two statistical measures are used to verify the agreement between the classifiers output and the ground truth: Cohens Kappa and Kendalls Tau coefficient. The obtained results show that the use of higher-order neighborhood systems is capable of significantly improve not only the classification performance, but also the MRF parameter estimation by reducing both the estimation error and the asymptotic variance. Additionally, the combination of contextual classifiers through the use of multiple initializations also improves the classificatoin performance, when compared to the traditional single initialization approach.
9

Combinação de modelos de campos aleatórios markovianos para classificação contextual de imagens multiespectrais / Combining markov random field models for multispectral image contextual classification

Alexandre Luis Magalhães Levada 05 May 2010 (has links)
Este projeto de doutorado apresenta uma nova abordagem MAP-MRF para a classificação contextual de imagens multiespectrais utilizando combinação de modelos de Campos Aleatórios Markovianos definidos em sistemas de ordens superiores. A modelagem estatística para o problema de classificação segue o paradigma Bayesiano, com a definição de um modelo Markoviano para os dados observados (Gaussian Markov Random Field multiespectral) e outro modelo para representar o conhecimento a priori (Potts). Nesse cenário, o parâmetro β do modelo de Potts atua como um parâmetro de regularização, tendo papel fundamental no compromisso entre as observações e o conhecimento a priori, de modo que seu correto ajuste é necessário para a obtenção de bons resultados. A introdução de sistemas de vizinhança de ordens superiores requer a definição de novos métodos para a estimação dos parâmetros dos modelos Markovianos. Uma das contribuições desse trabalho é justamente propor novas equações de pseudo-verossimilhança para a estimação desses parâmetros no modelo de Potts em sistemas de segunda e terceira ordens. Apesar da abordagem por máxima pseudo-verossimilhança ser amplamente utilizada e conhecida na literatura de campos aleatórios, pouco se conhece acerca da acurácia dessa estimação. Foram derivadas aproximações para a variância assintótica dos estimadores propostos, caracterizando-os completamente no caso limite, com o intuito de realizar inferências e análises quantitativas sobre os parâmetros dos modelos Markovianos. A partir da definição dos modelos e do conhecimento dos parâmetros, o próximo estágio é a classificação das imagens multiespectrais. A solução para esse problema de inferência Bayesiana é dada pelo critério de estimação MAP, onde a solução ótima é determinada maximizando a probabilidade a posteriori, o que define um problema de otimização. Como não há solução analítica para esse problema no caso de prioris Markovianas, algoritmos iterativos de otimização combinatória foram empregados para aproximar a solução ótima. Nesse trabalho, adotam-se três métodos sub-ótimos: Iterated Conditional Modes, Maximizer of the Posterior Marginals e Game Strategy Approach. Porém, é demonstrado na literatura que tais métodos convergem para máximos locais e não globais, pois são altamente dependentes de sua condição inicial. Isto motivou o desenvolvimento de uma nova abordagem para combinação de classificadores contextuais, que utiliza múltiplas inicializações simultâneas providas por diferentes classificadores estatísticos pontuais. A metodologia proposta define um framework MAP-MRF bastante robusto para solução de problemas inversos, pois permite a utilização e a integração de diferentes condições iniciais em aplicações como classificação, filtragem e restauração de imagens. Como medidas quantitativas de desempenho, são adotados o coeficiente Kappa de Cohen e o coeficiente Tau de Kendall para verificar a concordância entre as saídas dos classificadores e a verdade terrestre (amostras pré-rotuladas). Resultados obtidos mostram que a inclusão de sistemas de vizinhança de ordens superiores é de fato capaz de melhorar significativamente não apenas o desempenho da classificação como também a estimação dos parâmetros dos modelos Markovianos, reduzindo tanto o erro de estimação quanto a variância assintótica. Além disso, a combinação de classificadores contextuais através da utilização de múltiplas inicializações simultâneas melhora significativamente o desempenho da classificação se comparada com a abordagem tradicional com apenas uma inicialização. / This work presents a novel MAP-MRF approach for multispectral image contextual classification by combining higher-order Markov Random Field models. The statistical modeling follows the Bayesian paradigm, with the definition of a multispectral Gaussian Markov Random Field model for the observations and a Potts MRF model to represent the a priori knowledge. In this scenario, the Potts MRF model parameter (β) plays the role of a regularization parameter by controlling the tradeoff between the likelihood and the prior knowledge, in a way that a suitable tunning for this parameter is required for a good performance in contextual classification. The introduction of higher-order MRF models requires the specification of novel parameter estimation methods. One of the contributions of this work is the definition of novel pseudo-likelihood equations for the estimation of these MRF parameters in second and third order neighborhood systems. Despite its widely usage in practical MRF applications, little is known about the accuracy of maximum pseudo-likelihood approach. Approximations for the asymptotic variance of the proposed MPL estimators were derived, completely characterizing their behavior in the limiting case, allowing statistical inference and quantitative analysis. From the statistical modeling and having the model parameters estimated, the next step is the multispectral image classification. The solution for this Bayesian inference problem is given by the MAP criterion, where the optimal solution is obtained by maximizing the a posteriori distribution, defining an optimization problem. As there is no analytical solution for this problem in case of Markovian priors, combinatorial optimization algorithms are required to approximate the optimal solution. In this work, we use three suboptimal methods: Iterated Conditional Modes, Maximizer of the Posterior Marginals and Game Strategy Approach, a variant approach based on non-cooperative game theory. However, it has been shown that these methods converge to local maxima solutions, since they are extremelly dependent on the initial condition. This fact motivated the development of a novel approach for combination of contextual classifiers, by making use of multiple initializations at the same time, where each one of these initial conditions is provided by different pointwise pattern classifiers. The proposed methodology defines a robust MAP-MRF framework for the solution of general inverse problems since it allows the use and integration of several initial conditions in a variety of applications as image classification, denoising and restoration. To evaluate the performance of the classification results, two statistical measures are used to verify the agreement between the classifiers output and the ground truth: Cohens Kappa and Kendalls Tau coefficient. The obtained results show that the use of higher-order neighborhood systems is capable of significantly improve not only the classification performance, but also the MRF parameter estimation by reducing both the estimation error and the asymptotic variance. Additionally, the combination of contextual classifiers through the use of multiple initializations also improves the classificatoin performance, when compared to the traditional single initialization approach.
10

Essays in Industrial Organization and Econometrics

Kim, Minhae 24 August 2022 (has links)
No description available.

Page generated in 0.4325 seconds