• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 152
  • 86
  • 54
  • 21
  • 10
  • 7
  • 4
  • 4
  • 4
  • 3
  • 2
  • 2
  • Tagged with
  • 412
  • 181
  • 87
  • 86
  • 78
  • 78
  • 77
  • 70
  • 65
  • 58
  • 57
  • 56
  • 48
  • 43
  • 42
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
241

"Testes de hipótese e critério bayesiano de seleção de modelos para séries temporais com raiz unitária" / "Hypothesis testing and bayesian model selection for time series with a unit root"

Silva, Ricardo Gonçalves da 23 June 2004 (has links)
A literatura referente a testes de hipótese em modelos auto-regressivos que apresentam uma possível raiz unitária é bastante vasta e engloba pesquisas oriundas de diversas áreas. Nesta dissertação, inicialmente, buscou-se realizar uma revisão dos principais resultados existentes, oriundos tanto da visão clássica quanto da bayesiana de inferência. No que concerne ao ferramental clássico, o papel do movimento browniano foi apresentado de forma detalhada, buscando-se enfatizar a sua aplicabilidade na dedução de estatísticas assintóticas para a realização dos testes de hipótese relativos à presença de uma raíz unitária. Com relação à inferência bayesiana, foi inicialmente conduzido um exame detalhado do status corrente da literatura. A seguir, foi realizado um estudo comparativo em que se testa a hipótese de raiz unitária com base na probabilidade da densidade a posteriori do parâmetro do modelo, considerando as seguintes densidades a priori: Flat, Jeffreys, Normal e Beta. A inferência foi realizada com base no algoritmo Metropolis-Hastings, usando a técnica de simulação de Monte Carlo por Cadeias de Markov (MCMC). Poder, tamanho e confiança dos testes apresentados foram computados com o uso de séries simuladas. Finalmente, foi proposto um critério bayesiano de seleção de modelos, utilizando as mesmas distribuições a priori do teste de hipótese. Ambos os procedimentos foram ilustrados com aplicações empíricas à séries temporais macroeconômicas. / Testing for unit root hypothesis in non stationary autoregressive models has been a research topic disseminated along many academic areas. As a first step for approaching this issue, this dissertation includes an extensive review highlighting the main results provided by Classical and Bayesian inferences methods. Concerning Classical approach, the role of brownian motion is discussed in a very detailed way, clearly emphasizing its application for obtaining good asymptotic statistics when we are testing for the existence of a unit root in a time series. Alternatively, for Bayesian approach, a detailed discussion is also introduced in the main text. Then, exploring an empirical façade of this dissertation, we implemented a comparative study for testing unit root based on a posteriori model's parameter density probability, taking into account the following a priori densities: Flat, Jeffreys, Normal and Beta. The inference is based on the Metropolis-Hastings algorithm and on the Monte Carlo Markov Chains (MCMC) technique. Simulated time series are used for calculating size, power and confidence intervals for the developed unit root hypothesis test. Finally, we proposed a Bayesian criterion for selecting models based on the same a priori distributions used for developing the same hypothesis tests. Obviously, both procedures are empirically illustrated through application to macroeconomic time series.
242

Modelos longitudinais de grupos múltiplos multiníveis na teoria da resposta ao item: métodos de estimação e seleção estrutural sob uma perspectiva bayesiana / Longitudinal multiple groups multilevel models in the item response theory : estimation methods and structural selection under a bayesian perspective

Azevedo, Caio Lucidius Naberezny 11 March 2008 (has links)
No presente trabalho propomos uma estrutura bayesiana, através de um esquema de dados aumentados, para analisar modelos longitudinais com grupos mútiplos (MLGMTRI) na Teoria da Resposta ao Item (TRI). Tal estrutura consiste na tríade : modelagem, métodos de estimação e métodos de diagnóstico para a classe de MLGMTRI. Na parte de modelagem, explorou-se as estruturas multivariada e multinível, com o intuito de representar a hierarquia existente em dados longitudinais com grupos múltiplos. Esta abordagem permite considerar várias classes de submodelos como: modelos de grupos múltiplos e modelos longitudinais de um único grupo. Estudamos alguns aspectos positivos e negativos de cada uma das supracitadas abordagens. A modelagem multivariada permite representar de forma direta estruturas de dependência, além de possibilitar que várias delas sejam facilmente incorporadas no processo de estimação. Isso permite considerar, por exemplo, uma matriz não estruturada e assim, obter indícios da forma mais apropriada para a estrutura de dependência. Por outro lado, a modelagem multinível propicia uma interpretação mais direta, obtenção de condicionais completas univariadas, fácil inclusão de informações adicionais, incorporação de fontes de dependência intra e entre unidades amostrais, dentre outras. Com relação aos métodos de estimação, desenvolvemos um procedimento baseado nas simulações de Monte Carlo via cadeias de Markov (MCMC). Mostramos que as distribuições condicionais completas possuem forma analítica conhecida e, além disso, são fáceis de se amostrar. Tal abordagem, apesar de demandar grande esforço computacional, contorna diversos problemas encontrados em outros procedimentos como: limitação no número de grupos envolvidos, quantidade de condições de avaliação, escolha de estruturas de dependência, assimetria dos traços latentes, imputação de dados, dentre outras. Além disso, através da metodologia MCMC, desenvolvemos uma estrutura de seleção de matrizes de covariâncias, através de um esquema de Monte Carlo via Cadeias de Markov de Saltos Reversíveis (RJMCMC). Estudos de simulação indicam que o modelo, o método de estimação e o método de seleção produzem resultados bastante satisfatórios. Também, robustez à escolha de prioris e valores iniciais foi observada. Os métodos de estimação desenvolvidos podem ser estendidos para diversas situações de interesse de um modo bem direto. Algumas das técnicas de diagnóstico estudadas permitem avaliar a qualidade do ajuste do modelo de um modo global. Outras medidas fornecem indícios de violação de suposições específicas, como ausência de normalidade para os traços latentes. Tal metodologia fornece meios concretos de se avaliar a qualidade do instrumento de medida (prova, questionário etc). Finalmente, a análise de um conjunto de dados real, utilizando-se alguns dos modelos abordados no presente trabalho, ilustra o potencial da tríade desenvolvida além de indicar um ganho na utilização dos modelos longitudinais da TRI na análise de ensaios educacionais com medidas repetidas em deterimento a suposição de independência. / In this work we proposed a bayesian framework, by using an augmented data scheme, to analyze longitudinal multiple groups models (LMGMIRT) in the Item Response Theory (IRT). Such framework consists in the following set : modelling, estimation methods and diagnostic tools to the LMGMIRT. Concerning the modelling, we exploited multivariate and multilevel structures in order to represent the hierarchical nature of the longitudinal multiple groupos model. This approach allows to consider several submodels such that: multiple groups and longitudinal one group models. We studied some positive and negative aspects of both above mentioned approches. The multivariate modelling allows to represent, in a straightforward way, many dependence structures. Furthermore it possibilities that many of them can be easily considered in the estimation process. This allows, for example, to consider an unstructured covariance matrix and, then, it allows to obtain information about the most appropritate dependece structure. On the other hand, the multilevel modelling permits to obtain: more straightforward interpretations of the model, the construction of univariate full conditional distributions, an easy way to include auxiliary information, the incorporation of within and between subjects (groups) sources of variability, among others. Concerning the estimation methods, we developed a procedure based on Monte Carlo Markov Chain (MCMC) simulation. We showed that the full conditional distributions are known and easy to sample from. Even though such approach demands a considerable amount of time it circumvents many problems such that: limitation in the number of groups that can be considered, the limitation in the number of instants of observation, the choice of covariance matrices, latent trait asymmetry, data imputation, among others. Furthermore, within the MCMC metodology, we developed a procedure to select covariance matrices, by using the so called Reversible Jump MCMC (RJMCMC). Simulation studies show that the model, the estimation method and the model selection procedure produce reasonable results. Also, the studies indicate that the developed metodology presents robustness concerning prior choice and different initial values choice. It is possible to extent the developed estimation methods to other situations in a straightforward way. Some diagnostics techniques that were studied allow to assess the model fit, in a global sense. Others techniques give directions toward the departing from some specific assumptions as the latent trait normality. Such methodology also provides ways to assess the quality of the test or questionaire used to measure the latent traits. Finally, by analyzing a real data set, using some of the models that were developed, it was possible to verify the potential of the methodology considered in this work. Furthermore, the results of this analysis indicate advantages in using longitudinal IRT models to model educational repeated measurement data instead of to assume independence.
243

Modelos de regressão para dados censurados sob distribuições simétricas / Regression models for censored data under symmetric distributions.

Garay, Aldo William Medina 30 April 2014 (has links)
Este trabalho tem como objetivo principal apresentar uma abordagem clássica e Bayesiana dos modelos lineares com observações censuradas, que é uma nova área de pesquisa com grandes possibilidades de aplicações. Aqui, substituimos o uso convencional da distribuição normal para os erros por uma família de distribuições mais flexíveis, o que nos permite lidar de forma mais adequada com observações censuradas na presença de outliers. Esta família é obtida através de um mecanismo de fácil construção e possui como casos especiais as distribuições t de Student, Pearson tipo VII, slash, normal contaminada e, obviamente, a normal. Para o caso de respostas correlacionadas e censuradas propomos um modelo de regressão linear robusto baseado na distribuição t de Student, desenvolvendo um algoritmo tipo EM que depende dos dois primeiros momentos da distribuição t de Student truncada. / This work aims to present a classical and Bayesian approach to linear models with censored observations, which is a new area of research with great potential for applications. Here, we replace the conventional use of the normal distribution for the errors of a more flexible family of distributions, which deal in more appropriately with censored observations in the presence of outliers. This family is obtained through a mechanism easy to construct and has as special cases the distributions Student t, Pearson type VII, slash, contaminated normal, and obviously normal. For the case of correlated and censored responses we propose a model of robust linear regression based on Student\'s t distribution and we developed an EM type algorithm based on the first two moments of the truncated Student\'s t distribution.
244

InSb semiconductors and (In,Mn)Sb diluted magnetic semiconductors

Tran, Lien 21 June 2011 (has links)
Im Rahmen dieser Arbeit wurden InSb- und verdünnt-magnetische In_{1-x}Mn_xSb Filme mittels Gasquellen-Molekularstrahlepitaxie hergestellt und deren strukturelle und elektronische Eigenschaften untersucht. Die 2 μm InSb-Dünnschichten wurden sowohl auf GaAs(001)-Substrat als auch um 4° in Richtung [110] fehlgeschnittenem Si(001)-Substrat hergestellt. Optimierte InSb-Schichten direkt auf GaAs zeigen eine hohe kristalline Qualität, niedriges Rauschen und eine Elektronenbeweglichkeit von 41100 cm^2/Vs bei 300 K. Die Ladungsträgerkonzentration beträgt etwa 2,9e16 cm^{-3}. Um InSb-Dünnschichten guter Qualität auf Si-Substrat zu realisieren, wurden fehlgeschnittene Substrate benutzt. Zur Reduzierung der Gitterfehlanpassung wurden Pufferschichten gewachsen. Eine Elektronenmobilität von 24000 cm^2/Vs und Ladungsträgerkonzentration von 2,6e16 cm^{-3} wurden bei 300 K nachgewiesen. Diese Probe enthält ein 0,06 μm GaAs/AlSb-Supergitter als Pufferschicht (Wachstumstemperatur war 340°C). Diese Probe zeigt der höheren Dichte der Microtwins und Stapelfehler als auch den Threading-Versetzungen in der schnittstellennahen Region geschuldet. Die Deep-Level Rauschspektren zeigen die Existenz von Deep-Levels sowohl in GaAs- als auch in Si-basierten Proben. Die InSb-Filme auf Si-Substrat zeigen einen kleineren Hooge-Faktor im Vergleich zu Schichten auf GaAs (300 K). Unter Anwendung der optimierten Wachstumsbedingungen für InSb/GaAs wurden verdünnt-magnetische In_{1-x}Mn_xSb-Schichten (bis zum 1% Mangan) auf GaAs (001)-realisiert. Mn verringert die Gitterkonstante und damit den Grad der Relaxation von (In,Mn)Sb-Filmen. In den Proben befindet sich Mn in zwei magnetischen Formen, sowohl als verdünnt-magnetischer Halbleiter (In,Mn)Sb, als auch als MnSb-Cluster. Die Cluster dominieren auf der Oberfläche. Die Curie-Temperatur, Tc, unterscheidet sich für die beiden Formen. Für (In,Mn)Sb ist Tc kleiner als 50 K. Die MnSb-Cluster zeigen dagegen ein Tc über 300 K. / This dissertation describes the growth by molecular beam epitaxy and the characterization of the semiconductor InSb and the diluted magnetic semiconductor (DMS) In_{1-x}Mn_xSb. The 2 µm-thick InSb films were grown on GaAs (001) substrate and Si (001) offcut by 4° toward (110) substrate. After optimizing the growth conditions, the best InSb films grown directly on GaAs results in a high crystal quality, low noise, and an electron mobility of 41100 cm^2/V s Vs with associated electron concentration of 2.9e16 cm^{-3} at 300 K. In order to successfully grow InSb on Si, tilted substrates and the insertion of buffer layers were used. An electron mobility of 24000 cm^2/V s measured at 300 K, with an associated carrier concentration of 2.6e16 cm^{-3} is found for the best sample that was grown at 340°C with a 0.06 μm-thick GaSb/AlSb superlattice buffer layer. The sample reveals a density of microtwins and stacking faults as well as threading dislocations in the near-interface. Deep level noise spectra indicate the existence of deep levels in both GaAs and Si-based samples. The Si-based samples exhibit the lowest Hooge factor at 300 K, lower than the GaAs-based samples. Taking the optimized growth conditions of InSb/GaAs, the DMS In_{1-x}Mn_xSb/GaAs is prepared by adding Mn (x < 1%) into the InSb during growth. Mn decreases the lattice constant as well as the degree of relaxation of (In,Mn)Sb films. Mn also distributes itself to result in two different and distinct magnetic materials: the DMS (In,Mn)Sb and clusters MnSb. The MnSb clusters dominate only on the surface. For the DMS alloy (In,Mn)Sb, the measured values of Curie temperature Tc appears to be smaller than 50 K, whereas it is greater than 300 K for the MnSb clusters.
245

Análise bayesiana em modelos TRI de três parâmetros. / Bayesian analysis for three parameters IRT models

Marques, Katia Antunes 19 May 2008 (has links)
Neste trabalho discutimos a análise bayesiana em modelos TRI (Teoria da Resposta ao Item) de três parâmetros com respostas binárias e ordinais, considerando a ligação probito. Em ambos os casos usamos técnicas baseadas em MCCM (método de Monte Carlo baseado em Cadeias de Markov) para estimação dos parâmetros dos itens. No modelo com respostas binárias, consideramos dois conjuntos de dados resultantes de provas com itens de múltipla-escolha. Para esses dados, foi feito um estudo da sensibilidade à escolha de distribuições a priori, além de uma análise das estimativas a posteriori para os parâmetros dos itens: discriminação, dificuldade e probabilidade de acerto ao acaso. Um terceiro conjunto de dados foi utilizado no estudo do modelo com respostas ordinais. Estes dados são provenientes de uma disciplina básica de estatística, onde a prova contêm itens dissertativos. As respostas foram classificadas nas categorias: certa, errada ou parcialmente certa. Utilizamos o programa WinBugs para a estimação dos parâmetros do modelo binário e a função MCMCordfactanal do programa R para estimar os parâmetros do modelo ordinal. Ambos os softwares são não proprietários e gratuitos (livres). / In this dissertation the bayesian analysis for three parameters IRT (Item Response Theory) models with binaries and ordinals responses, considering the probit model, was discussed. For both cases, binary and ordinal, techniques based on MCCM (Monte Carlo Markov Chain) were used to estimate the items parameters. For binary response model, was considered two data sets from tests with multipla choices items. For these two data sets, a sensibility study of the priori distributions choice was considered, and also, an analyses of a posteriori estimates of the items parameters: discrimination, difficulties and guessing. A third data set is used to ilustrate the ordinal response model. This come from an elementar statistical course, where a test with open items is considered. The responses are classified in the following categories: correct, wrong or partial correct. The WinBugs software was used to estimate the parameters for the binary model and, for the ordinal model was considered the function MCMCordfactanal from R program.
246

Estudo da quantificação de incertezas para o problema de contaminação de meios porosos heterogêneos / Study the uncertainty quantification to the problem of contamination of heterogeneous porous media

Thiago Jordem Pereira 10 October 2012 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / As técnicas de injeção de traçadores têm sido amplamente utilizadas na investigação de escoamentos em meios porosos, principalmente em problemas envolvendo a simulação numérica de escoamentos miscíveis em reservatórios de petróleo e o transporte de contaminantes em aquíferos. Reservatórios subterrâneos são em geral heterogêneos e podem apresentar variações significativas das suas propriedades em várias escalas de comprimento. Estas variações espaciais são incorporadas às equações que governam o escoamento no interior do meio poroso por meio de campos aleatórios. Estes campos podem prover uma descrição das heterogeneidades da formação subterrânea nos casos onde o conhecimento geológico não fornece o detalhamento necessário para a predição determinística do escoamento através do meio poroso. Nesta tese é empregado um modelo lognormal para o campo de permeabilidades a fim de reproduzir-se a distribuição de permeabilidades do meio real, e a geração numérica destes campos aleatórios é feita pelo método da Soma Sucessiva de Campos Gaussianos Independentes (SSCGI). O objetivo principal deste trabalho é o estudo da quantificação de incertezas para o problema inverso do transporte de um traçador em um meio poroso heterogêneo empregando uma abordagem Bayesiana para a atualização dos campos de permeabilidades, baseada na medição dos valores da concentração espacial do traçador em tempos específicos. Um método do tipo Markov Chain Monte Carlo a dois estágios é utilizado na amostragem da distribuição de probabilidade a posteriori e a cadeia de Markov é construída a partir da reconstrução aleatória dos campos de permeabilidades. Na resolução do problema de pressão-velocidade que governa o escoamento empregase um método do tipo Elementos Finitos Mistos adequado para o cálculo acurado dos fluxos em campos de permeabilidades heterogêneos e uma abordagem Lagrangiana, o método Forward Integral Tracking (FIT), é utilizada na simulação numérica do problema do transporte do traçador. Resultados numéricos são obtidos e apresentados para um conjunto de realizações amostrais dos campos de permeabilidades. / Tracer injection techniques have been widely used to investigate flows in heterogeneous porous media, especially in problems related to numerical simulation of miscible flows in oil reservoirs and to contaminant transport in aquifers. Oil reservoirs are generally heterogeneous and may possess spatially significant variations in their properties on several length scales. These spatial variations are incorporated into the governing equations for flow problems in porous media on the basis of random fields. Random fields provide a natural description of rock heterogeneities in the typical case in which the geological knowledge of rock is much less detailed than is necessary to predict flow properties through it deterministically. In this thesis we adopt a scalar log-normal permeability field k(x) to reproduce the statistical distribution of the permeability values of a real medium, and the numerical generation of these random fields is based on a Successive Sum of Independent Gaussian Fields defined on multiple length scales. The aim of this work is to study the uncertainty quantification in inverse problems for tracer transport in heterogeneous porous media in a Bayesian framework and propose the permeability update based on observed measurements of spatially sparse tracer concentration at certain times. A two-stage Markov chain Monte Carlo (MCMC) method is used to sample posterior probability distribution with hierarchical priors and the Markov chain is constructed from random reconstruction of the permeability fields. To solve the Darcys law we use a mixed finite elements method which are suitable to compute accurately the relevant fluxes in heterogeneous permeability fields and a Lagrangian strategy, the Forward Integral Tracking (FIT) method, for the numerical simulation of tracer transport problem. Numerical results are presented for a set of sampled realizations of the permeability fields.
247

Modelos longitudinais de grupos múltiplos multiníveis na teoria da resposta ao item: métodos de estimação e seleção estrutural sob uma perspectiva bayesiana / Longitudinal multiple groups multilevel models in the item response theory : estimation methods and structural selection under a bayesian perspective

Caio Lucidius Naberezny Azevedo 11 March 2008 (has links)
No presente trabalho propomos uma estrutura bayesiana, através de um esquema de dados aumentados, para analisar modelos longitudinais com grupos mútiplos (MLGMTRI) na Teoria da Resposta ao Item (TRI). Tal estrutura consiste na tríade : modelagem, métodos de estimação e métodos de diagnóstico para a classe de MLGMTRI. Na parte de modelagem, explorou-se as estruturas multivariada e multinível, com o intuito de representar a hierarquia existente em dados longitudinais com grupos múltiplos. Esta abordagem permite considerar várias classes de submodelos como: modelos de grupos múltiplos e modelos longitudinais de um único grupo. Estudamos alguns aspectos positivos e negativos de cada uma das supracitadas abordagens. A modelagem multivariada permite representar de forma direta estruturas de dependência, além de possibilitar que várias delas sejam facilmente incorporadas no processo de estimação. Isso permite considerar, por exemplo, uma matriz não estruturada e assim, obter indícios da forma mais apropriada para a estrutura de dependência. Por outro lado, a modelagem multinível propicia uma interpretação mais direta, obtenção de condicionais completas univariadas, fácil inclusão de informações adicionais, incorporação de fontes de dependência intra e entre unidades amostrais, dentre outras. Com relação aos métodos de estimação, desenvolvemos um procedimento baseado nas simulações de Monte Carlo via cadeias de Markov (MCMC). Mostramos que as distribuições condicionais completas possuem forma analítica conhecida e, além disso, são fáceis de se amostrar. Tal abordagem, apesar de demandar grande esforço computacional, contorna diversos problemas encontrados em outros procedimentos como: limitação no número de grupos envolvidos, quantidade de condições de avaliação, escolha de estruturas de dependência, assimetria dos traços latentes, imputação de dados, dentre outras. Além disso, através da metodologia MCMC, desenvolvemos uma estrutura de seleção de matrizes de covariâncias, através de um esquema de Monte Carlo via Cadeias de Markov de Saltos Reversíveis (RJMCMC). Estudos de simulação indicam que o modelo, o método de estimação e o método de seleção produzem resultados bastante satisfatórios. Também, robustez à escolha de prioris e valores iniciais foi observada. Os métodos de estimação desenvolvidos podem ser estendidos para diversas situações de interesse de um modo bem direto. Algumas das técnicas de diagnóstico estudadas permitem avaliar a qualidade do ajuste do modelo de um modo global. Outras medidas fornecem indícios de violação de suposições específicas, como ausência de normalidade para os traços latentes. Tal metodologia fornece meios concretos de se avaliar a qualidade do instrumento de medida (prova, questionário etc). Finalmente, a análise de um conjunto de dados real, utilizando-se alguns dos modelos abordados no presente trabalho, ilustra o potencial da tríade desenvolvida além de indicar um ganho na utilização dos modelos longitudinais da TRI na análise de ensaios educacionais com medidas repetidas em deterimento a suposição de independência. / In this work we proposed a bayesian framework, by using an augmented data scheme, to analyze longitudinal multiple groups models (LMGMIRT) in the Item Response Theory (IRT). Such framework consists in the following set : modelling, estimation methods and diagnostic tools to the LMGMIRT. Concerning the modelling, we exploited multivariate and multilevel structures in order to represent the hierarchical nature of the longitudinal multiple groupos model. This approach allows to consider several submodels such that: multiple groups and longitudinal one group models. We studied some positive and negative aspects of both above mentioned approches. The multivariate modelling allows to represent, in a straightforward way, many dependence structures. Furthermore it possibilities that many of them can be easily considered in the estimation process. This allows, for example, to consider an unstructured covariance matrix and, then, it allows to obtain information about the most appropritate dependece structure. On the other hand, the multilevel modelling permits to obtain: more straightforward interpretations of the model, the construction of univariate full conditional distributions, an easy way to include auxiliary information, the incorporation of within and between subjects (groups) sources of variability, among others. Concerning the estimation methods, we developed a procedure based on Monte Carlo Markov Chain (MCMC) simulation. We showed that the full conditional distributions are known and easy to sample from. Even though such approach demands a considerable amount of time it circumvents many problems such that: limitation in the number of groups that can be considered, the limitation in the number of instants of observation, the choice of covariance matrices, latent trait asymmetry, data imputation, among others. Furthermore, within the MCMC metodology, we developed a procedure to select covariance matrices, by using the so called Reversible Jump MCMC (RJMCMC). Simulation studies show that the model, the estimation method and the model selection procedure produce reasonable results. Also, the studies indicate that the developed metodology presents robustness concerning prior choice and different initial values choice. It is possible to extent the developed estimation methods to other situations in a straightforward way. Some diagnostics techniques that were studied allow to assess the model fit, in a global sense. Others techniques give directions toward the departing from some specific assumptions as the latent trait normality. Such methodology also provides ways to assess the quality of the test or questionaire used to measure the latent traits. Finally, by analyzing a real data set, using some of the models that were developed, it was possible to verify the potential of the methodology considered in this work. Furthermore, the results of this analysis indicate advantages in using longitudinal IRT models to model educational repeated measurement data instead of to assume independence.
248

Modelagem espaço-temporal para dados de incidência de doenças em plantas. / Spatiotemporal modelling of plant disease incidence.

Lima, Renato Ribeiro de 18 March 2005 (has links)
A informação sobre a dinâmica espaço-temporal de doenças de plantas é de importância fundamental em estudos epidemiológicos, podendo ser utilizada para descrever e entender o desenvolvimento das doenças, desenvolver planos de amostragem, planejar experimentos controlados e caracterizar perdas na produção ocasionadas pela doença. O estudo de padrões espaciais de doenças de plantas, que são reflexos do processo de dispersão dos patógenos, é importante em estudos epidemiológicos, como o de doenças dos citros, para se definirem estratégias mais adequadas para o controle das doenças, diminuindo os prejuízos causados. A Citricultura é uma das principais atividades agrícolas do Brasil e representa a principal atividade econômica de mais de 400 municípios do Triângulo Mineiro e do Estado de São Paulo, onde se encontra a maior área de citros do país e a maior região produtora de laranjas do mundo. Na avaliação do padrão espacial, diferentes métodos têm sido utilizados, dentre os quais incluem-se o ajuste de distribuições, como, por exemplo, a distribuição beta-binomial, o estudo da relação variância-média, o cálculo de correlação ao intraclasse, a utilização de técnicas de autocorrelação espacial, métodos de classes de distâncias e o ajuste de modelos estocásticos espaço-temporais. Diante da importância de se estudarem padrões espaciais da incidência de doenças em plantas e da necessidade de se conhecer melhor a epidemiologia da morte súbita dos citros e do cancro cítrico, uma técnica baseada em verossimilhança para o ajuste de modelos estocásticos espaço-temporais foi utilizada na caracterização de padrões espaciais. Modificações na metodologia original, buscando uma diminuição do tempo gasto nas análises, foram propostas nesse estudo. Os resultados mostram que as modificações propostas resultaram em uma diminuição significativa no tempo de análise, sem perda de acurácia na estimação dos parâmetros dos modelos considerados. / The information about the spatial-temporal dynamics is of fundamental importance in epidemiological studies for describing and understanding the development of diseases, for developing efficient sampling plans, for planning controlled experiments, for evaluating the effect of different treatments, and for determining crop losses. The Citriculture is the major economic activity of more than 400 municipalities in Minas Gerais and São Paulo States. This is the largest citrus area in Brazil, and the largest sweet orange production area in the world. Therefore, it is very important to study and to characterize spatial patterns of plant diseases, such as citrus canker and citrus sudden death. In the spatial dynamics study, many different methods have been used to characterize the spatial aggregation. These include the fitting of distributions, such as the beta-binomial distribution, the study of variance-mean relationships, the calculation of intraclass correlation, the use of spatial autocorrelation techniques, distance class methods and, the fitting of continuous time spatiotemporal stochastic models. In this work, an improved technique for fitting models to the spatial incidence data by using MCMC methods is proposed. This improved technique, which is used to investigate the spatial patterns of plant disease incidence, is considerably faster than Gibson’s methodology, in terms of computational time, without any loss of accuracy.
249

Training deep convolutional architectures for vision

Desjardins, Guillaume 08 1900 (has links)
Les tâches de vision artificielle telles que la reconnaissance d’objets demeurent irrésolues à ce jour. Les algorithmes d’apprentissage tels que les Réseaux de Neurones Artificiels (RNA), représentent une approche prometteuse permettant d’apprendre des caractéristiques utiles pour ces tâches. Ce processus d’optimisation est néanmoins difficile. Les réseaux profonds à base de Machine de Boltzmann Restreintes (RBM) ont récemment été proposés afin de guider l’extraction de représentations intermédiaires, grâce à un algorithme d’apprentissage non-supervisé. Ce mémoire présente, par l’entremise de trois articles, des contributions à ce domaine de recherche. Le premier article traite de la RBM convolutionelle. L’usage de champs réceptifs locaux ainsi que le regroupement d’unités cachées en couches partageant les même paramètres, réduit considérablement le nombre de paramètres à apprendre et engendre des détecteurs de caractéristiques locaux et équivariant aux translations. Ceci mène à des modèles ayant une meilleure vraisemblance, comparativement aux RBMs entraînées sur des segments d’images. Le deuxième article est motivé par des découvertes récentes en neurosciences. Il analyse l’impact d’unités quadratiques sur des tâches de classification visuelles, ainsi que celui d’une nouvelle fonction d’activation. Nous observons que les RNAs à base d’unités quadratiques utilisant la fonction softsign, donnent de meilleures performances de généralisation. Le dernière article quand à lui, offre une vision critique des algorithmes populaires d’entraînement de RBMs. Nous montrons que l’algorithme de Divergence Contrastive (CD) et la CD Persistente ne sont pas robustes : tous deux nécessitent une surface d’énergie relativement plate afin que leur chaîne négative puisse mixer. La PCD à "poids rapides" contourne ce problème en perturbant légèrement le modèle, cependant, ceci génère des échantillons bruités. L’usage de chaînes tempérées dans la phase négative est une façon robuste d’adresser ces problèmes et mène à de meilleurs modèles génératifs. / High-level vision tasks such as generic object recognition remain out of reach for modern Artificial Intelligence systems. A promising approach involves learning algorithms, such as the Arficial Neural Network (ANN), which automatically learn to extract useful features for the task at hand. For ANNs, this represents a difficult optimization problem however. Deep Belief Networks have thus been proposed as a way to guide the discovery of intermediate representations, through a greedy unsupervised training of stacked Restricted Boltzmann Machines (RBM). The articles presented here-in represent contributions to this field of research. The first article introduces the convolutional RBM. By mimicking local receptive fields and tying the parameters of hidden units within the same feature map, we considerably reduce the number of parameters to learn and enforce local, shift-equivariant feature detectors. This translates to better likelihood scores, compared to RBMs trained on small image patches. In the second article, recent discoveries in neuroscience motivate an investigation into the impact of higher-order units on visual classification, along with the evaluation of a novel activation function. We show that ANNs with quadratic units using the softsign activation function offer better generalization error across several tasks. Finally, the third article gives a critical look at recently proposed RBM training algorithms. We show that Contrastive Divergence (CD) and Persistent CD are brittle in that they require the energy landscape to be smooth in order for their negative chain to mix well. PCD with fast-weights addresses the issue by performing small model perturbations, but may result in spurious samples. We propose using simulated tempering to draw negative samples. This leads to better generative models and increased robustness to various hyperparameters.
250

Échantillonnage dynamique de champs markoviens

Breuleux, Olivier 11 1900 (has links)
L'un des modèles d'apprentissage non-supervisé générant le plus de recherche active est la machine de Boltzmann --- en particulier la machine de Boltzmann restreinte, ou RBM. Un aspect important de l'entraînement ainsi que l'exploitation d'un tel modèle est la prise d'échantillons. Deux développements récents, la divergence contrastive persistante rapide (FPCD) et le herding, visent à améliorer cet aspect, se concentrant principalement sur le processus d'apprentissage en tant que tel. Notamment, le herding renonce à obtenir un estimé précis des paramètres de la RBM, définissant plutôt une distribution par un système dynamique guidé par les exemples d'entraînement. Nous généralisons ces idées afin d'obtenir des algorithmes permettant d'exploiter la distribution de probabilités définie par une RBM pré-entraînée, par tirage d'échantillons qui en sont représentatifs, et ce sans que l'ensemble d'entraînement ne soit nécessaire. Nous présentons trois méthodes: la pénalisation d'échantillon (basée sur une intuition théorique) ainsi que la FPCD et le herding utilisant des statistiques constantes pour la phase positive. Ces méthodes définissent des systèmes dynamiques produisant des échantillons ayant les statistiques voulues et nous les évaluons à l'aide d'une méthode d'estimation de densité non-paramétrique. Nous montrons que ces méthodes mixent substantiellement mieux que la méthode conventionnelle, l'échantillonnage de Gibbs. / One of the most active topics of research in unsupervised learning is the Boltzmann machine --- particularly the Restricted Boltzmann Machine or RBM. In order to train, evaluate or exploit such models, one has to draw samples from it. Two recent algorithms, Fast Persistent Contrastive Divergence (FPCD) and Herding aim to improve sampling during training. In particular, herding gives up on obtaining a point estimate of the RBM's parameters, rather defining the model's distribution with a dynamical system guided by training samples. We generalize these ideas in order to obtain algorithms capable of exploiting the probability distribution defined by a pre-trained RBM, by sampling from it, without needing to make use of the training set. We present three methods: Sample Penalization, based on a theoretical argument as well as FPCD and Herding using constant statistics for their positive phases. These methods define dynamical systems producing samples with the right statistics and we evaluate them using non-parametric density estimation. We show that these methods mix substantially better than Gibbs sampling, which is the conventional sampling method used for RBMs.

Page generated in 0.0714 seconds