• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 39
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 1
  • Tagged with
  • 40
  • 40
  • 12
  • 11
  • 8
  • 6
  • 6
  • 6
  • 6
  • 6
  • 6
  • 6
  • 5
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Modelos bayesianos para estimar risco relativo em desfechos binários e politômicos

Leotti, Vanessa Bielefeldt January 2013 (has links)
A razão de chances (RC) e o risco relativo (RR) são medidas de associação utilizadas em epidemiologia. Existem discussões sobre desvantagens da RC como medida de associação em delineamentos prospectivos, e que nestes o RR deve ser utilizado, especialmente se o desfecho for comum (>10%). No caso de desfechos binários e dados independentes, alternativas ao uso da RC estimada pela regressão logística foram propostas. Uma delas é o modelo log-binomial e outra é a regressão de Poisson com variância robusta. Tais modelos permitem identificar fatores associados ao desfecho e estimar a probabilidade do evento para cada unidade observacional. Em relação à estimação das probabilidades, a regressão de Poisson robusta tem como desvantagem a possibilidade de estimar probabilidades maiores que 1. Isto não ocorre com o modelo log-binomial, entretanto, o mesmo pode enfrentar problemas de convergência. Alguns autores recomendam que o modelo log-binomial seja a primeira escolha de análise, deixando-se o uso da regressão de Poisson robusta apenas para as situações em que o primeiro método não converge. Em 2010, o uso de metodologia bayesiana foi proposta como maneira de solucionar os problemas de convergência e simulações comparando com as abordagens anteriores foram procedidas. No entanto, tais simulações tiveram limitações: preditores categóricos não foram considerados; apenas um tamanho de amostra foi avaliado; apenas a mediana e o intervalo de credibilidade de caudas iguais foram considerados na abordagem bayesiana, quando existem outras opções; e a principal delas, as medidas comparativas foram calculadas para os coeficientes do modelo e não para o RR. Nesta tese, tais limitações foram superadas, e encontrou-se outro estimador bayesiano para o RR, a moda, com menor viés e erro quadrático médio em geral. Os modelos citados anteriormente são apropriados para análise de observações independentes, entretanto há casos em que esta suposição não é válida, como em ensaios clínicos randomizados em cluster ou modelagem multinível. Apenas cinco trabalhos foram encontrados com propostas de como estimar o RR para esses casos. Quando o interesse é a estimação do RR com desfechos politômicos, apenas dois trabalhos apresentaram sugestões. Conseguiu-se neste trabalho estender a metodologia bayesiana proposta para desfechos binários e dados independentes para lidar com essas duas situações. / The odds ratio (OR) and relative risk (RR) are measures of association used in epidemiology. There are discussions about disadvantages of the OR as an measure of association in prospective studies, and that instead of this measure, the RR should be used, especially if the outcome is common (>10%). In the case of binary outcomes and independent data, alternatives to OR estimated by logistic regression were proposed. One is the log-binomial model and other is the Poisson regression with robust variance. Such models allow to identify factors associated with outcome and to estimate the probability of the event for each observational unit. Regarding the estimation of probabilities, the robust Poisson regression has the disadvantage of possibly estimating probabilities greater than 1. This does not occur with the logbinomial model; however, the same can face convergence problems. Some authors recommend the log-binomial model as the first choice of analysis, leaving the use of robust Poisson regression just for situations where the first model does not converge. In 2010, the use of Bayesian methodology was proposed as a way to solve the convergence problems and simulations comparing with the previous approaches were proceeded. However, such simulations had limitations: categorical predictors were not considered; only one sample size was evaluated; only the median and equal tail credible interval were addressed in the Bayesian approach, when there are other options; and the main one, the comparative measures were calculated only for the model coefficients and not for the RR. In this thesis, these limitations have been overcome, and another Bayesian estimator of the RR, the mode, presented less bias and mean squared error in general. The models mentioned above are suitable for analysis of independent observations; however there are cases where this assumption is not valid, as in clustered randomized trials or multilevel modeling. Only five papers were found with proposals of how to estimate the RR in these cases. When the interest is on estimation of the RR with polytomous outcomes, only two studies presented suggestions. In this work, the Bayesian methodology proposed for binary outcomes and independent data was extended to deal with these two situations.
2

Modelos bayesianos para estimar risco relativo em desfechos binários e politômicos

Leotti, Vanessa Bielefeldt January 2013 (has links)
A razão de chances (RC) e o risco relativo (RR) são medidas de associação utilizadas em epidemiologia. Existem discussões sobre desvantagens da RC como medida de associação em delineamentos prospectivos, e que nestes o RR deve ser utilizado, especialmente se o desfecho for comum (>10%). No caso de desfechos binários e dados independentes, alternativas ao uso da RC estimada pela regressão logística foram propostas. Uma delas é o modelo log-binomial e outra é a regressão de Poisson com variância robusta. Tais modelos permitem identificar fatores associados ao desfecho e estimar a probabilidade do evento para cada unidade observacional. Em relação à estimação das probabilidades, a regressão de Poisson robusta tem como desvantagem a possibilidade de estimar probabilidades maiores que 1. Isto não ocorre com o modelo log-binomial, entretanto, o mesmo pode enfrentar problemas de convergência. Alguns autores recomendam que o modelo log-binomial seja a primeira escolha de análise, deixando-se o uso da regressão de Poisson robusta apenas para as situações em que o primeiro método não converge. Em 2010, o uso de metodologia bayesiana foi proposta como maneira de solucionar os problemas de convergência e simulações comparando com as abordagens anteriores foram procedidas. No entanto, tais simulações tiveram limitações: preditores categóricos não foram considerados; apenas um tamanho de amostra foi avaliado; apenas a mediana e o intervalo de credibilidade de caudas iguais foram considerados na abordagem bayesiana, quando existem outras opções; e a principal delas, as medidas comparativas foram calculadas para os coeficientes do modelo e não para o RR. Nesta tese, tais limitações foram superadas, e encontrou-se outro estimador bayesiano para o RR, a moda, com menor viés e erro quadrático médio em geral. Os modelos citados anteriormente são apropriados para análise de observações independentes, entretanto há casos em que esta suposição não é válida, como em ensaios clínicos randomizados em cluster ou modelagem multinível. Apenas cinco trabalhos foram encontrados com propostas de como estimar o RR para esses casos. Quando o interesse é a estimação do RR com desfechos politômicos, apenas dois trabalhos apresentaram sugestões. Conseguiu-se neste trabalho estender a metodologia bayesiana proposta para desfechos binários e dados independentes para lidar com essas duas situações. / The odds ratio (OR) and relative risk (RR) are measures of association used in epidemiology. There are discussions about disadvantages of the OR as an measure of association in prospective studies, and that instead of this measure, the RR should be used, especially if the outcome is common (>10%). In the case of binary outcomes and independent data, alternatives to OR estimated by logistic regression were proposed. One is the log-binomial model and other is the Poisson regression with robust variance. Such models allow to identify factors associated with outcome and to estimate the probability of the event for each observational unit. Regarding the estimation of probabilities, the robust Poisson regression has the disadvantage of possibly estimating probabilities greater than 1. This does not occur with the logbinomial model; however, the same can face convergence problems. Some authors recommend the log-binomial model as the first choice of analysis, leaving the use of robust Poisson regression just for situations where the first model does not converge. In 2010, the use of Bayesian methodology was proposed as a way to solve the convergence problems and simulations comparing with the previous approaches were proceeded. However, such simulations had limitations: categorical predictors were not considered; only one sample size was evaluated; only the median and equal tail credible interval were addressed in the Bayesian approach, when there are other options; and the main one, the comparative measures were calculated only for the model coefficients and not for the RR. In this thesis, these limitations have been overcome, and another Bayesian estimator of the RR, the mode, presented less bias and mean squared error in general. The models mentioned above are suitable for analysis of independent observations; however there are cases where this assumption is not valid, as in clustered randomized trials or multilevel modeling. Only five papers were found with proposals of how to estimate the RR in these cases. When the interest is on estimation of the RR with polytomous outcomes, only two studies presented suggestions. In this work, the Bayesian methodology proposed for binary outcomes and independent data was extended to deal with these two situations.
3

Modelos bayesianos para estimar risco relativo em desfechos binários e politômicos

Leotti, Vanessa Bielefeldt January 2013 (has links)
A razão de chances (RC) e o risco relativo (RR) são medidas de associação utilizadas em epidemiologia. Existem discussões sobre desvantagens da RC como medida de associação em delineamentos prospectivos, e que nestes o RR deve ser utilizado, especialmente se o desfecho for comum (>10%). No caso de desfechos binários e dados independentes, alternativas ao uso da RC estimada pela regressão logística foram propostas. Uma delas é o modelo log-binomial e outra é a regressão de Poisson com variância robusta. Tais modelos permitem identificar fatores associados ao desfecho e estimar a probabilidade do evento para cada unidade observacional. Em relação à estimação das probabilidades, a regressão de Poisson robusta tem como desvantagem a possibilidade de estimar probabilidades maiores que 1. Isto não ocorre com o modelo log-binomial, entretanto, o mesmo pode enfrentar problemas de convergência. Alguns autores recomendam que o modelo log-binomial seja a primeira escolha de análise, deixando-se o uso da regressão de Poisson robusta apenas para as situações em que o primeiro método não converge. Em 2010, o uso de metodologia bayesiana foi proposta como maneira de solucionar os problemas de convergência e simulações comparando com as abordagens anteriores foram procedidas. No entanto, tais simulações tiveram limitações: preditores categóricos não foram considerados; apenas um tamanho de amostra foi avaliado; apenas a mediana e o intervalo de credibilidade de caudas iguais foram considerados na abordagem bayesiana, quando existem outras opções; e a principal delas, as medidas comparativas foram calculadas para os coeficientes do modelo e não para o RR. Nesta tese, tais limitações foram superadas, e encontrou-se outro estimador bayesiano para o RR, a moda, com menor viés e erro quadrático médio em geral. Os modelos citados anteriormente são apropriados para análise de observações independentes, entretanto há casos em que esta suposição não é válida, como em ensaios clínicos randomizados em cluster ou modelagem multinível. Apenas cinco trabalhos foram encontrados com propostas de como estimar o RR para esses casos. Quando o interesse é a estimação do RR com desfechos politômicos, apenas dois trabalhos apresentaram sugestões. Conseguiu-se neste trabalho estender a metodologia bayesiana proposta para desfechos binários e dados independentes para lidar com essas duas situações. / The odds ratio (OR) and relative risk (RR) are measures of association used in epidemiology. There are discussions about disadvantages of the OR as an measure of association in prospective studies, and that instead of this measure, the RR should be used, especially if the outcome is common (>10%). In the case of binary outcomes and independent data, alternatives to OR estimated by logistic regression were proposed. One is the log-binomial model and other is the Poisson regression with robust variance. Such models allow to identify factors associated with outcome and to estimate the probability of the event for each observational unit. Regarding the estimation of probabilities, the robust Poisson regression has the disadvantage of possibly estimating probabilities greater than 1. This does not occur with the logbinomial model; however, the same can face convergence problems. Some authors recommend the log-binomial model as the first choice of analysis, leaving the use of robust Poisson regression just for situations where the first model does not converge. In 2010, the use of Bayesian methodology was proposed as a way to solve the convergence problems and simulations comparing with the previous approaches were proceeded. However, such simulations had limitations: categorical predictors were not considered; only one sample size was evaluated; only the median and equal tail credible interval were addressed in the Bayesian approach, when there are other options; and the main one, the comparative measures were calculated only for the model coefficients and not for the RR. In this thesis, these limitations have been overcome, and another Bayesian estimator of the RR, the mode, presented less bias and mean squared error in general. The models mentioned above are suitable for analysis of independent observations; however there are cases where this assumption is not valid, as in clustered randomized trials or multilevel modeling. Only five papers were found with proposals of how to estimate the RR in these cases. When the interest is on estimation of the RR with polytomous outcomes, only two studies presented suggestions. In this work, the Bayesian methodology proposed for binary outcomes and independent data was extended to deal with these two situations.
4

Comparação via simulação dos estimadores clássicos e bayesianos no modelo de coeficientes aleatórios para dados longitudinais

Leotti, Vanessa Bielefeldt January 2007 (has links)
Frequentemente em pesquisas médicas ou epidemiológicas, múltiplas medidas de um mesmo sujeito são tomadas ao longo do tempo, caracterizando um estudo com dados longitudinais. Nos últimos anos, a técnica estatística que tem sido mais utilizada para a análise desses estudos é o modelo misto, pois este permite incorporar a provável correlação das observações de um mesmo indivíduo e é flexível para lidar com situações de desbalanceamento e dados faltantes. Um modelo misto muito utilizado nesses casos é o modelo de coeficientes aleatórios, que permite que a relação da variável resposta com o tempo seja descrita através de uma função matemática. Há duas abordagens para se analisar o modelo misto: clássica e Bayesiana. Para se aplicar o método Bayesiano nesse caso, deve-se utilizar um dos métodos MCMC, já que a distribuição a posteriori não é analiticamente derivável. O método MCMC utilizado neste trabalho foi o Amostrador de Gibbs. As duas abordagens podem levar a resultados diferentes, deixando o pesquisador em dúvida sobre qual método utilizar. Poucos estudos compararam a abordagem clássica e a Bayesiana para a análise de dados longitudinais via modelos mistos. O objetivo deste trabalho é proceder a um estudo de simulação, para comparar estas abordagens em termos de vício e precisão. Compararam-se os estimadores Bayesianos média, moda (estimada não-parametricamente) e mediana a posteriori e o estimador clássico obtido pelo método REML. Simulou-se um modelo que envolve efeito de tempo e de uma covariável denominada tratamento, assumindo a estrutura Componentes de Variância para as duas matrizes de covariâncias do modelo misto. Diferentes configurações de tamanho de amostra e desbalanceamento foram adotadas, para avaliar o desempenho dos métodos frente a essas situações. Em cada uma das configurações, foram realizadas 1000 replicações no software R. As maiores diferenças encontradas foram em relação a alguns componentes de variância, sendo que pelo menos um dos estimadores Bayesianos apresentou erro quadrático médio menor do que o estimador clássico em todas as configurações. Não foi possível identificar um único estimador Bayesiano como sendo o melhor para todos os casos estudados. A moda mostrou-se um estimador com boas propriedades em algumas situações e por isso sugere-se que o mesmo seja implementado no software WinBUGS. / Frequently in medical or epidemiologic research, multiple measures of the same subject are observed over the time. This characterizes a study with longitudinal data. In the last years, the statistical technique that has been used in the analysis of these studies is the mixed model, because it permits to model the probable correlation between the observations of the same individual, and it handles well with situations of unbalanceament and missing data. A mixed model that has been used in these cases is the random coefficients model. It allows the relationship between the response variable and the time to be described through a mathematical function. There are two approaches to analyze mixed models: the classical and the Bayesian methods. In order to apply the Bayesian inference in this case, the MCMC methods have to be used, because the posterior distribution is not analytically derivable. The MCMC method used in this work was the Gibbs Sampler. The two approaches may produce different results, and because of that the researcher may be in doubt of what method to use. In the literature, there are few studies that compare the classical and the Bayesian approach in the analysis of longitudinal data using mixed models with an analytical way. So, the objective of this work is to proceed a simulation study to compare the Bayesian and classical inferences in terms of bias and precision. The Bayesian estimators posterior mean, (non-parametric) mode and median, and the classical estimator obtained by the REML method were compared. We simulated a model that involves the effects of time and a covariable named “treatment”, and that assumes a Variance Components structure for the two covariance matrices of the mixed model. Different configurations of sample size and unbalanced data were adopted, to see the performance of the methods with these situations. In each of these configurations, 1000 replications were proceeded in the R software. The main differences founded were in the estimation of the variance components of the random effects. For these parameters, one of the Bayesian estimators had lower mean square error than the classical in all of the configurations. It was not possible to identify one best Bayesian estimator in all the cases studied. The mode seems an estimator with good properties in some situations and because of that it should be implemented in the WinBUGS software.
5

Comparação via simulação dos estimadores clássicos e bayesianos no modelo de coeficientes aleatórios para dados longitudinais

Leotti, Vanessa Bielefeldt January 2007 (has links)
Frequentemente em pesquisas médicas ou epidemiológicas, múltiplas medidas de um mesmo sujeito são tomadas ao longo do tempo, caracterizando um estudo com dados longitudinais. Nos últimos anos, a técnica estatística que tem sido mais utilizada para a análise desses estudos é o modelo misto, pois este permite incorporar a provável correlação das observações de um mesmo indivíduo e é flexível para lidar com situações de desbalanceamento e dados faltantes. Um modelo misto muito utilizado nesses casos é o modelo de coeficientes aleatórios, que permite que a relação da variável resposta com o tempo seja descrita através de uma função matemática. Há duas abordagens para se analisar o modelo misto: clássica e Bayesiana. Para se aplicar o método Bayesiano nesse caso, deve-se utilizar um dos métodos MCMC, já que a distribuição a posteriori não é analiticamente derivável. O método MCMC utilizado neste trabalho foi o Amostrador de Gibbs. As duas abordagens podem levar a resultados diferentes, deixando o pesquisador em dúvida sobre qual método utilizar. Poucos estudos compararam a abordagem clássica e a Bayesiana para a análise de dados longitudinais via modelos mistos. O objetivo deste trabalho é proceder a um estudo de simulação, para comparar estas abordagens em termos de vício e precisão. Compararam-se os estimadores Bayesianos média, moda (estimada não-parametricamente) e mediana a posteriori e o estimador clássico obtido pelo método REML. Simulou-se um modelo que envolve efeito de tempo e de uma covariável denominada tratamento, assumindo a estrutura Componentes de Variância para as duas matrizes de covariâncias do modelo misto. Diferentes configurações de tamanho de amostra e desbalanceamento foram adotadas, para avaliar o desempenho dos métodos frente a essas situações. Em cada uma das configurações, foram realizadas 1000 replicações no software R. As maiores diferenças encontradas foram em relação a alguns componentes de variância, sendo que pelo menos um dos estimadores Bayesianos apresentou erro quadrático médio menor do que o estimador clássico em todas as configurações. Não foi possível identificar um único estimador Bayesiano como sendo o melhor para todos os casos estudados. A moda mostrou-se um estimador com boas propriedades em algumas situações e por isso sugere-se que o mesmo seja implementado no software WinBUGS. / Frequently in medical or epidemiologic research, multiple measures of the same subject are observed over the time. This characterizes a study with longitudinal data. In the last years, the statistical technique that has been used in the analysis of these studies is the mixed model, because it permits to model the probable correlation between the observations of the same individual, and it handles well with situations of unbalanceament and missing data. A mixed model that has been used in these cases is the random coefficients model. It allows the relationship between the response variable and the time to be described through a mathematical function. There are two approaches to analyze mixed models: the classical and the Bayesian methods. In order to apply the Bayesian inference in this case, the MCMC methods have to be used, because the posterior distribution is not analytically derivable. The MCMC method used in this work was the Gibbs Sampler. The two approaches may produce different results, and because of that the researcher may be in doubt of what method to use. In the literature, there are few studies that compare the classical and the Bayesian approach in the analysis of longitudinal data using mixed models with an analytical way. So, the objective of this work is to proceed a simulation study to compare the Bayesian and classical inferences in terms of bias and precision. The Bayesian estimators posterior mean, (non-parametric) mode and median, and the classical estimator obtained by the REML method were compared. We simulated a model that involves the effects of time and a covariable named “treatment”, and that assumes a Variance Components structure for the two covariance matrices of the mixed model. Different configurations of sample size and unbalanced data were adopted, to see the performance of the methods with these situations. In each of these configurations, 1000 replications were proceeded in the R software. The main differences founded were in the estimation of the variance components of the random effects. For these parameters, one of the Bayesian estimators had lower mean square error than the classical in all of the configurations. It was not possible to identify one best Bayesian estimator in all the cases studied. The mode seems an estimator with good properties in some situations and because of that it should be implemented in the WinBUGS software.
6

Comparação via simulação dos estimadores clássicos e bayesianos no modelo de coeficientes aleatórios para dados longitudinais

Leotti, Vanessa Bielefeldt January 2007 (has links)
Frequentemente em pesquisas médicas ou epidemiológicas, múltiplas medidas de um mesmo sujeito são tomadas ao longo do tempo, caracterizando um estudo com dados longitudinais. Nos últimos anos, a técnica estatística que tem sido mais utilizada para a análise desses estudos é o modelo misto, pois este permite incorporar a provável correlação das observações de um mesmo indivíduo e é flexível para lidar com situações de desbalanceamento e dados faltantes. Um modelo misto muito utilizado nesses casos é o modelo de coeficientes aleatórios, que permite que a relação da variável resposta com o tempo seja descrita através de uma função matemática. Há duas abordagens para se analisar o modelo misto: clássica e Bayesiana. Para se aplicar o método Bayesiano nesse caso, deve-se utilizar um dos métodos MCMC, já que a distribuição a posteriori não é analiticamente derivável. O método MCMC utilizado neste trabalho foi o Amostrador de Gibbs. As duas abordagens podem levar a resultados diferentes, deixando o pesquisador em dúvida sobre qual método utilizar. Poucos estudos compararam a abordagem clássica e a Bayesiana para a análise de dados longitudinais via modelos mistos. O objetivo deste trabalho é proceder a um estudo de simulação, para comparar estas abordagens em termos de vício e precisão. Compararam-se os estimadores Bayesianos média, moda (estimada não-parametricamente) e mediana a posteriori e o estimador clássico obtido pelo método REML. Simulou-se um modelo que envolve efeito de tempo e de uma covariável denominada tratamento, assumindo a estrutura Componentes de Variância para as duas matrizes de covariâncias do modelo misto. Diferentes configurações de tamanho de amostra e desbalanceamento foram adotadas, para avaliar o desempenho dos métodos frente a essas situações. Em cada uma das configurações, foram realizadas 1000 replicações no software R. As maiores diferenças encontradas foram em relação a alguns componentes de variância, sendo que pelo menos um dos estimadores Bayesianos apresentou erro quadrático médio menor do que o estimador clássico em todas as configurações. Não foi possível identificar um único estimador Bayesiano como sendo o melhor para todos os casos estudados. A moda mostrou-se um estimador com boas propriedades em algumas situações e por isso sugere-se que o mesmo seja implementado no software WinBUGS. / Frequently in medical or epidemiologic research, multiple measures of the same subject are observed over the time. This characterizes a study with longitudinal data. In the last years, the statistical technique that has been used in the analysis of these studies is the mixed model, because it permits to model the probable correlation between the observations of the same individual, and it handles well with situations of unbalanceament and missing data. A mixed model that has been used in these cases is the random coefficients model. It allows the relationship between the response variable and the time to be described through a mathematical function. There are two approaches to analyze mixed models: the classical and the Bayesian methods. In order to apply the Bayesian inference in this case, the MCMC methods have to be used, because the posterior distribution is not analytically derivable. The MCMC method used in this work was the Gibbs Sampler. The two approaches may produce different results, and because of that the researcher may be in doubt of what method to use. In the literature, there are few studies that compare the classical and the Bayesian approach in the analysis of longitudinal data using mixed models with an analytical way. So, the objective of this work is to proceed a simulation study to compare the Bayesian and classical inferences in terms of bias and precision. The Bayesian estimators posterior mean, (non-parametric) mode and median, and the classical estimator obtained by the REML method were compared. We simulated a model that involves the effects of time and a covariable named “treatment”, and that assumes a Variance Components structure for the two covariance matrices of the mixed model. Different configurations of sample size and unbalanced data were adopted, to see the performance of the methods with these situations. In each of these configurations, 1000 replications were proceeded in the R software. The main differences founded were in the estimation of the variance components of the random effects. For these parameters, one of the Bayesian estimators had lower mean square error than the classical in all of the configurations. It was not possible to identify one best Bayesian estimator in all the cases studied. The mode seems an estimator with good properties in some situations and because of that it should be implemented in the WinBUGS software.
7

Discretização para aprendizagem bayesiana: aplicação no auxílio à validação de dados em proteção ao vôo.

Jackson Paul Matsuura 00 December 2003 (has links)
A utilização de redes Bayesianas, que são uma representação compacta de distribuições de probabilidades conjuntas de um domínio, vem crescendo em diversas áreas e aplicações. As redes Bayesianas podem ser construídas a partir do conhecimento de especialistas ou por algoritmos de aprendizagem Bayesiana que inferem as relações entre as variáveis do domínio a partir de um conjunto de dados de treinamento. A construção manual de redes Bayesianas, pode ser trabalhosa, cara e estar propenso a erros vem cada vez mais sendo preterida pelo uso de algoritmos de aprendizagem Bayesiana, mas os algoritmos de aprendizagem em geral pressupõem que as variáveis utilizadas na aprendizagem sejam discretas ou, caso sejam contínuas, apresentem uma distribuição gaussiana, o que normalmente não ocorre na prática. Portanto para o uso da aprendizagem Bayesiana é necessário que as variáveis sejam discretizadas segundo algum critério, que no caso mais simples pode ser uma discretização uniforme. A grande maioria dos métodos de discretização existentes, porém, não são adequados à aprendizagem Bayesiana, pois foram desenvolvidos no contexto de classificação e não de descoberta de conhecimento. Nesse trabalho é proposto e utilizado um método de discretização de variáveis que leva em conta as distribuições condicionais das mesmas no processo de discretização, objetivando um melhor resultado do processo de aprendizagem Bayesiana. O método proposto foi utilizado em uma base de dados real de informações de Proteção ao Vôo e a rede Bayesiana construída foi utilizada no auxílio à validação de dados, realizando uma triagem automatizada dos dados. Foi realizada uma comparação entre o método proposto de discretização e um dos métodos mais comuns. Os resultados obtidos mostram a efetividade do método de discretização proposto e apontam para um grande potencial dessa nova aplicação da aprendizagem e inferência Bayesiana.
8

Análise de propagação em vegetação utilizando Bayes e UT

Loureiro, Alexandre José Figueiredo 30 September 2018 (has links)
Tese (doutorado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2018. / A vegetação é considerada um ambiente complexo para análise de espalhamento e atenuação dentro do fenômeno de propagação de ondas rádio. Esta tese apresenta um preditor bayesiano de atenuação de propagação de ondas de rádio em vegetação baseado na sua correlação com pixels de vegetação de uma imagem e utilizando as vantagens computacionais da transformada da incerteza (UT). O processamento de imagens de satélite pode refinar o planejamento de sistemas de rádio usando a vegetação como preditor de atenuação. Neste trabalho a predição é baseada na correlação de mais de 56% entre valores de pixel RGB e valores de atenuação na vegetação obtida de três grupos de medições de potência em testes de campo em ondas centimétricas em duas regiões distintas do Brasil: Belo Horizonte, na região sudeste com medições em 18 GHz, e Manaus em 24 GHz na região norte. Esta predição aplicada nos dois grupos de medições em Manaus apresentou correlações de 0,59 e 0,56 respectivamente enquanto que em Belo Horizonte apresentou correlação de 0,57. As análises estatísticas mostraram que mais de 30% da variância da atenuação nestes três grupos de medições podem ser explicadas pelos valores de pixel RGB. Utilizando este modelo linear correlacionado entre pixels RGB de vegetação e valores geolocalizados de atenuação, este trabalho combina a Transformada da Incerteza (UT) e a inferência de Bayes para refinar a distribuição de atenuação em vegetação. Como a necessária multiplicação das distribuições prior e amostral de Bayes não está facilmente disponível na UT, este trabalho apresenta um método que calcula novos pontos sigma comuns, mas com diferentes pesos para as distribuições prior e amostral da UT, desta forma permitindo a multiplicação de Bayes. / The vegetation is considered a complex environment for analysis of scattering and attenuation in radio propagation phenomena. This thesis presents a bayesian predictor for radio propagation attenuation through vegetation based on the its correlation with vegetation pixels from an image and utilizing the computational advantages of the unscented transform (UT). The satellite image processing can improve planning of radio systems with a vegetation attenuation predictor. In this research, the prediction is based on the correlation of more than 56% between RGB pixel values and vegetation attenuation taken from three groups of power measurements at centimeter waves at two distinct regions of Brazil: Belo Horizonte, in the southeast region measured at 18 GHz, and Manaus at 24 GHz in the north region. This prediction applied at two groups of power measurements at Manaus showed correlation 0.62 and 0.56 respectively, while at Belo Horizonte showed correlation of 0.57. The statistical analysis showed that more than 30% of the attenuation variance at these three measurements groups was due to the RGB pixel values. Using this linear correlated model between vegetation pixel RGB values and geolocated attenuation values, this work combined the unscented transform (UT) and bayesian inference to refine the vegetation attenuation distribution. Since the necessary multiplication of bayes prior and sampling distributions is not easily available in the UT, this research presents a method that calculates new common sigma points and different new weights for the prior and sampling UT distributions, thus allowing the Bayes multiplication.
9

Análise de correlação ecológica : uma abordagem inteiramente bayesiana para a mortalidade infantil no Rio Grande do Sul

Kato,Sergio Kakuta January 2007 (has links)
A taxa de mortalidade infantil é um dos indicadores mais usados para medir a qualidade de vida da população. Um dos indicadores sócio-econômico do Rio Grande do Sul é o Índice de Desenvolvimento Sócio-econômico (IDESE) da Fundação de Economia e Estatística (FEE) que tem como um de seus componentes a taxa de mortalidade infantil. Geralmente os estudos relacionam a taxa de mortalidade infantil com fatores de risco associados às áreas em estudo de forma descritiva, ou seja, de forma apenas visual através de mapas. O presente trabalho apresenta uma aplicação de um dos métodos de Epidemiologia Espacial: Estudos de Correlação Ecológica, através de modelos hierárquicos e métodos inteiramente Bayesianos, utilizando covariáveis. Os principais problemas presentes nas taxas de mortalidade brutas ou nas SMR (Standardised Mortality Ratio) como a auto-correlação espacial e a instabilidade dos estimadores para pequenas áreas são discutidos. Para superar estas dificuldades as estimativas do risco relativo obtidas pela análise de regressão espacial, utilizando modelagem inteiramente Bayesiana, são apresentados como alternativa, pois além de incorporar componente espacialmente estruturado ao modelo, permite também a inclusão de covariáveis. No artigo são analisados os riscos de mortalidade infantil nos 496 municípios do Rio Grande do Sul para dados acumulados entre os anos de 2001 a 2004. Foram comparados vários modelos com diferentes especificações de componente espacial e covariáveis provenientes do IDESE-FEE/2003. Verificou-se que os modelos que utilizam a estrutura espacial além de covariáveis apresentaram melhor performance, quando comparado pelo critério DIC (Deviance Information Criterion). Comparando as SMRs com os riscos relativos obtidos pela modelagem inteiramente Bayesiana foi possível observar um ganho substancial na interpretação e na detecção de padrões de variação no risco de mortalidade infantil nos municípios do Rio Grande do Sul. / The infant mortality rate is one of the indicators used to measure the population’s life quality. The Rio Grande do Sul State has a social and economic indicator called Índice de Desenvolvimento Sócio-econômico (IDESE), maintained by the Economic and Statistics Foundation (FEE), which also uses the infant mortality rate. Usually, most studies relate the infant mortality rate with risk factors visually, aided by maps. This study presents the methodology and an application of one of the Spatial Epidemiology methods, the Ecologic Correlation, using Hierarchical Bayesian procedures. The main problems found in Ecologic correlations, such as the spatial autocorrelation and the estimator’s instability for small areas, are discussed. To overcome these difficulties, the relative risk estimate obtained by spatial regression analysis using fully Bayesian estimation method is presented. Presently, the rate of infant mortality is analysed in all 496 municipalities of the Rio Grande do Sul State, between the years 2001 to 2004. Several models with different specifications of spatial components and different variables from the IDESE-FEE/2003 were compared. It was found that the model with spatial structure and the Education variable showed better performance than other models. With this methodology was possible to obtain a more interpretable pattern of infant mortality risk in the Rio Grande do Sul State.
10

Análise de correlação ecológica : uma abordagem inteiramente bayesiana para a mortalidade infantil no Rio Grande do Sul

Kato,Sergio Kakuta January 2007 (has links)
A taxa de mortalidade infantil é um dos indicadores mais usados para medir a qualidade de vida da população. Um dos indicadores sócio-econômico do Rio Grande do Sul é o Índice de Desenvolvimento Sócio-econômico (IDESE) da Fundação de Economia e Estatística (FEE) que tem como um de seus componentes a taxa de mortalidade infantil. Geralmente os estudos relacionam a taxa de mortalidade infantil com fatores de risco associados às áreas em estudo de forma descritiva, ou seja, de forma apenas visual através de mapas. O presente trabalho apresenta uma aplicação de um dos métodos de Epidemiologia Espacial: Estudos de Correlação Ecológica, através de modelos hierárquicos e métodos inteiramente Bayesianos, utilizando covariáveis. Os principais problemas presentes nas taxas de mortalidade brutas ou nas SMR (Standardised Mortality Ratio) como a auto-correlação espacial e a instabilidade dos estimadores para pequenas áreas são discutidos. Para superar estas dificuldades as estimativas do risco relativo obtidas pela análise de regressão espacial, utilizando modelagem inteiramente Bayesiana, são apresentados como alternativa, pois além de incorporar componente espacialmente estruturado ao modelo, permite também a inclusão de covariáveis. No artigo são analisados os riscos de mortalidade infantil nos 496 municípios do Rio Grande do Sul para dados acumulados entre os anos de 2001 a 2004. Foram comparados vários modelos com diferentes especificações de componente espacial e covariáveis provenientes do IDESE-FEE/2003. Verificou-se que os modelos que utilizam a estrutura espacial além de covariáveis apresentaram melhor performance, quando comparado pelo critério DIC (Deviance Information Criterion). Comparando as SMRs com os riscos relativos obtidos pela modelagem inteiramente Bayesiana foi possível observar um ganho substancial na interpretação e na detecção de padrões de variação no risco de mortalidade infantil nos municípios do Rio Grande do Sul. / The infant mortality rate is one of the indicators used to measure the population’s life quality. The Rio Grande do Sul State has a social and economic indicator called Índice de Desenvolvimento Sócio-econômico (IDESE), maintained by the Economic and Statistics Foundation (FEE), which also uses the infant mortality rate. Usually, most studies relate the infant mortality rate with risk factors visually, aided by maps. This study presents the methodology and an application of one of the Spatial Epidemiology methods, the Ecologic Correlation, using Hierarchical Bayesian procedures. The main problems found in Ecologic correlations, such as the spatial autocorrelation and the estimator’s instability for small areas, are discussed. To overcome these difficulties, the relative risk estimate obtained by spatial regression analysis using fully Bayesian estimation method is presented. Presently, the rate of infant mortality is analysed in all 496 municipalities of the Rio Grande do Sul State, between the years 2001 to 2004. Several models with different specifications of spatial components and different variables from the IDESE-FEE/2003 were compared. It was found that the model with spatial structure and the Education variable showed better performance than other models. With this methodology was possible to obtain a more interpretable pattern of infant mortality risk in the Rio Grande do Sul State.

Page generated in 0.4656 seconds