• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 64
  • 6
  • 5
  • 5
  • 5
  • 5
  • 5
  • 5
  • 5
  • 4
  • Tagged with
  • 71
  • 71
  • 67
  • 66
  • 29
  • 21
  • 20
  • 20
  • 17
  • 17
  • 16
  • 13
  • 12
  • 12
  • 11
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Mineração de dados educacionais aplicada à busca de perfis de alunos em casos de evasão ou retenção: uma abordagem através de Redes Bayesianas

COUTO, Diego da Costa do 12 September 2017 (has links)
Submitted by Carmen Torres (carmensct@globo.com) on 2018-02-09T18:16:07Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_MineraçãoDadosEducacionais.pdf: 1998458 bytes, checksum: 1b7da795e82e32e0d1cbe0b9ffc47830 (MD5) / Approved for entry into archive by Edisangela Bastos (edisangela@ufpa.br) on 2018-02-20T18:02:13Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_MineraçãoDadosEducacionais.pdf: 1998458 bytes, checksum: 1b7da795e82e32e0d1cbe0b9ffc47830 (MD5) / Made available in DSpace on 2018-02-20T18:02:13Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_MineraçãoDadosEducacionais.pdf: 1998458 bytes, checksum: 1b7da795e82e32e0d1cbe0b9ffc47830 (MD5) Previous issue date: 2017-09-12 / Este trabalho investiga os perfis de alunos de cursos da graduação da Universidade Federal do Pará propensos a dois problemas enfrentados em diversas universidades brasileiras denominados evasão e retenção. Estas problemáticas estimularam o estudo de metodologias que detectassem padrões que suscitam a extrapolação ou o fim prematuro dos estudos. A ferramenta elegida a este fim, a Rede Bayesiana é poderosa ao propiciar raciocínio sobre incertezas, especialmente em diagnósticos de causas e efeitos tendo como pressuposto o relacionamento das variáveis e suas probabilidades de ocorrências conjuntas e marginais. Outro aspecto inerente a estrutura das Redes Bayesianas diz respeito à compreensibilidade da representação e dos resultados, os quais geram subsídios voltados a especialistas e usuários inseridos no domínio. Considerando tais colocações, essas potencialidades da metodologia em questão fortaleceram a sua aplicação nesta pesquisa. Dessa forma, registros acadêmicos contendo dezenas de milhares de amostras oriundas de alunos imersos em ambientes de ensino presencial pertencentes aos alunos de graduação ingressantes na Universidade Federal do Pará até o ano de 2016 foram submetidos ao processo de Descoberta de Conhecimento em Base de Dados, especificamente na etapa de Mineração de Dados os padrões desejados foram extraídos valendo-se da tarefa de classificação. Em adição, realizou-se na etapa de Mineração de Dados várias análises de desempenhos da Rede Bayesiana junto a outros algoritmos clássicos do aprendizado supervisionado, e aquela revelou a sua grande acurácia e eficiência, ressaindo dentre as melhores soluções encontradas, isto posto o seu uso foi certificado sobre a base de dados selecionada. Em três estudos de casos avaliados, os resultados indicaram a qualidade do classificador baseado em Redes Bayesianas que apresentou acurácia superior a 82%, condição que legitima a sua utilidade no domínio pesquisado. Assim, os resultados atingidos foram satisfatórios e apontaram fortes influências de algumas variáveis à propensão da evasão ou retenção. / This work investigates the profiles of undergraduate students at the University of Federal University of Pará prone to two problems faced in several universities evasion and retention. These problems stimulated the study of methodologies that detect patterns that lead to extrapolation or the premature end of the studies. The tool chosen for this purpose, the Bayesian Network is powerful in providing reasoning about uncertainties, especially in causes and effects diagnoses. Assumption of the relationship of the variables and their probability of occurrence and marginal. Another aspect inherent in the structure of Bayesian Networks is the comprehensibility of representation and results, which generate specialists and users entered into the domain. Considering such placements, these potential of the methodology in question strengthened its application in this research. So, academic records containing tens of thousands of samples from students immersed in presential teaching environments belonging to undergraduate students at the Federal University of Pará until the year 2016 were submitted to the of Knowledge Discovery in the Database, specifically in Data Mining the desired patterns were extracted using the classification task. In addition, several performance analyzes were performed during Data Mining stage The Bayesian Network together with other classic algorithms of supervised learning, and which revealed its great accuracy and efficiency, rising from the best solutions found, its use has been certified on the selected database. In three Study of Case, the results shows classifier’s quality based on Bayesian Networks, which presented an accuracy of more than 82%, a condition that its usefulness in the researched domain. Thus, the results achieved were satisfactory and strong influences of some variables on the propensity of evasion or retention.
32

Sistema especialista probabilístico para o auxílio no manejo nutricional de pacientes com diabetes mellitus utilizando a contagem de carboidratos / Kristy Soraya Coelho ; orientadora, Andreia Malucelli

Coelho, Kristy Soraya January 2008 (has links)
Dissertação (mestrado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2008 / Bibliografia: f. 112-125 / Este trabalho propõe a concepção de um sistema especialista probabilístico para auxiliar no manejo nutricional do paciente com Diabetes mellitus, utilizando como terapia nutricional a contagem de carboidratos. Com a sistematização do processo de consulta / This work propose the conception of probabilistic expert systems to help with diabetes mellitus patients' management nutritional using as nutritional therapy the carbohydrates counting. With nutritional attend process systematization was possible to find
33

Desenvolvimento de uma rede bayesiana de apoio à escolha de modo e parâmetros ventilatórios em pacientes com traumatismo crânio encefálico grave / Anny Chi ; orietadora, Andreia Malucelli ; co-orientadora, Raquel K. Stasiu

Chi, Anny January 2009 (has links)
Dissertação (mestrado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2009 / Bibliografia: f. 92-99 / O paciente com Traumatismo Crânio Encefálico (TCE) grave internados em UTIs são os responsáveis pelos maiores gastos hospitalares, devido ao maior uso de ventilação mecânica. A permanência prolongada destes pacientes utilizando a ventilação mecânica é jus / The patient with Traumatic Brain Injury (TBI) is serious part of the internment of neurological patients in Intensine Care Units (ICU), and they are responsible for the largest hospital expenses due to greater use of mechanical ventilation. The prolonged
34

Efeito do número de genes na avaliação genética utilizando dados simulados / Effect of number of genes on genetic evaluation using simulated data

Assis, Giselle Mariano Lessa de 14 February 2005 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2017-06-02T19:09:41Z No. of bitstreams: 1 texto completo.pdf: 372842 bytes, checksum: 12b29825980afde297d6a985988fe93c (MD5) / Made available in DSpace on 2017-06-02T19:09:41Z (GMT). No. of bitstreams: 1 texto completo.pdf: 372842 bytes, checksum: 12b29825980afde297d6a985988fe93c (MD5) Previous issue date: 2005-02-14 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Foram simulados quatro distintos tipos de populações por meio do programa GENESYS com os objetivos de: verificar a influência do número de genes e do tamanho da população na estimação de componentes de variância e na predição de valores genéticos; verificar a adequabilidade do modelo infinitesimal como pressuposição nas análises genéticas; comparar as metodologias clássica e Bayesiana na análise genética de dados selecionados; e verificar a influência do nível de informação a priori ao utilizar metodologia Bayesiana. Dois processos seletivos foram aplicados por 10 gerações a partir da população-base formada por 120 (população pequena) ou por 2.400 indivíduos com registros (população grande): Seleção ao Acaso e Seleção Fenotípica. Foi considerado que dois diferentes números de genes governavam a característica sob seleção, para cada tamanho de população: 900 ou 10 pares de locos. Para as populações pequenas, foram realizadas 500 repetições de cada processo seletivo e para as populações grandes, 300 repetições. Na análise Bayesiana, três níveis de informação a priori foram considerados: não- informativo, pouco informativo e informativo. Os componentes de variância foram estimados utilizando-se somente a população-base, somente a população da 10a geração após seleção ou todas as populações, desde a população-base até a 10a geração após seleção. Os valores genéticos foram preditos para a população-base e para a 10a geração após seleção, considerando, porém, diferentes conjuntos de dados no processo de predição. A Porcentagem de Erro entre os componentes de variâncias estimados e os reais foi utilizada para comparar as metodologias, assim como as diferentes populações e gerações analisadas. Os valores genéticos, por sua vez, foram comparados por meio do Quadrado Médio do Desvio, da Porcentagem de indivíduos Selecionados em Comum entre os 15% melhores indivíduos e pela Correlação de Ordem entre os valores reais e preditos. Conforme os resultados obtidos, pôde-se concluir que quando a característica é governada por elevado número de genes, os componentes de variância genética aditiva e ambiental são satisfatoriamente estimados em populações selecionadas grandes ou pequenas pelas metodologias usuais, desde que os registros de todos os indivíduos e a matriz completa de parentesco sejam conhecidos. Por outro lado, quando a característica é governada por reduzido número de genes, estimativas menos acuradas do componente de variância genética aditiva são obtidas em populações grandes e, caso as informações de parentescos e registros anteriores sejam desconhecidos, o erro na estimação desse componente aumenta consideravelmente, em populações grandes ou pequenas. Verificou-se também que os valores genéticos são superestimados sob seleção fenotípica quando os registros de todos os indivíduos e a matriz completa de parentesco são incluídos nas análises, independentemente do tamanho da população. A queda na acurácia é ainda mais acentuada quando a característica é governada por reduzido número de genes, sendo a classificação correta dos indivíduos também prejudicada. A inclusão do registro de todos os indivíduos, assim como da matriz de parentesco completa beneficiam a classificação adequada dos indivíduos. Verificou-se também que o modelo infinitesimal não é adequado para ser utilizado como pressuposição nas análises genéticas quando a característica é governada por poucos genes, independentemente do tamanho da população. Ao comparar as metodologias REML e Bayesiana verificou-se que, em geral, essas metodologias produzem resultados bastante semelhantes na estimação dos componentes de variância. Para análises com menor quantidade de dados, no entanto, estimativas mais acuradas são obtidas ao se utilizar priors informativos por meio da análise Bayesiana. Concluiu-se também que a acurácia na predição dos valores genéticos, assim como a classificação dos indivíduos não são alteradas pelo nível de informação a priori das análises Bayesianas, cujos resultados também se assemelham aos da metodologia EBLUP. / Four different population types were simulated using GENESYS program with the following objectives: to verify the influence of the number of genes and the population size on variance component estimation and on breeding values prediction; to verify the infinitesimal model as an appropriate assumption on genetic analyses; to compare the classic and Bayesian methodologies on the genetic analysis of selected data; and to verify the influence of a priori information level in Bayesian methodology. Two selective processes were applied for 10 generations starting from base population formed by 120 (small population) or by 2,400 individuals with records (large population): Random Selection and Phenotypic Selection. It was considered that two different numbers of genes governed the trait under selection, for each population size: 900 or 10 pairs of loci. Five hundred repetitions of each selective process for small populations and three hundred repetitions were accomplished for large populations. On Bayesian analysis, three a priori information levels were considered: no-informative, slightly informative and informative. Variance components were estimated using only base population, only population of the 10 th generation after selection or all of populations, from base population up to 10 th selection generation. Breeding values were predicted for base population and for 10 th selection generation, considering, however, different groups of data on the prediction process. Error Percentage between estimated and real variance components was used to compare the methodologies, as well as the different populations and generations analyzed. Genetic values were compared using Average Square Deviation, Percentage of Common Individuals selected among the 15% better individuals and Rank Correlation among predicted and real values. According to the results, it was concluded that when the trait is xgoverned by high number of genes, the genetic additive and environmental variance component are well estimated by usual methodologies in large or small selected populations, since data of all animals and complete relationship matrix are known. On the other hand, when the trait is governed by reduced number of genes, less accurate estimates of additive genetic variance are obtained in large populations and, when relationship information and previous data are unknown, estimate errors of that component increase considerably, in large or small populations. It was also verified that breeding values are overestimated under phenotypic selection when data of all individuals and complete relationship matrix are included on analyses, independently of population size. Accuracy decrease is more accentuated when the trait is governed by reduced number of genes, being the correct classification of individuals also affected. The inclusion of all data, as well as complete relationship matrix benefit the appropriate classification of individuals. It was also verified that the infinitesimal model is not appropriate to be used as assumption in genetic analyses when the trait is governed by few genes, independently of population size. When comparing REML and Bayesian methodologies, it was verified that, in general, these methodologies produce similar results on variance components estimation. However, when analyses are performed with smaller amount of data, informative priors using Bayesian analysis yields more accurate estimates. Finally, accuracy of breeding values prediction, as well as the rank of individuals are not changed by a priori information level on Bayesian analyses, whose results are also similar to the EBLUP methodology.
35

Modelagem probabilística da dinâmica da Zika usando modelos hierárquicos bayesianos

Bastos, Marcio Maciel 06 March 2018 (has links)
Submitted by Marcio Maciel Bastos (marciomacielbastos@hotmail.com) on 2018-04-02T15:09:10Z No. of bitstreams: 4 dsrtcao.pdf: 3763696 bytes, checksum: e5614aca9d57fde04661fc6da2f7fe8d (MD5) Folha de assinaturas.pdf: 145939 bytes, checksum: b0efa18a3054171cdc8cc52a6a4d715f (MD5) EMAp Ficha catalográfica.pdf: 16727 bytes, checksum: 10446f26497b911613967664f6ca959c (MD5) dissertacao.pdf: 3462226 bytes, checksum: 2cb3f716b95b7d4ba28b55bcf90ed3c8 (MD5) / Approved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2018-04-06T14:17:00Z (GMT) No. of bitstreams: 4 dsrtcao.pdf: 3763696 bytes, checksum: e5614aca9d57fde04661fc6da2f7fe8d (MD5) Folha de assinaturas.pdf: 145939 bytes, checksum: b0efa18a3054171cdc8cc52a6a4d715f (MD5) EMAp Ficha catalográfica.pdf: 16727 bytes, checksum: 10446f26497b911613967664f6ca959c (MD5) dissertacao.pdf: 3462226 bytes, checksum: 2cb3f716b95b7d4ba28b55bcf90ed3c8 (MD5) / Approved for entry into archive by Marcia Bacha (marcia.bacha@fgv.br) on 2018-04-12T18:20:43Z (GMT) No. of bitstreams: 4 dsrtcao.pdf: 3763696 bytes, checksum: e5614aca9d57fde04661fc6da2f7fe8d (MD5) Folha de assinaturas.pdf: 145939 bytes, checksum: b0efa18a3054171cdc8cc52a6a4d715f (MD5) EMAp Ficha catalográfica.pdf: 16727 bytes, checksum: 10446f26497b911613967664f6ca959c (MD5) dissertacao.pdf: 3462226 bytes, checksum: 2cb3f716b95b7d4ba28b55bcf90ed3c8 (MD5) / Made available in DSpace on 2018-04-12T18:21:12Z (GMT). No. of bitstreams: 4 dsrtcao.pdf: 3763696 bytes, checksum: e5614aca9d57fde04661fc6da2f7fe8d (MD5) Folha de assinaturas.pdf: 145939 bytes, checksum: b0efa18a3054171cdc8cc52a6a4d715f (MD5) EMAp Ficha catalográfica.pdf: 16727 bytes, checksum: 10446f26497b911613967664f6ca959c (MD5) dissertacao.pdf: 3462226 bytes, checksum: 2cb3f716b95b7d4ba28b55bcf90ed3c8 (MD5) Previous issue date: 2018-03-06 / The Zika virus (ZIKV) is a pathogen of the family Flaviviridae, transmitted in Brazil mainly by the mosquito Aedes aegypti and in less extent by sexual relations. In addition to symptoms common to dengue and chikungunya, the zika virus is also capable of causing irreversible damage to the nervous system, in adults it is related to Guillain-Barr´e syndrome and in fetuses it causes microcephaly. The Health Department of Rio de Janeiro maintains a database with records of patients who sought care and was infeccted with Zika. Our study seeks to estimate the true size of the epidemic that occurred in the year 2016 and the parameters that fit to explain the dissemination process. To make these estimates, we used the data provided by the Health Department and a hierarchical Bayesian model adapted to the SIR epidemiological model. We perform the inference process through modern sampling techniques such as Automatic Differentiation Variational Inference (ADVI), Stein Variational Gradient Descent (SVGD) and No-U-Turn (NUTS). / O Zika virus (ZIKV) é um patógeno da família Flaviviridae transmitido no Brasil principalmente pelo mosquito Aedes aegypti e em menor escala por relações sexuais. Além dos sintomas comuns à dengue e chikungunya, o vírus da zika também é capaz de causar danos irreversíveis no sistema nervoso, em adultos está relacionada à síndrome de Guillain-Barré e em fetos provoca microcefalia. O sistema de saúde do Rio de Janeiro mantém um banco de dados com os registros dos pacientes que buscaram atendimento e apresentaram sintomas de Zika. O nosso estudo busca estimar o verdadeiro tamanho da epidemia que ocorreu no ano de 2016 e os parâmetros que podem ser ajustados para explicar o processo de disseminação. Para realizar essas estimativas, utilizamos os dados fornecidos pelo sistema de saúde e uma modelagem Bayesiana hierárquica adaptada ao modelo epidemiológico SIR. Realizamos o processo de inferência através de modernas técnicas de amostragem, como Automatic Differentiation Variational Inference (ADVI), Stein Variational Gradient Descent (SVGD) e No-U-Turn (NUTS).
36

Estimação bayesiana para medidas de desempenho de testes diagnósticos.

Pinho, Eloísa Moralles do 05 January 2006 (has links)
Made available in DSpace on 2016-06-02T20:05:58Z (GMT). No. of bitstreams: 1 DissEMP.pdf: 2351835 bytes, checksum: 336e30a60b741bebe39a08dc4f379ba0 (MD5) Previous issue date: 2006-01-05 / In the medical area, diagnostic tests are used to classify a patient as positive or negative with respect to a given disease. There are simple and more elaborate tests, each one with a speci9ed rate of misclassi9cation. To verify the accuracy of the medical tests, we could have comparisons with a "gold stantard", here is a test with no error. In many situations we could not have "gold standard", by ethical reasons or by chance that the individual is disease free or by high costs of the test. Joseph et al (1999) introduces a Bayesian approach that solves the lack of a gold standard, by using latent variables. In this work, we introduce this Bayesian methodology giving generalizations in the presence of covariates. A comparative study is made with the presence or not of gold standard to check the accuracy of the medical tests. Some diGerent proportions of patients without gold standard are considered in a simulation study. Numerical examples are considered using the proposed methodology. We conclude the dissertation assuming dependence among two or more tests. / Na área médica testes diagnósticos são usados para classi9car um paciente como positivo ou negativo com relação a uma determinada condição ou moléstia. Existem testes mais simples e outros mais elaborados, cada um fornecendo diferentes chances de erro de classi9cação dos pacientes. Para quanti9car a precisão dos testes diagnósticos, podemos compará-los com testes Padrão Ouro , termo utilizado para testes com satisfatória exatidão, como biopsias, inspeções cirúrgicas e outros. Existem algumas condições que não possuem testes considerados Padrão Ouro, outras até possuem, mas não é ético aplicá-los em indivíduos sem a evidência da moléstia, ou ainda o seu uso pode ser inviável devido a seu alto custo ou por oferecer risco ao paciente. Joseph et al. (1999) [16] propõem a abordagem Bayesiana que supera o problema de pacientes não veri9cados pelo teste Padrão Ouro introduzindo variáveis latentes. Apresentamos também esta metodologia considerando a presença de covariáveis, que fornece subsídios para a tomada de decisão médica. Um estudo comparativo é feito para situações com ausência de Padrão Ouro para todos, alguns ou nenhum paciente, e assim, descrevemos sobre a importância de se considerar uma porcentagem de pacientes veri9cados pelo teste Padrão Ouro para melhores estimativas das medidas de desempenho dos testes diagnósticos. Introduzimos um novo parâmetro que classsi9ca o grupo veri9cado ou não veri9cado pelo teste Padrão Ouro. As metodologias propostas são demonstradas através de exemplos numéricos. Como sugestão de continuidade, demonstramos a metodologia para a veri9cação de dependência condicional entre testes diagnósticos.
37

Uma revisão do fator de Bayes com aplicação à modelos com misturas.

Missão, Érica Cristina Marins 11 March 2004 (has links)
Made available in DSpace on 2016-06-02T20:05:58Z (GMT). No. of bitstreams: 1 DissECMM.pdf: 1660938 bytes, checksum: 066c901ea835b9ef55119d64f6806e4a (MD5) Previous issue date: 2004-03-11 / Universidade Federal de Sao Carlos / O fator de Bayes é uma ferramenta utilizada na seleção de modelos. Neste trabalho fazemos uma revisão abrangente de diversos aspectos do fator de bayes. Também apresentamos as soluções disponíveis atualmente para os problemas relacionados à distribuição a priori imprópria como o fator de Bayes intrínseco e o fator de bayes fracional. São apresentados resultados de simulações com o fator de bayes sendo utilizado na seleção de modelos e uma aplicação a um conjunto de dados reais. Nestas smulações e na aplicação utilizamos o fator de Bayes e o fator de Bayes fracional.
38

Inferência bayesiana para teste disgnóstico.

Saraiva, Karolina Felcar 05 March 2004 (has links)
Made available in DSpace on 2016-06-02T20:06:00Z (GMT). No. of bitstreams: 1 DissKFS.pdf: 1200685 bytes, checksum: e7a2b3be9b5376a60441a1787b892b77 (MD5) Previous issue date: 2004-03-05 / Financiadora de Estudos e Projetos / The simpler screening tests applied to detect disease instead of the more elaborated, usually result in the risk of incorrect diagnostic. However, these tests are only useful when the risks of misclassifications are known and considered acceptably low. So, with the purpose of looking for information on the proprieties of screening tests, as well as measuring their error rates, a Bayesian procedure was formulated using a simulation technique (Gibbs Sampling with latent variables) for estimation of the parameters of interest in the absence of a gold standard. Two applications to real data have been explored. The first one refers to the detection of the infection caused by the strongyloides parasite on 162 refugees from Cambodia that arrived in Montreal, Canada, between July 1982 to February 1983, using data from serologic test and stool examination. The second one has the purpose detecting the obesity rates on males and females school pupils through the information supplied by the anthropometric Must and Cole criteria. / O uso de testes diagnósticos mais simples como substitutos dos mais elaborados para indicar a presença de doença, geralmente resulta em risco de diagnóstico incorreto. Entretanto, estes testes são úteis quando os riscos de erros de classificação são conhecidos e aceitavelmente baixos. Então, com o objetivo de obter informações das propriedades de testes diagnósticos, assim como medir suas taxas de erro, formulou-se um procedimento bayesiano utilizando uma técnica de simulação (Gibbs Sampling com variáveis latentes) para estimação dos parâmetros de interesse na ausência de um padrão ouro. Duas aplicações com dados reais foram exploradas. A primeira refere-se a detecção da infecção causada pelo parasita strongyloides em 162 refugiados do Camboja que chegaram em Montreal, Canadá, entre julho de 1982 a fevereiro de 1983, usando dados do teste sorológico e exame de fezes. A Segunda, tem por objetivo detectar as taxas de obesidade em escolares do sexo masculino e feminino, através das informações fornecidas pelos critérios antropométricos Must e Cole.
39

Considerações sobre a relação entre distribuições de cauda pesada e conflitos de informação em inferencia bayesiana / Considerations on the relation between hevay tailed distributions and conflict of information in bayesian inference

Santos Junior, James Dean Oliveira dos 13 March 2007 (has links)
Orientadores: Veronica Andrea Gonzales-Lopez, Laura Leticia Ramos Rifo / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-08T04:30:52Z (GMT). No. of bitstreams: 1 SantosJunior_JamesDeanOliveirados_M.pdf: 1844173 bytes, checksum: 122644f8bc0dedaaa7d7633d9b25eb9c (MD5) Previous issue date: 2006 / Resumo: Em inferência bayesiana lidamos com informações provenientes dos dados e com informações a priori. Eventualmente, um ou mais outliers podem causar um conflito entre as fontes de informação. Basica!llente, resolver um conflito entre as fontes de informações implica em encontrar um conjunto de restrições tais que uma das fontes domine, em certo sentido, as demais. Têm-se utilizado na literatura distribuições amplamente aceitas como sendo de cauda pesada para este fim. Neste trabalho, mostramos as relações existentes entre alguns resultados da teoria de conflitos e as distribuições de caudas pesadas. Também mostramos como podemos resolver conflitos no caso locação utilizando modelos subexponenciais e como utilizar a medida credence para resolver problemas no caso escala / Abstract: In bayesian inference we deal with information proceeding from the data and prior information. Eventually, one ar more outliers can cause a conflict between the sources information. Basically, to decide a conflict between the sources of information implies in finding a set of restrictions such that one of the sources dominates, in certain sense, the outher. Widely distributions have been used in literature as being of heavy tailed for this end. In this work, we show the relations between some results of the theory of conflicts and the heavy tailed distributions. Also we show how we can decide a conflicts in the location case using subexponential models and how to use the measure credence to decide problems in the scale case / Mestrado / Inferencia Bayesiana / Mestre em Estatística
40

Inferencia Bayesiana para valores extremos / Bayesian inference for extremes

Bernardini, Diego Fernando de, 1986- 15 August 2018 (has links)
Orientador: Laura Leticia Ramos Rifo / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-15T01:44:09Z (GMT). No. of bitstreams: 1 Bernardini_DiegoFernandode_M.pdf: 1483229 bytes, checksum: ea77acd21778728138eea2f27e59235b (MD5) Previous issue date: 2010 / Resumo: Iniciamos o presente trabalho apresentando uma breve introdução a teoria de valores extremos, estudando especialmente o comportamento da variável aleatória que representa o máximo de uma sequência de variáveis aleatórias independentes e identicamente distribuídas. Vemos que o Teorema dos Tipos Extremos (ou Teorema de Fisher-Tippett) constitui uma ferramenta fundamental no que diz respeito ao estudo do comportamento assintóticos destes máximos, permitindo a modelagem de dados que representem uma sequência de observações de máximos de um determinado fenômeno ou processo aleatório, através de uma classe de distribuições conhecida como família de distribuições de Valor Extremo Generalizada (Generalized Extreme Value - GEV). A distribuição Gumbel, associada ao máximo de distribuições como a Normal ou Gama entre outras, é um caso particular desta família. Torna-se interessante, assim, realizar inferência para os parâmetros desta família. Especificamente, a comparação entre os modelos Gumbel e GEV constitui o foco principal deste trabalho. No Capítulo 1 estudamos, no contexto da inferência clássica, o método de estimação por máxima verossimilhança para estes parâmetros e um procedimento de teste de razão de verossimilhanças adequado para testar a hipótese nula que representa o modelo Gumbel contra a hipótese que representa o modelo completo GEV. Prosseguimos, no Capítulo 2, com uma breve revisão em teoria de inferência Bayesiana obtendo inferências para o parâmetro de interesse em termos de sua distribuição a posteriori. Estudamos também a distribuição preditiva para valores futuros. No que diz respeito à comparação de modelos, estudamos inicialmente, neste contexto bayesiano, o fator de Bayes e o fator de Bayes a posteriori. Em seguida estudamos o Full Bayesian Significance Test (FBST), um teste de significância particularmente adequado para testar hipóteses precisas, como a hipótese que caracteriza o modelo Gumbel. Além disso, estudamos outros dois critérios para comparação de modelos, o BIC (Bayesian Information Criterion) e o DIC (Deviance Information Criterion). Estudamos as medidas de evidência especificamente no contexto da comparação entre os modelos Gumbel e GEV, bem como a distribuição preditiva, além dos intervalos de credibilidade e inferência a posteriori para os níveis de retorno associados a tempos de retorno fixos. O Capítulo 1 e parte do Capítulo 2 fornecem os fundamentos teóricos básicos deste trabalho, e estão fortemente baseados em Coles (2001) e O'Hagan (1994). No Capítulo 3 apresentamos o conhecido algoritmo de Metropolis-Hastings para simulação de distribuições de probabilidade e o algoritmo particular utilizado neste trabalho para a obtenção de amostras simuladas da distribuição a posteriori dos parâmetros de interesse. No capítulo seguinte formulamos a modelagem dos dados observados de máximos, apresentando a função de verossimilhança e estabelecendo a distribuição a priori para os parâmetros. Duas aplicações são apresentadas no Capítulo 5. A primeira delas trata das observações dos máximos trimestrais das taxas de desemprego nos Estados Unidos da América, entre o primeiro trimestre de 1994 e o primeiro trimestre de 2009. Na segunda aplicação estudamos os máximos semestrais dos níveis de maré em Newlyn, no sudoeste da Inglaterra, entre 1990 e 2007. Finalmente, uma breve discussão é apresentada no Capítulo 6. / Abstract: We begin this work presenting a brief introduction to the extreme value theory, specifically studying the behavior of the random variable which represents the maximum of a sequence of independent and identically distributed random variables. We see that the Extremal Types Theorem (or Fisher-Tippett Theorem) is a fundamental tool in the study of the asymptotic behavior of those maxima, allowing the modeling of data which represent a sequence of maxima observations of a given phenomenon or random process, through a class of distributions known as Generalized Extreme Value (GEV) family. We are interested in making inference about the parameters of this family. Specifically, the comparison between the Gumbel and GEV models constitute the main focus of this work. In Chapter 1 we study, in the context of classical inference, the method of maximum likelihood estimation for these parameters and likelihood ratio test procedure suitable for testing the null hypothesis associated to the Gumbel model against the hypothesis that represents the complete GEV model. We proceed, in Chapter 2, with a brief review on Bayesian inference theory. We also studied the predictive distribution for future values. With respect to the comparison of models, we initially study the Bayes factor and the posterior Bayes factor, in the Bayesian context. Next we study the Full Bayesian Significance Test (FBST), a significance test particularly suitable to test precise hypotheses, such as the hypothesis characterizing the Gumbel model. Furthermore, we study two other criteria for comparing models, the BIC (Bayesian Information Criterion) and the DIC (Deviance Information Criterion). We study the evidence measures specifically in the context of the comparison between the Gumbel and GEV models, as well as the predictive distribution, beyond the credible intervals and posterior inference to the return levels associated with fixed return periods. Chapter 1 and part of Chapter 2 provide the basic theoretical foundations of this work, and are strongly based on Coles (2001) and O'Hagan (1994). In Chapter 3 we present the well-known Metropolis-Hastings algorithm for simulation of probability distributions, and the particular algorithm used in this work to obtain simulated samples from the posterior distribution for the parameters of interest. In the next chapter we formulate the modeling of the observed data of maximum, presenting the likelihood function and setting the prior distribution for the parameters. Two applications are presented in Chapter 5. The first one deals with observations of the quarterly maximum for unemployment rates in the United States of America, between the first quarter of 1994 and first quarter of 2009. In the second application we studied the semiannual maximum of sea levels at Newlyn, in southwest of England, between 1990 and 2007. Finally, a brief discussion is presented in Chapter 6. / Mestrado / Estatistica / Mestre em Estatística

Page generated in 0.088 seconds