• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 490
  • 18
  • 5
  • 3
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 523
  • 330
  • 267
  • 224
  • 120
  • 97
  • 86
  • 79
  • 74
  • 71
  • 69
  • 64
  • 60
  • 56
  • 50
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
81

Regressão binária nas abordagens clássica e Bayesiana / Binary regression in the classical and Bayesian approaches

Amélia Milene Correia Fernandes 16 December 2016 (has links)
Este trabalho tem como objetivo estudar o modelo de regressão binária nas abordagens clássica e bayesiana utilizando as funções de ligações probito, logito, complemento log-log, transformação box-cox e probito-assimétrico. Na abordagem clássica apresentamos as suposições e o procedimento para ajustar o modelo de regressão e verificamos a precisão dos parâmetros estimados, construindo intervalos de confiança e testes de hipóteses. Enquanto que, na inferência bayesiana fizemos um estudo comparativo utilizando duas metodologias. Na primeira metodologia consideramos densidades a priori não informativas e utilizamos o algoritmo Metropolis-Hastings para ajustar o modelo. Na segunda metodologia utilizamos variáveis auxiliares para obter a distribuição a posteriori conhecida, facilitando a implementação do algoritmo do Amostrador de Gibbs. No entanto, a introdução destas variáveis auxiliares podem gerar valores correlacionados, o que leva à necessidade de se utilizar o agrupamento das quantidades desconhecidas em blocos para reduzir a autocorrelação. Através do estudo de simulação mostramos que na inferência clássica podemos usar os critérios AIC e BIC para escolher o melhor modelo e avaliamos se o percentual de cobertura do intervalo de confiança assintótica está de acordo com o esperado na teoria assintótica. Na inferência bayesiana constatamos que o uso de variáveis auxiliares resulta em um algoritmo mais eficiente segundo os critérios: erro quadrático médio (EQM), erro percentual absoluto médio (MAPE) e erro percentual absoluto médio simétrico (SMAPE). Como ilustração apresentamos duas aplicações com dados reais. Na primeira, consideramos um conjunto de dados da variação do Ibovespa e a variação do valor diário do fechamento da cotação do dólar no período de 2013 a 2016. Na segunda aplicação, trabalhamos com um conjunto de dados educacionais (INEP-2013), focando nos estudos das variáveis que influenciam a aprovação do aluno. / The objective of this work is to study the binary regression model under the frequentist and Bayesian approaches using the probit, logit, log-log complement, Box-Cox transformation and skewprobit as link functions. In the classical approach we presented assumpti- ons and procedures used in the regression modeling. We verified the accuracy of the estimated parameters by building confidence intervals and conducting hypothesis tests. In the Bayesian approach we made a comparative study using two methodologies. For the first methodology, we considered non-informative prior distributions and the Metropolis-Hastings algorithm to estimate the model. In the second methodology we used auxiliary variables to obtain the known a posteriori distribution, allowing the use of the Gibbs Sampler algorithm. However, the introduction of these auxiliary variables can generate correlated values and needs the use of clustering of unknown quantities in blocks to reduce the autocorrelation. In the simulation study we used the AIC and BIC information criteria to select the most appropriate model and we evaluated whether the coverage probabilities of the confidence interval is in agre- ement with that expected by the asymptotic theory. In Bayesian approach we found that the inclusion of auxiliary variables in the model results in a more efficient algoritm according to the MSE, MAPE and SMAPE criteria. In this work we also present applications to two real datasets. The first dataset used is the variation of the Ibovespa and variation of the daily value of the American dollar at the time of closing the 2013 to 2016. The second dataset, used is an educational data set (INEP-2013), where we are interested in studying the factors that influence the approval of the student.
82

Modelos para proporções com superdispersão e excesso de zeros - um procedimento Bayesiano. / Models for zero-inflated and overdispersed proportion data - a bayesian approach.

Adriano Ferreti Borgatto 24 June 2004 (has links)
Neste trabalho, trˆes modelos foram ajustados a um conjunto de dados obtido de um ensaio de controle biol´ogico para Diatraea saccharalis, uma praga comum em planta¸c˜oes de cana-de-a¸c´ucar. Usando a distribui¸c˜ao binomial como modelo de probabilidade, um ajuste adequado n˜ao pode ser obtido, devido `a superdispers˜ao gerada pela variabililidade dos dados e pelo excesso de zeros. Nesse caso, o modelo binomial inflacionado de zeros (ZIB) superdisperso ´e mais flex´ývel e eficiente para a modelagem desse tipo de dados. Entretanto, quando o interesse maior est´a sobre os valores positivos das propor¸c˜oes, pode-se utilizar o modelo binomial truncado superdisperso. Uma abordagem alternativa eficiente que foi utilizada para a modelagem desse tipo de dados foi a Bayesiana, sendo o ajuste do modelo realizado usando as t´ecnicas de simula¸c˜ao Monte Carlo em Cadeias de Markov, atrav´es do algoritmo Metropolis-Hastings e a sele¸c˜ao dos modelos foi feita usando o DIC (Deviance Information Criterion) e o fator de Bayes. Os modelos foram implementados no procedimento IML (Iteractive Matrix Linear) do programa SAS (Statistical Analysis System) e no programa WinBUGS e a convergˆencia das estimativas foi verificada atrav´es da an´alise gr´afica dos valores gerados e usando os diagn´osticos de Raftery & Lewis e de Heidelberger & Welch, implementado no m´odulo CODA do programa R. / In general the standard binomial regression models do not fit well to proportion data from biological control assays, manly when there is excess of zeros and overdispersion. In this work a zero-inflated binomial model is applied to a data set obtained from a biological control assay for Diatraea saccharalis, a commom pest in sugar cane. A parasite (Trichogramma galloi) was put to parasitize 128 eggs of the Anagasta kuehniella, an economically suitable alternative host (Parra, 1997), with a variable number of female parasites (2, 4, 8,..., 128), each with 10 replicates in a completely randomized experiment. When interest is only in the positive proportion data, a model can be based on the truncated binomial distribution. A Bayesian procedure was formulated using a simulation technique (Metropolis Hastings) for estimation of the posterior parameters of interest. The convergence of the Markov Chain generated was monitored by visualization of the trace plot and using Raftery & Lewis and Heidelberg & Welch diagnostics presented in the module CODA of the software R.
83

Modelos de duração aplicados à sobrevivência das empresas paulistas entre 2003 e 2007 / Duration models applied to survival enterprises of São Paulo state between 2003 to 2007

Pavão, André Luis 22 May 2013 (has links)
Este trabalho apresenta as principais causas para a mortalidade das empresas paulistas criadas entre 2003 e 2007 a partir de base de dados cedida pelo SEBRAE-SP para o desenvolvimento dessa pesquisa. A amostra final, construída a partir de dados disponibilizados pela primeira vez para estudos desta natureza, contou com 662 empresas e 33 variáveis coletadas por meio de questionário aplicado diretamente às próprias empresas. A análise consistiu no teste de modelos econométricos, baseados na literatura dos modelos de duração, de forma a traduzir quais fatores são mais críticos para a sobrevivência das empresas a ponto de distingui-las em dois grupos: o das empresas vencedoras, cuja longevidade está pautada em ações que promovem ganhos de produtividade e eficiência, e aquelas desprovidas dessas ações e que muito provavelmente deixarão o mercado. Os três tipos de modelos abordados neste trabalho - não paramétrico, semi-paramétrico (riscos proporcionais) e paramétrico - apresentaram resultados similares, sendo que na abordagem de riscos proporcionais os resultados foram segmentados por tamanho e setor de atuação das empresas. Para as micro empresas, a idade do empreendedor e a iniciativa em investir na qualificação da mão de obra dos funcionários mostraram-se importantes mitigadores do risco de falha desse grupo de empresa, enquanto que para as pequenas empresas, a inovação em processos e a elaboração de um plano de negócios se destacaram dentre o conjunto de variáveis. Entre empresas dos setores de comércio e serviços, as empresas do primeiro grupo que faziam o acompanhamento das finanças (fluxo de caixa) apresentaram menor risco de falhar. Para aquelas do setor de serviços, a idade do empreendedor, o investimento em qualificação dos funcionários e o tamanho da empresa ao nascer foram importantes para reduzir o risco de falha no tempo. Outro resultado encontrado, por meio do modelo paramétrico utilizando distribuição Weibull, foi que o risco de a empresa deixar o mercado mostrou-se crescente, pelo menos nos cinco primeiros anos de existência da empresa. Entretanto, esse resultado não deve ser generalizado para períodos de tempo maiores que cinco anos. / This thesis presents the main results that determined the bankruptcy of enterprises located in the São Paulo State from 2003 to 2007. The models used in this work were possible due to the partnership with SEBRAE, Small Business Service Supporting, located in the State of São Paulo. This institution provided the data basis for this research and its final version was compound by 662 enterprises and 33 variables, which were collected from a survey done by SEBRAE and the related enterprise. For first time available for research like this The research was supported by econometrics models, more precisely duration models, which identified the most important factors regarding enterprises survival. Two enterprise groups were distinguished: that one that will survive and grow and another will fail. In this work, three models were used: parametric, non-parametric and proportional risk with all of them presenting similar results. The proportional risk approach was applied for economic sectors and enterprises size. For the micro size business, the entrepreneurship\'s age and the resources applied on the employee\'s qualification were important to reduce the risk to fail in the time, whereas for small enterprises, variables like innovation and business plan building were the most important variables. For the commerce and service sectors, the enterprises related to the first one, the enterprises which kept attention on financial results (cash flow) presented lower risk to fail. For service sector, variables such as: entrepreneur\'s age, investment on the employee\'s qualification and enterprise\'s size were the most important variables to explain the difference the risk to fail between the enterprises. Another result presented was the risk to fail, which indicates the likelihood of an enterprise to leave its business activity. In this case, the parametric model using Weibull distribution concluded that the risk grows in the first five years. However, this result must be carefully evaluated since it would be necessary a longer term data to ensure this result.
84

Abordagem Bayesiana na análise genética de populações utilizando dados de marcadores moleculares. / Bayesian approach to the genetic analysis of populations using molecular markers data.

Coelho, Alexandre Siqueira Guedes 27 August 2002 (has links)
Dentre os diversos aspectos geralmente observados na caracterização genética de populações naturais, a avaliação do grau de estruturação da variabilidade genética entre e dentro dos indivíduos e a obtenção de estimativas de parâmetros genéticos indicadores do sistema reprodutivo da espécie assumem grande importância. Os parâmetros de maior interesse neste caso são o índice de fixação intrapopulacional (f) e a taxa de fecundação cruzada (t). Pelo uso de simulações computacionais, este trabalho demonstra o caráter dinâmico do índice de fixação intrapopulacional em diferentes locos ao longo das gerações em decorrência do caráter finito da população e de variação nas taxas médias de fecundação cruzada entre gerações. Sugere-se que este caráter dinâmico representa uma explicação para a elevada variação, comumente reportada na literatura, das estimativas de f obtidas com locos diferentes avaliados em uma mesma população. Utilizando a abordagem Bayesiana, um modelo hierárquico de análise é proposto para a estimação de f, incorporando as informações obtidas de múltiplos locos não ligados, levando-se em conta a condicionalidade do processo de estimação ao polimorfismo dos locos utilizados. O modelo proposto incorpora o caráter dinâmico de f para diferentes locos e permite a estimação do número efetivo de indivíduos reprodutivamente ativos em uma população. Propõe-se ainda um modelo Bayesiano para a estimação da taxa de fecundação cruzada com base na informação de múltiplos locos, admitindo-se a possibilidade de ocorrência de apomixia. Os modelos propostos são avaliados por simulação e exemplos de aplicação a dados reais de marcadores moleculares codominantes são discutidos. Os resultados obtidos demonstram a aplicabilidade das metodologias propostas e o elevado potencial de aplicação da estatística Bayesiana em estudos de genética de populações. / Among the various aspects generally considered in the genetic characterization of natural populations of plant species, the evaluation of the degree of genetic structure within and among individuals and the estimation of parameters related to the species mating system are of great importance. In general, considerable effort is focused on the estimation of the intrapopulation fixation index (f) and the outcrossing rate (t). Using computer simulated data, the dynamic nature of f for different loci along generations is illustrated. The dynamic nature of f is shown to result from the finite condition of populations and from the variation in the mean values of the outcrossing rates among generations. It is suggested that this dynamic behavior explains the inconsistency, commonly reported in the literature, of f estimates obtained for different loci in a given population. Using a Bayesian approach, we propose a hierarchical model for the estimation of f, incorporating information obtained from different unlinked loci and considering the conditionality of the estimation process to genetic polymorphism. The proposed model incorporates the dynamic nature of f values for different loci and allows the estimation of the effective number of reproductively active individuals in a given population. Using a similar approach, a Bayesian model is also proposed for estimating the outcrossing rate using multiple loci information and incorporating the possibility of apomixis. The models proposed are evaluated by computer simulations and examples using real data from codominant molecular markers are presented. Results obtained illustrate the applicability of the proposed methods and reveal the great potential of use of Bayesian statistics in population genetic studies.
85

Meta-análise de parâmetros genéticos de características de crescimento em bovinos de corte sob enfoques clássico e Bayesiano. / Meta-analysis of genetic parameters of growth traits on beef cattle under classic and bayesian approach.

Giannotti, Juliana Di Giorgio 03 September 2004 (has links)
O crescente volume de publicações científicas gerado pelo desenvolvimento das pesquisas e as conclusões, algumas vezes destoantes, obtidas em diferentes trabalhos versando sobre um mesmo tema, são as duas principais motivações de pesquisadores em compilar informações publicadas. Em vista disso, procedimentos estatísticos, dentre os quais destaca-se a meta-análise, vêm sendo desenvolvidos para obtenção de uma resposta única e confiável para um conjunto de resultados publicados.No melhoramento genético animal há um grande número de trabalhos contendo estimativas de herdabilidade de características de crescimento em bovinos de corte. Através de pesquisa bibliográfica foram encontrados, em 186 artigos publicados, 869 estimativas de herdabilidade de efeito direto, 186 estimativas de herdabilidade de efeito materno e 123 estimativas do coeficiente de correlação genética entre os efeitos direto e materno, das características de crescimento peso ao nascimento, peso a desmama, peso aos 365 dias e peso aos 550 dias em bovinos de corte de origem indiana. De posse deste conjunto de dados, foram realizadas meta-análises, dentro de cada uma das quatro características de crescimento, cujo objetivo principal foi obter uma resposta combinada, para estes parâmetros genéticos, sob enfoques clássico e bayesiano. No enfoque clássico conduziram-se as meta-análises utilizando modelos fixo e aleatório, em que dois estimadores, o de máxima verossimilhança restrita e o proposto por DerSimonian & Laird, foram empregados para estimar a variância entre os estudos. Também foi realizada meta-análise de acordo com a técnica de agrupamento de Ward. Sob o enfoque bayesiano, as meta-análises foram conduzidas utilizando-se um modelo hierárquico e, a variância entre os estudos, foi obtida via simulação através do modelo proposto. As estimativas combinadas de herdabilidade de efeito direto variaram de 0,18 a 0,33, nos diferentes grupos formados a partir da análise de agrupamento, sendo sempre menores àquelas obtidas para peso à desmama e sempre maiores àquelas obtidas para peso aos 550 dias. As estimativas combinadas de herdabilidade de efeito materno foram 0,09 para peso ao nascimento, 0,13 para peso à desmama, 0,12 para peso aos 365 dias e 0,05 para peso aos 550 dias. As estimativas combinadas para correlação entre os efeitos diretos e maternos foram de -0,16 para peso ao nascimento, à desmama e aos 550 dias e -0,20 para peso aos 365 dias. Os três métodos utilizados para estimar a variância entre os estudos, o da máxima verossimilhança restrita, o proposto por DerSimonian & Laird e o Bayesiano, conduziram a valores distintos para esta variância, sendo sempre maiores os valores obtidos através do método Bayesiano e sempre menores os obtidos por DerSimonian & Laird. Porém, os valores das estimativas combinadas para herdabilidades de efeito direto, obtidas através destes três estimadores, muito próximos, para as quatro características. Devido ao fato de comparar e combinar resultados de estudos distintos, permitindo inferir sobre um conjunto de resultados publicados, recomenda-se a meta-análise, como procedimento estatístico, para obtenção de valores combinados das estimativas de herdabilidade de efeito direto, materno e suas correlações, nas características de crescimento em bovinos de corte. / The increasing volume of research publications as a consequence of scientific development and eventually with divergent conclusions obtained in different studies about the same subject are the two main motivations for compiling the information of these works. Statistical procedures, particularly the meta-analysis, were developed in order to obtain a unique and realistic answer from a set of published results. In the field of animal breeding there is a large amount of research work on heritability estimates for growth traits in beef cattle. A total of 186 articles was found in literature, reporting 869 direct heritability estimates, 186 maternal heritability estimates and 123 direct-maternal genetic correlation for birth weight, weaning weight, weight at 365 and at 550 days of age in zebu beef cattle. Based on this data set, meta-analysis, under Classic and Bayesian approaches, were performed in order to obtain a pooled estimate of those genetic parameters for each trait. Regarding the Classic approach, the meta-analysis were performed using a random effect model, where two estimators, the Restricted Maximum Likelihood and the one proposed by DerSimonian & Laird were used to evaluate the variance between studies. Also, it was performed a meta-analysis using the method of cluster analysis of Ward to group the estimates. Under the Bayesian approach, the meta-analysis was performed using a hierarchical model and the variances between the studies, were obtained by simulation using the proposed model. The pooled estimates for direct heritabilities ranged from 0.18 to 0.33 for the different groups composed by the cluster analysis. The lower values were obtained for weaning weight and higher values were obtained for weight at 550 days of age. The pooled estimates for maternal heritabilities were 0.09 for birth weight, 0.13 for weaning weight, 0.12 for weight at 365 days of age and 0.05 for weight at 550 days of age. The pooled estimates for direct-maternal genetic correlations were -0.16 for birth weight, weaning weight and weight at 550 days of age and -0.20 for weight at 365 days of age. The three methods, Restricted Maximum likelihood, the estimator proposed by DerSimonian & Laird and the Bayesian, used to estimate the variance between studies lead to different values, the greater ones obtained by Bayesian method and the lower by DerSimonian & Laird. In general, pooled estimates values for direct heritabilities, obtained by those three estimators, were very close. Meta-analysis is recommended as a statistical procedure to compare and combine results from different studies in order to obtain pooled values of direct and maternal heritabilities and direct-maternal genetic correlations of growth traits of beef cattle.
86

Testes de hipóteses em eleições majoritárias / Test of hypothesis in majoritarian election

Fossaluza, Victor 16 June 2008 (has links)
O problema de Inferência sobre uma proporção, amplamente divulgado na literatura estatística, ocupa papel central no desenvolvimento das várias teorias de Inferência Estatística e, invariavelmente, é objeto de investigação e discussão em estudos comparativos entre as diferentes escolas de Inferência. Ademais, a estimação de proporções, bem como teste de hipóteses para proporções, é de grande importância para as diversas áreas do conhecimento, constituindo um método quantitativo simples e universal. Nesse trabalho, é feito um estudo comparativo entre as abordagens clássica e bayesiana do problema de testar as hipóteses de ocorrência ou não de 2º turno em um cenário típico de eleição majoritária (maioria absoluta) em dois turnos no Brasil. / The problem of inference about a proportion, widely explored in the statistical literature, plays a key role in the development of several theories of statistical inference and, invariably, is the object of investigation and discussion in comparative studies among different schools of inference. In addition, the estimation of proportions, as well as test of hypothesis for proportions, is very important in many areas of knowledge as it constitutes a simple and universal quantitative method. In this work a comparative study between the Classical and Bayesian approaches to the problem of testing the hypothesis of occurrence of second round (or not) in a typical scenario of a majoritarian election (absolute majority) in two rounds in Brazil is developed.
87

Abordagem clássica e bayesiana para os modelos de séries temporais da família GARMA com aplicações para dados de contagem / Classical and bayesian approach for time series models of the family GARMA with applications to count data

Philippsen, Adriana Strieder 31 March 2011 (has links)
Nesta dissertação estudou-se o modelo GARMA para modelar séries temporais de dados de contagem com as distribuições condicionais de Poisson, binomial e binomial negativa. A principal finalidade foi analisar no contexto clássico e bayesiano, o desempenho e a qualidade do ajuste dos modelos de interesse, bem como o desempenho dos percentis de cobertura dos intervalos de confiança dos parâmetros para os modelos adotados. Para atingir tal finalidade considerou-se a análise dos estimadores pontuais bayesianos e foram analisados intervalos de credibilidade. Neste estudo é proposta uma distribuição a priori conjugada para os parâmetros dos modelos e busca-se a distribuição a posteriori, a qual associada a certas funções de perda permite encontrar estimativas bayesianas para os parâmetros. Na abordagem clássica foram calculados estimadores de máxima verossimilhança, usandose o método de score de Fisher e verificou-se por meio de simulação a consistência dos mesmos. Com os estudos desenvolvidos pode-se observar que, tanto a inferência clássica quanto a inferência bayesiana para os parâmetros dos modelos em questão, apresentou boas propriedades analisadas por meio das propriedades dos estimadores pontuais. A última etapa do trabalho consiste na análise de um conjunto de dados reais, sendo uma série real correspondente ao número de internações por causa da dengue em Campina Grande. Estes resultados mostram que tanto o estudo clássico, quanto o bayesiano, são capazes de descrever bem o comportamento da série / In this work, it was studied the GARMA model to model time series count data with Poisson, binomial and negative binomial discrete conditional distributions. The main goal is to analyze, in the bayesian and classic context, the performance and the quality of fit of the corresponding models, as well as the coverage percentages performance to these models. To achieve this purpose we considered the analysis of Bayesian estimators and credible intervals were analyzed. To the Bayesian study it was proposed a priori distribution joined to the models parameters and sought a posteriori distribution, which one associate with to certain loss functions allows finding out Bayesian estimates to the parameters. In the classical approach, it was calculated the maximum likelihood estimators using the method of Fisher scoring, whose interest was to verify, by simulation, the consistence. With the studies developed we can notice that, both classical and inference Bayesian inference for the parameters of those models, presented good properties analysed through the properties of the punctual estimators. The last stage of the work consisted of the analysis of one real data set, being a real serie corresponding to the admission number because of dengue in the city of Campina Grande. These results show that both the classic and the Bayesian studies are able to describe well the behavior of the serie
88

Uma abordagem clássica e bayesiana para o modelo de Tweedie

Ferreira, Flávia 27 April 2005 (has links)
Made available in DSpace on 2016-06-02T20:06:00Z (GMT). No. of bitstreams: 1 1881.pdf: 594610 bytes, checksum: 8b0562a44cac5580dfefabb8ace34908 (MD5) Previous issue date: 2005-04-27 / Universidade Federal de Sao Carlos / The goal of this work is to present a classic and a bayesian approach to the Tweedie Compound Poisson model considering the form and application shown at Jorgensen & Souza (1992). A speci.c goal is to estimate the individual claim mean values. Newton- Raphson iterative method is used in the classic inference in order to obtain the estimatives for the parameters. Non-informative priors are used to obtain the bayesian estimatives for the parameters. In the bayesian approach two di¤erent methodologies are considered: i) without the presence of covariance and ii) with the presence of covariance. The per- formance of both methods, classic and bayesian inference, are compared via simulated data. / Nesse trabalho apresentamos uma abordagem clássica e Bayesiana para o modelo de Tweedie Poisson Composto na forma e aplicação apresentada por Jorgensen & Souza (1992). O objetivo especí.co é a estimação do custo médio individual de sinistro. Na obtenção dos estimadores clássicos é utilizado o método iterativo de Newton-Raphson. Na obtenção de estimadores Bayesianos são utilizadas densidades a priori não informa- tivas para os parâmetros de interesse. Sob o enfoque Bayesiano duas metodologias são estudadas: i) sem a presença de covariáveis ii) com a presença de covariáveis. Uma com- paração dos desempenhos dos estimadores clássicos e Bayesianos é veri.cada através de dados simulados.
89

Métodos estatísticos aplicados à análise da expressão gênica.

Saraiva, Erlandson Ferreira 23 February 2006 (has links)
Made available in DSpace on 2016-06-02T20:06:11Z (GMT). No. of bitstreams: 1 DissEFS.pdf: 1135537 bytes, checksum: b92ac0d09924bd51723ad77018da04de (MD5) Previous issue date: 2006-02-23 / Financiadora de Estudos e Projetos / The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression. / A tecnologia dos arranjos de DNA (DNA-array) é uma ferramenta utilizada para identificar e comparar níveis de expressão de um grande número de genes ou fragmentos de genes simultaneamente, em condições diferentes. Com esta comparação, é possível determinar possíveis genes causadores de doenças de origem genética (por exemplo, o câncer). Nestes experimentos, grandes quantidades de dados numéricos (relacionados às medidas de níveis de expressão dos genes) são gerados e métodos estatísticos são im- portantes para análise dos dados, com objetivo de identificar os genes que apresentam evidências para níveis de expressão diferentes. O objetivo de nossa pesquisa é comparar o desempenho e desenvolver métodos estatísticos, capazes de identificar genes que apresentam evidências para níveis de expressão diferentes, quando comparamos situações de interesse (tratamentos) com uma situação de controle. Para isto, descrevemos o teste t, proposto por Baldi e Long (2001) e propomos três métodos para identificar genes com evidências para níveis de expressão diferentes. O primeiro método proposto é baseado na utilização da inferência bayesiana paramétrica e dos métodos de seleção de modelos, fator de Bayes e DIC; o segundo método é baseado na inferência bayesiana semi-paramétrica conhecida como modelo de misturas de processos Dirichlet; e o terceiro método é baseado na utilização de um modelo com mistura infinita de distribuições, que aplicado à análise da expressão gênica determina grupos de níveis de expressão gênica similares, baseados nos efeitos de tratamento.
90

Meta-análise de parâmetros genéticos de características de crescimento em bovinos de corte sob enfoques clássico e Bayesiano. / Meta-analysis of genetic parameters of growth traits on beef cattle under classic and bayesian approach.

Juliana Di Giorgio Giannotti 03 September 2004 (has links)
O crescente volume de publicações científicas gerado pelo desenvolvimento das pesquisas e as conclusões, algumas vezes destoantes, obtidas em diferentes trabalhos versando sobre um mesmo tema, são as duas principais motivações de pesquisadores em compilar informações publicadas. Em vista disso, procedimentos estatísticos, dentre os quais destaca-se a meta-análise, vêm sendo desenvolvidos para obtenção de uma resposta única e confiável para um conjunto de resultados publicados.No melhoramento genético animal há um grande número de trabalhos contendo estimativas de herdabilidade de características de crescimento em bovinos de corte. Através de pesquisa bibliográfica foram encontrados, em 186 artigos publicados, 869 estimativas de herdabilidade de efeito direto, 186 estimativas de herdabilidade de efeito materno e 123 estimativas do coeficiente de correlação genética entre os efeitos direto e materno, das características de crescimento peso ao nascimento, peso a desmama, peso aos 365 dias e peso aos 550 dias em bovinos de corte de origem indiana. De posse deste conjunto de dados, foram realizadas meta-análises, dentro de cada uma das quatro características de crescimento, cujo objetivo principal foi obter uma resposta combinada, para estes parâmetros genéticos, sob enfoques clássico e bayesiano. No enfoque clássico conduziram-se as meta-análises utilizando modelos fixo e aleatório, em que dois estimadores, o de máxima verossimilhança restrita e o proposto por DerSimonian & Laird, foram empregados para estimar a variância entre os estudos. Também foi realizada meta-análise de acordo com a técnica de agrupamento de Ward. Sob o enfoque bayesiano, as meta-análises foram conduzidas utilizando-se um modelo hierárquico e, a variância entre os estudos, foi obtida via simulação através do modelo proposto. As estimativas combinadas de herdabilidade de efeito direto variaram de 0,18 a 0,33, nos diferentes grupos formados a partir da análise de agrupamento, sendo sempre menores àquelas obtidas para peso à desmama e sempre maiores àquelas obtidas para peso aos 550 dias. As estimativas combinadas de herdabilidade de efeito materno foram 0,09 para peso ao nascimento, 0,13 para peso à desmama, 0,12 para peso aos 365 dias e 0,05 para peso aos 550 dias. As estimativas combinadas para correlação entre os efeitos diretos e maternos foram de –0,16 para peso ao nascimento, à desmama e aos 550 dias e -0,20 para peso aos 365 dias. Os três métodos utilizados para estimar a variância entre os estudos, o da máxima verossimilhança restrita, o proposto por DerSimonian & Laird e o Bayesiano, conduziram a valores distintos para esta variância, sendo sempre maiores os valores obtidos através do método Bayesiano e sempre menores os obtidos por DerSimonian & Laird. Porém, os valores das estimativas combinadas para herdabilidades de efeito direto, obtidas através destes três estimadores, muito próximos, para as quatro características. Devido ao fato de comparar e combinar resultados de estudos distintos, permitindo inferir sobre um conjunto de resultados publicados, recomenda-se a meta-análise, como procedimento estatístico, para obtenção de valores combinados das estimativas de herdabilidade de efeito direto, materno e suas correlações, nas características de crescimento em bovinos de corte. / The increasing volume of research publications as a consequence of scientific development and eventually with divergent conclusions obtained in different studies about the same subject are the two main motivations for compiling the information of these works. Statistical procedures, particularly the meta-analysis, were developed in order to obtain a unique and realistic answer from a set of published results. In the field of animal breeding there is a large amount of research work on heritability estimates for growth traits in beef cattle. A total of 186 articles was found in literature, reporting 869 direct heritability estimates, 186 maternal heritability estimates and 123 direct-maternal genetic correlation for birth weight, weaning weight, weight at 365 and at 550 days of age in zebu beef cattle. Based on this data set, meta-analysis, under Classic and Bayesian approaches, were performed in order to obtain a pooled estimate of those genetic parameters for each trait. Regarding the Classic approach, the meta-analysis were performed using a random effect model, where two estimators, the Restricted Maximum Likelihood and the one proposed by DerSimonian & Laird were used to evaluate the variance between studies. Also, it was performed a meta-analysis using the method of cluster analysis of Ward to group the estimates. Under the Bayesian approach, the meta-analysis was performed using a hierarchical model and the variances between the studies, were obtained by simulation using the proposed model. The pooled estimates for direct heritabilities ranged from 0.18 to 0.33 for the different groups composed by the cluster analysis. The lower values were obtained for weaning weight and higher values were obtained for weight at 550 days of age. The pooled estimates for maternal heritabilities were 0.09 for birth weight, 0.13 for weaning weight, 0.12 for weight at 365 days of age and 0.05 for weight at 550 days of age. The pooled estimates for direct-maternal genetic correlations were -0.16 for birth weight, weaning weight and weight at 550 days of age and -0.20 for weight at 365 days of age. The three methods, Restricted Maximum likelihood, the estimator proposed by DerSimonian & Laird and the Bayesian, used to estimate the variance between studies lead to different values, the greater ones obtained by Bayesian method and the lower by DerSimonian & Laird. In general, pooled estimates values for direct heritabilities, obtained by those three estimators, were very close. Meta-analysis is recommended as a statistical procedure to compare and combine results from different studies in order to obtain pooled values of direct and maternal heritabilities and direct-maternal genetic correlations of growth traits of beef cattle.

Page generated in 0.0541 seconds