Return to search

Estimação parametrica e semi-parametrica em misturas uniforme-beta generalizada : uma aplicação em dados de microarranjos / Parametric and semi-parametric estimation in uniform-generalized beta mixtures : application in microarray data

Orientador: Aluisio de Souza Pinheiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-07T20:15:26Z (GMT). No. of bitstreams: 1
Abreu_GabrielCoelhoGoncalvesde_M.pdf: 2309026 bytes, checksum: 4a857ceb54e460ea976576c36730e349 (MD5)
Previous issue date: 2007 / Resumo: A análise de dados de expressão gênica tem sido de grande importância nas mais variadas áreas do desenvolvimento humano, como agricultura, melhoramento animal e medicina. Apesar dos avanços na área de estatística genética, a análise desse tipo de dados pode ser complexa e de difícil execução. Os investimentos já feitos nos últimos anos em pesquisa laboratorial podem levar a resultados concretos (melhoramento genético, vacinas genéticas, patentes) em pouco tempo, sob a correta interpretação dos resultados. Como a análise é feita em milhares de genes, existem problemas de comparações múltiplas, excedendo substancialmente o valor nominal de cada teste. Atualmente, em biologia, o problema de testes múltiplos se tornou uma norma, e não uma excessão. Assim, soluções sugeridas englobam o controle da taxas de erro, como o FDR (False discovery rate). O estudo da distribuição empírica dos p-valores, obtidos através dos testes estatísticos, pode ser realizado sob um modelo de mistura finita de distribuições beta. Sugere-se a utilização da distribuição beta generalizada com três parâmetros, mais flexível que a beta padrão. Faz-se um estudo da estimação paramétrica e semi-paramétrica no modelo proposto. São feitos estudos de simulação e aplicação a dados reais / Abstract: The analysis of gene expression data has been of great importance in many fields of human knowledge, as agriculture, animal breeding, and medicine. Despite the continuous progress of statsitical genetics, the analysis of such data can be complex and of difficult evaluation. The investments done in the last years in laboratorial research can lead to important results in short time under the correct interpretation of data. As the analysis are done under a huge amount of data, multiple comparison problems are present, resulting in a redction of the nominal confidence of each test. Nowadays, in biologi and related fields, multiple testing problems has become a reality. Thus, among possible solutions is the control of error rates, such the FDR (False discovery rate). The estimation of the p-values distribution, obtained through statistical tests, can be evaluated by a finite mixture model of beta distributions. The use of generalized beta distribution with three parameters, a more frexible distribution, is sugested. The parametric and semi-parametric
estimations are studied over the proposed model. Simulations and a application to real data are considered. / Mestrado / Mestre em Estatística

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/307471
Date17 January 2007
CreatorsAbreu, Gabriel Coelho Gonçalves de
ContributorsUNIVERSIDADE ESTADUAL DE CAMPINAS, Pinheiro, Aluísio de Souza, 1967-, Silva, Gisela Tunes da, Garcia, Jesus Enrique
Publisher[s.n.], Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica, Programa de Pós-Graduação em Estatística
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format157p. : il., application/pdf
Sourcereponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0022 seconds