Orientador: Aluisio de Souza Pinheiro / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação Cientifica / Made available in DSpace on 2018-08-07T20:15:26Z (GMT). No. of bitstreams: 1
Abreu_GabrielCoelhoGoncalvesde_M.pdf: 2309026 bytes, checksum: 4a857ceb54e460ea976576c36730e349 (MD5)
Previous issue date: 2007 / Resumo: A análise de dados de expressão gênica tem sido de grande importância nas mais variadas áreas do desenvolvimento humano, como agricultura, melhoramento animal e medicina. Apesar dos avanços na área de estatística genética, a análise desse tipo de dados pode ser complexa e de difícil execução. Os investimentos já feitos nos últimos anos em pesquisa laboratorial podem levar a resultados concretos (melhoramento genético, vacinas genéticas, patentes) em pouco tempo, sob a correta interpretação dos resultados. Como a análise é feita em milhares de genes, existem problemas de comparações múltiplas, excedendo substancialmente o valor nominal de cada teste. Atualmente, em biologia, o problema de testes múltiplos se tornou uma norma, e não uma excessão. Assim, soluções sugeridas englobam o controle da taxas de erro, como o FDR (False discovery rate). O estudo da distribuição empírica dos p-valores, obtidos através dos testes estatísticos, pode ser realizado sob um modelo de mistura finita de distribuições beta. Sugere-se a utilização da distribuição beta generalizada com três parâmetros, mais flexível que a beta padrão. Faz-se um estudo da estimação paramétrica e semi-paramétrica no modelo proposto. São feitos estudos de simulação e aplicação a dados reais / Abstract: The analysis of gene expression data has been of great importance in many fields of human knowledge, as agriculture, animal breeding, and medicine. Despite the continuous progress of statsitical genetics, the analysis of such data can be complex and of difficult evaluation. The investments done in the last years in laboratorial research can lead to important results in short time under the correct interpretation of data. As the analysis are done under a huge amount of data, multiple comparison problems are present, resulting in a redction of the nominal confidence of each test. Nowadays, in biologi and related fields, multiple testing problems has become a reality. Thus, among possible solutions is the control of error rates, such the FDR (False discovery rate). The estimation of the p-values distribution, obtained through statistical tests, can be evaluated by a finite mixture model of beta distributions. The use of generalized beta distribution with three parameters, a more frexible distribution, is sugested. The parametric and semi-parametric
estimations are studied over the proposed model. Simulations and a application to real data are considered. / Mestrado / Mestre em Estatística
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/307471 |
Date | 17 January 2007 |
Creators | Abreu, Gabriel Coelho Gonçalves de |
Contributors | UNIVERSIDADE ESTADUAL DE CAMPINAS, Pinheiro, Aluísio de Souza, 1967-, Silva, Gisela Tunes da, Garcia, Jesus Enrique |
Publisher | [s.n.], Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica, Programa de Pós-Graduação em Estatística |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | 157p. : il., application/pdf |
Source | reponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0022 seconds