O presente texto discorre sobre o método da mistura de gaussianas aplicado à formação de agrupamentos (clusters) de observações a partir de um conjunto maior de dados. Trata-se de um problema sem solução analítica e, assim, utiliza-se o algoritmo EM (Expectation Maximization) para encontrar soluções por meio de dois procedimentos: inicializações aleatórias e pré-estimativas via métodos hierárquicos de formação de clusters. Conclui-se que a segunda opção é robusta quando se utiliza o método de Ward, enquanto que a primeira também propicia bons resultados, mas que são raros dentre muitas soluções ruins ou pontos de singularidade. Apresenta-se também um exemplo dos métodos estudados com dados reais de empresas brasileiras para ilustrar e complementar o trabalho.
Identifer | oai:union.ndltd.org:IBICT/oai:agregador.ibict.br.BDTD_ITA:oai:ita.br:835 |
Date | 17 July 2009 |
Creators | Ernée Kozyreff Filho |
Contributors | Rodrigo Arnaldo Scarpel |
Publisher | Instituto Tecnológico de Aeronáutica |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações do ITA, instname:Instituto Tecnológico de Aeronáutica, instacron:ITA |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0016 seconds