Return to search

Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo

Este trabajo de investigación aborda el problema de falta de robustez, mediante el reemplazo de la matriz de covarianzas obtenida con el método clásico, por la matriz de covarianzas obtenida con el método robusto MCD (Todorov y Filzmoser, 2009). El método robusto MCD: Minimun Covariance Determinant, consiste en realizar las estimaciones para el vector de medias y la matriz de covarianzas a partir de la selección de una submuestra obtenida del remuestreo del conjunto de datos en estudio, cuya característica principal es que tiene la matriz de covarianzas con determinante mínimo.
Muchas veces, el análisis estadístico en presencia de datos atípicos, mediante métodos clásicos, puede llevar a conclusiones erróneas debido a la sensibilidad de dichos métodos, por ello el objetivo del presente trabajo es presentar la metodología de los estimadores MCD, a fin de conseguir una “matriz de covarianzas robustificada” la cual será utilizada para realizar el Análisis de Componentes Principales en conjuntos de datos con presencia de observaciones atípicas.
Se ilustra la metodología de la teoría y la aplicación para dos conjuntos de datos, resultados de investigaciones en la Botánica (Quinteros, 2010 y Gómez, et. al., 2008), se analiza el comportamiento de las Componentes Principales con la metodología MCD y se compara con la metodología clásica. Se determina que las Componentes Principales obtenidas por el método de MCD permiten encontrar mejores indicadores para los conjuntos de datos que tienen valores atípicos.

-- Palabras clave: Minimum Covariance Determinant, MCD, Componentes Principales, Estimación Robusta, Matriz de Varianzas y Covarianzas. / --- This research addresses the problem of lack of robustness, by replacing the covariance matrix obtained with the classical method for the covariance matrix obtained with the robust MCD method (Todorov and Filzmoser, 2009). The robust method MCD: Minimun Covariance Determinant, involves making estimates for the mean vector and covariance matrix from the selection of a subsample obtained from the resampling of the data set under study, whose main characteristic is that it has the covariance matrix with the minimum determinant.
Many times, the statistical analysis in the presence of outliers, by standard methods, can be misleading because of the sensitivity of these methods, which is why the objective of this paper is to present the methodology of the MCD estimators in order to achieve the "robustified covariance matrix" which will be used to perform Principal Component Analysis on data sets with the presence of outliers.
We illustrate the methodology of the theory and application, for two sets of data, research results in the Botany (Quinteros, 2010 and Gomez, et. Al., 2008), we analyze the behavior of the Principal Components with the MCD method and we compare it to the classic methodology. It is determined that the principal components obtained by the MCD method allows to find better indicators for data sets with outliers.

-- Keywords: Minimum Covariance Determinant, MCD, Principal Components, Robust Estimation, Scatter Matrix. / Tesis

Identiferoai:union.ndltd.org:Cybertesis/oai:cybertesis.unmsm.edu.pe:cybertesis/3136
Date January 2012
CreatorsHualpa Benavente, Flor Patricia
ContributorsGómez Ticerán, Doris Albina
PublisherUniversidad Nacional Mayor de San Marcos
Source SetsUniversidad Nacional Mayor de San Marcos - SISBIB PERU
LanguageSpanish
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/bachelorThesis
Formatapplication/pdf
SourceUniversidad Nacional Mayor de San Marcos, Repositorio de Tesis - UNMSM
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0027 seconds