Return to search

Outliers detection in mixtures of dissymmetric distributions for data sets with spatial constraints / Détection de valeurs aberrantes dans des mélanges de distributions dissymétriques pour des ensembles de données avec contraintes spatiales

In the case of soil chemical analyses, frequency distributions for some elements show a dissymmetrical aspect, with a very marked spread to the right or to the left. A high frequency of extreme values is also observed and a possible mixture of several distributions, due to the presence of various soil types within a single geographical unit, is encountered. Then, for the outliers detection and the establishment of detection limits, an original outliers detection procedure has been developed; it allows estimating extreme quantiles above and under which observations are considered as outliers. The estimation of these detection limits is based on the right and the left of the distribution tails. A first estimation is realised for each elementary geographical unit to determine an appropriate truncation level. Then, a spatial classification allows creating adjoining homogeneous groups of geographical units to estimate robust limit values based on an optimal number of observations. / Dans le cas des analyses chimiques de sols, les distributions de fréquences des résultats présentent, pour certains éléments étudiés, un caractère très dissymétrique avec un étalement très marqué à droite ou à gauche. Une fréquence importante de valeurs extrêmes est également observée et un mélange éventuel de plusieurs distributions au sein dune même entité géographique, lié à la présence de divers types de sols, peut être rencontré. Dès lors, pour la détection des valeurs aberrantes et la fixation des limites de détection, une méthode originale, permettant destimer des quantiles extrêmes au-dessus et en dessous desquelles les observations sont considérées comme aberrantes, a été élaborée. Lestimation des limites de détection est établie de manière distincte à partir des queues des distributions droite et gauche. Une première estimation par entité géographique élémentaire est réalisée afin de déterminer un niveau de troncature adéquat. Une classification spatiale permet ensuite de créer des groupes dentités homogènes contiguës, de manière à estimer des valeurs limites robustes basées sur un nombre dobservations optimal.

Identiferoai:union.ndltd.org:BICfB/oai:ETDFUSAGx:FUSAGxetd-09242007-111409
Date29 May 2007
CreatorsPlanchon, Viviane
ContributorsCharles, Catherine, Claustriaux, Jean-Jacques, Oger, Robert, Théwis, André, Dautrebande, Sylvia, Bock, Laurent, Lejeune, Philippe, Palm, Rodolphe, Toussaint, André, Gouet, (Arvalis, France)
PublisherUniversite de Gembloux
Source SetsBibliothèque interuniversitaire de la Communauté française de Belgique
LanguageFrench
Detected LanguageFrench
Typetext
Formatapplication/pdf
Sourcehttp://bictel-fusagx.ulg.ac.be/ETD-db/collection/available/FUSAGxetd-09242007-111409/
Rightsunrestricted, Je certifie avoir complété et signé le contrat BICTEL/e remis par le gestionnaire facultaire.

Page generated in 0.0024 seconds