1 |
Apprentissage actif pour la classification des occupations du sol sur larges étendues à partir d'images multispectrales à haute résolution spatiale : application en milieu cultivé, Lebna (Cap-Bon Tunisie) / Active learning for Mapping land cover on wide area, from high spatial resolution satellite images : application in cultivated areas, Lebna (Cap-Bon Tunisie)Ben Slimene Ben Amor, Ines 23 November 2017 (has links)
Les activités anthropiques dans le bassin méditerranéen sont en forte évolution. Dans les zones agricoles, cette croissance entraîne des évolutions considérables de l'occupation du sol. Cette activité agricole exerce un impact majeur sur le fonctionnement hydrologique des paysages qui n'est identifiable qu'à une échelle bien plus large, sur plusieurs dizaines de km². Cette thèse se concentre sur la classification de l'occupation du sol sur une large étendue à partir d'une image monodate à haute résolution spatiale (SPOT6/7).Dans ce contexte, les données d'apprentissage sont collectées par des enquêtes terrain, par conséquent, elles sont très limitées. Les méthodes d'apprentissage supervisées sont généralement utilisées, en supposant que la distribution des classes est stable sur toute l'image. Cependant, en pratique, on constate une distorsion des distributions des classes (apparition de nouvelles classes, disparition de classes). Ce problème, intitulé "datashift", se produit souvent sur des larges étendues. Ainsi le modèle construit sur les données d'apprentissage initiales s'avère sous optimal pour la classification de l'image entière. Pour atténuer ce problème, les techniques d'apprentissage actif définissent un ensemble d'apprentissage efficace, en l'adaptant itérativement par l'ajout des données non labellisées les plus informatives. Ces techniques permettent d'améliorer le modèle de classification tout en conservant un petit ensemble d'apprentissage initial. L'échantillonnage se base généralement sur deux métriques : l'incertitude et la diversité.Dans cette thèse, nous montrons l'apport des techniques d'apprentissage actif pour la cartographie de l'occupation du sol en milieu agricole, en proposant un échantillonnage adapté par parcelle.L'apport des méthodes d'apprentissage actif est validé par rapport à une sélection aléatoire des parcelles. Une métrique de diversité basée sur l'algorithme Meanshift a été proposée.Dans un deuxième temps, nous avons traité le sous-problème du "datashift" qui est l'apparition de nouvelles classes. Nous avons proposé de nouvelles métriques de diversité basées sur l'algorithme Meanshift et les Fuzzy k-means ainsi qu'une nouvelle stratégie de sélection des données adaptées à la détection de nouvelles classes.Dans la dernière partie, nous nous sommes intéressés aux contraintes spatiales induites par les observations sur terrain et nous avons proposé une stratégie de labellisation par points de vue qui permet de diminuer largement les coûts humains d'observations terrain tout en gardant de bonnes précisions de classification ainsi que la découverte des nouvelles classes.Les méthodes proposées ont été testées et validées avec une image multispectrale SPOT6 à 6m de résolution sur le bassin versant de Lebna, Cap-Bon, Tunisie. / Anthropogenic activities in the Mediterranean are in strong evolution. In agricultural areas, this growth leads to considerable changes in land cover. This agricultural activity has a major impact on the hydrological functioning of the landscapes which can be only identified on a wide scale, over several tens of km². This thesis focuses on the land cover classification on wide area from a high spatial resolution monodate image (SPOT6/7).In this context, the learning data are collected by field surveys, therefore they are very limited. Supervised learning methods are generally used, assuming that the class distribution is stable over all the image. However, in practice, there is a class distributions distortion (new classes appear, classes disappear). This problem, called "datashift", always occurs over wide areas. Thus, the model constructed on the initial learning data is sub-optimal for the classification of the entire image. To lessen this problem, active learning techniques define an effective learning set, by iteratively adapting it by adding the most informative unlabeled data. These techniques improve the classification model while retaining a small initial learning set. Sampling is generally based on two metrics: uncertainty and diversity.In this thesis, we show the contribution of active learning techniques for the land cover mapping in agricultural environment, proposing a suitable sampling per parcel.The active learning methods contribution is validated respectively to a random selection of parcels. A diversity metric based on the Meanshift algorithm has been proposed.Secondly, we treated the sub-problem of the "datashift" which is the appearance of new classes. We proposed new metrics of diversity based on the Meanshift algorithm and Fuzzy k-means as well as a new data selection strategy adapted to the detection of new classes.Finally we were interested in the spatial constraints induced by the field observations and we proposed a strategy of labeling by stand points which make it possible to greatly reduce the human costs for field observations while maintaining good classification precisions as well as the discovery of new classes.The proposed methodologies were tested and validated on a multispectral SPOT6 image with 6m resolution on the Lebna watershed, Cap-Bon, Tunisia.
|
Page generated in 0.074 seconds