Global ETD Search

Return to search

Méthodologie d'évaluation de la cohérence inter-représentations pour l'intégration de bases de données spatiales. Une approche combinant l'utilisation de métadonnées et l'apprentissage automatique.

A l'heure actuelle, la plupart des bases de données spatiales sont gérées de manière indépendante. Cette indépendance pose différents problèmes : elle multiplie les efforts de maintenance et de mise à jour, elle rend difficile la mise en œuvre d'analyses multi-niveaux et ne garantit pas une cohérence entre les sources. Une gestion conjointe de ces sources nécessite leur intégration qui permet de définir des liens explicites entre les bases et d'en fournir une vision unifiée. Notre thèse s'inscrit dans ce cadre. Le sujet que nous traitons porte en particulier sur la mise en correspondance des données et l'évaluation de la cohérence inter-représentations. Nous cherchons à analyser automatiquement chaque différence de représentation entre les données appariées afin d'en déduire si celle-ci résulte des critères de saisie différents des bases ou d'erreurs de saisie. Cette évaluation vise à garantir une intégration cohérente des données. Pour étudier la conformité des représentations nous proposons d'exploiter les spécifications des bases. Ces documents décrivent les règles de sélection et de modélisation des objets. Ils constituent des métadonnées de référence pour juger si les représentations sont équivalentes ou incohérentes. L'utilisation de ces documents est toutefois insuffisante. Les spécifications décrites en langue naturelle peuvent être imprécises ou incomplètes. Dans ce contexte, les données des bases constituent une seconde source de connaissances intéressante. L'analyse des correspondances à l'aide de techniques d'apprentissage automatique permet d'induire des règles rendant possible la justification de la conformité des représentations. La méthodologie que nous proposons repose sur ces éléments. Elle se compose de deux méthodes : MECO et MACO. La première est la Méthode d'Evaluation de la COhérence. Elle comprend plusieurs étapes : l'enrichissement des données, le contrôle intra-base, l'appariement, le contrôle inter-bases et l'évaluation finale. Chacune de ces étapes exploite des connaissances déduites des spécifications ou induites des données par apprentissage automatique, en appliquant MACO (Méthode d'Acquisition de connaissances pour l'évaluation de la COhérence). L'intérêt d'utiliser l'apprentissage est double. Outre le fait qu'il permet d'acquérir des règles pour l'évaluation, il met en évidence l'écart toléré sur les données par rapport aux spécifications papiers. Notre approche a été mise en œuvre sur des bases de données de l'IGN présentant différents niveaux de détail.

[INFO:INFO_OH] Computer Science/Other

acquisition de connaissances

apprentissage automatique

métadonnées

Identifer	oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00085693
Date	20 May 2005
Creators	Sheeren, David
Publisher	Université Pierre et Marie Curie - Paris VI
Source Sets	CCSD theses-EN-ligne, France
Language	French
Detected Language	French
Type	PhD thesis

Page generated in 0.0019 seconds

Méthodologie d'évaluation de la cohérence inter-représentations pour l'intégration de bases de données spatiales. Une approche combinant l'utilisation de métadonnées et l'apprentissage automatique.

Description

Links & Downloads

Tags

Additional Fields