L'essor d'Internet et du Web a favorisé la mise en ligne de nombreuses informations disponibles, potentiellement utiles pour la veille technologique et scientifique d'une entreprise. Différentes techniques de recherche d¤information sur le Web ont été proposées afin de construire des outils permettant d'affiner la recherche pour obtenir des résultats pertinents. Cependant, dans le contexte du Web actuel, malgré de grandes avancées dans le champ de la recherche d'information, ces outils ont montré leurs limites en termes de précision et de rappel. L'application des technologies du Web Sémantique, en particulier des ontologies, semble donc intéressante pour améliorer les performances de la tâche de veille technologique et scientifique sur le Web. Les travaux de cette thèse se sont déroulés dans le cadre d'une coopération entre le Centre Scientifique et Technique du Bâtiment (CSTB) et l'équipe ACACIA de l'INRIA Sophia Antipolis. L'objectif principal est d'exploiter les technologies du Web Sémantique pour développer un système de veille (OntoWatch), guidé par des ontologies, pour collecter, capturer, filtrer, classer et structurer le contenu du Web en provenance de plusieurs sources d¤information dans un scénario d'aide à la veille technologique et scientifique. Dans une première partie, nous modélisons le processus de veille technologique et scientifique du CSTB reposant sur le modèle général de veille proposé par Lesca. Puis nous identifions les apports potentiels de l¤ontologie dans les différentes étapes et nous construisons une ontologie dédiée au système de veille. Cette ontologie intègre une partie d'une ontologie existante et des vocabulaires offerts dans des thésaurus du domaine du CSTB. Ensuite, nous proposons des algorithmes utilisant une ontologie pour améliorer la recherche des documents sur le Web, puis générer automatiquement les annotations sémantiques (représentées dans le langage RDF) sur ces documents. Ces annotations alimentent dans le système les bases d'annotations, sur lesquelles repose la recherche sémantique d'informations. <br />Enfin, nous proposons une architecture multi-agents pour l'implémentation du système OntoWatch. Nous nous focalisons en particulier sur la conception des sous-sociétés d'agents dédiées à la recherche et à l'annotation automatique des documents sur le Web.
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00311767 |
Date | 29 November 2006 |
Creators | Cao, Tuan Dung |
Publisher | Université de Nice Sophia-Antipolis |
Source Sets | CCSD theses-EN-ligne, France |
Language | French |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0021 seconds