Sont présentées la définition, l'implantation et l'expérimentation de méthodes d'accèes par le contenu à une base de documents textuels, dans le cadre d'un serveur d'information bureautique. L'intégration de ces opérations comprend d'une part l'intégration des documents au modèle de données du serveur, d'autre part l'intégration au niveau fonctionnel des opérations spécifiques aux documents par l'introduction des opérateurs correspondants dans le langage de manipulation de données. Est considérée la coexistence de deux modèles de contenu des documents: le contenu textuel, forme par les chaines de caractères qui forment les portions de contenu de leur structure logique, et le contenu sémantique, qui est le résultat d'une analyse du contenu. Ont ainsi ete définies deux opérations de recherche, la recherche textuelle et la recherche sémantique, effectuées sur ces deux modèles de contenu. Les méthodes d'accès et de stockage correspondantes utilisent des méthodes de signature pour l'établissement des index textuel et sémantique. Ces méthodes permettent de tres bonnes performances, facilite de mise a jour et évaluation de requête. Ont été expérimentées une approche logicielle et une approche matérielle (avec le filtre Schuss) pour la réalisation de ces opérations. Une grande partie de ce travail a été intégrée dans le serveur ois, développe dans le cadre du projet esprit 231, Doeois
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00333333 |
Date | 05 July 1989 |
Creators | Jimenez Guarin, Claudia Lucia |
Source Sets | CCSD theses-EN-ligne, France |
Language | French |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0025 seconds