Cette thèse propose un cadre général pour développer des modèles orientés précision en recherche d'information (RI). Ce cadre s'appuie sur la notion de supports de vocabulaires pour modéliser l'expressivité des représentations utilisées en RI. Peu de cadres de modélisation sont disponibles dans ce domaine. Nous proposons un tel cadre axé sur la modélisation de l'expressivité et qui permet de choisir ou de comparer des modèles sur ce critère.<br />Dans ce cadre nous nous orientons vers l'utilisation de représentations expressives du texte. Nous proposons deux modèles utilisant des représentations d'expressivité forte à base de graphes. Si ces deux modèles se ressemblent au niveau de l'expressivité, ils s'opposent sur leur modèle sous-jacent. Nous implémentons l'un des modèles par un modèle dérivé des graphes conceptuels et l'autre par un modèle original dérivé des modèles de langue de RI.<br />Pour l'application de ces modèles sur du texte, nous proposons un processus en deux étapes basé sur des traitements de la langue qui favorise la couverture du document. La première étape, dépendante du domaine d'application, produit une représentation intermédiaire des documents où chaque phrase est représentée par un graphe. La deuxième étape crée les représentations finales des documents à partir de la représentation intermédiaire. Nous appliquons finalement nos modèles sur le domaine médical à l'aide du méta-thésaurus UMLS et en proposant plusieurs méthodes pour construire la représentation intermédiaire.<br />L'efficacité de nos modèles est prouvée par des expérimentations sur la campagne d'évaluation CLEF médicale qui permet de tester nos modèles dans un cadre réel.
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00285412 |
Date | 06 May 2008 |
Creators | Maisonnasse, Loïc |
Source Sets | CCSD theses-EN-ligne, France |
Language | French |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0015 seconds