Return to search

Modélisation et prototypage d'un système de recherche d'informations basé sur la proximité des occurences des termes de la requête dans les documents

La croissance des données numériques accentue le verrou scientifique de la RI consistant à trouver un compromis entre exhaustivité et précision des résultats. Le modèle proposé, la proximité floue (PF), allie expressivité des requêtes booléennes et utilisation de la proximité, et vise une approche à haute précision. Chaque mot-clé possède une zone d'influence utile à l'évaluation des requêtes. Les opérations floues associées aux opérateurs booléens classiques permettent de propager la proximité jusqu'à la racine. La PF a été largement validée sur les collections de test classiques et pour les éditions 2005 et 2006 des campagnes d'évaluations internationales de RI (Trec, Clef et Inex 2006). Les résultats sur des requêtes construites automatiquement sont équivalents à ceux des méthodes de référence Okapi/Lucy, vectoriel/MG. Par contre, avec l'utilisation de requêtes manuelles adaptées à la PF, les résultats sont très largement supérieurs aux modèles classiques.

Identiferoai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00785143
Date13 November 2006
CreatorsMercier, Annabelle
PublisherEcole Nationale Supérieure des Mines de Saint-Etienne
Source SetsCCSD theses-EN-ligne, France
LanguageFrench
Detected LanguageFrench
TypePhD thesis

Page generated in 0.0025 seconds