Return to search

Recherche d'information sémantique et extraction automatique d'ontologie du domaine

Il peut s'avérer ardu, même pour une organisation de petite taille, de se retrouver
parmi des centaines, voir des milliers de documents électroniques. Souvent, les techniques
employées par les moteurs de recherche dans Internet sont utilisées par les entreprises
voulant faciliter la recherche d'information dans leur intranet. Ces techniques
reposent sur des méthodes statistiques et ne permettent pas de traiter la sémantique
contenue dans la requête de l'usager ainsi que dans les documents.
Certaines approches ont été développées pour extraire cette sémantique et ainsi,
mieux répondre à des requêtes faites par les usagers. Par contre, la plupart de ces
techniques ont été conçues pour s'appliquer au Web en entier et non pas sur un domaine
en particulier. Il pourrait être intéressant d'utiliser une ontologie pour représenter un
domaine spécifique et ainsi, être capable de mieux répondre aux questions posées par
un usager. Ce mémoire présente notre approche proposant l'utilisation du logiciel Text-
To-Onto pour créer automatiquement une ontologie décrivant un domaine. Cette même
ontologie est par la suite utilisée par le logiciel Sesei, qui est un filtre sémantique pour
les moteurs de recherche conventionnels. Cette méthode permet ainsi d'améliorer la
pertinence des documents envoyés à l'usager. / It can prove to be diffcult, even for a small size organization, to find information
among hundreds, even thousands of electronic documents. Most often, the methods
employed by search engines on the Internet are used by companies wanting to improve
information retrieval on their intranet. These techniques rest on statistical methods and
do not make it possible neither to evaluate the semantics contained in the user requests,
nor in the documents.
Certain methods were developed to extract this semantics and thus, to improve
the answer given to requests. On the other hand, the majority of these techniques
were conceived to be applied on the entire World Wide Web and not on a particular
field of knowledge, like corporative data. It could be interesting to use domain specific
ontologies in trying to link a specific query to related documents and thus, to be able to
better answer these queries. This thesis presents our approach which proposes the use of
the Text-To-Onto software to automatically create an ontology describing a particular
field. Thereafter, this ontology is used by the Sesei software, which is a semantic filter
for conventional search engines. This method makes it possible to improve the relevance
of documents returned to the user.

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QQLA.2006/23828
Date08 1900
CreatorsMorneau, Maxime
ContributorsMineau, Guy
PublisherUniversité Laval
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageFrench
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formattext/html, application/pdf
Rights© Maxime Morneau, 2006

Page generated in 0.0014 seconds