Global ETD Search

Return to search

Techniques d'identification d'entités nommées et de classification non-supervisée pour des requêtes de recherche web à l'aide d'informations contenues dans les pages web visitées

Le web est maintenant devenu une importante source d’information et de divertissement pour un grand nombre de personnes et les techniques pour accéder au contenu désiré ne cessent d’évoluer. Par exemple, en plus de la liste de pages web habituelle, certains moteurs de recherche présentent maintenant directement, lorsque possible, l’information recherchée par l’usager. Dans ce contexte, l’étude des requêtes soumises à ce type de moteur de recherche devient un outil pouvant aider à perfectionner ce genre de système et ainsi améliorer l’expérience d’utilisation de ses usagers. Dans cette optique, le présent document présentera certaines techniques qui ont été développées pour faire l’étude des requêtes de recherche web soumises à un moteur de recherche. En particulier, le travail présenté ici s’intéresse à deux problèmes distincts. Le premier porte sur la classification non-supervisée d’un ensemble de requêtes de recherche web dans le but de parvenir à regrouper ensemble les requêtes traitant d’un même sujet. Le deuxième problème porte quant à lui sur la détection non-supervisée des entités nommées contenues dans un ensemble de requêtes qui ont été soumises à un moteur de recherche. Les deux techniques proposées utilisent l’information supplémentaire apportée par la connaissance des pages web qui ont été visitées par les utilisateurs ayant émis les requêtes étudiées.

http://hdl.handle.net/11143/5387

Classification non-supervisée

Requête de recherche web

Détection d’entités nommées

Topic modeling

Fouille du web

Identifer	oai:union.ndltd.org:usherbrooke.ca/oai:savoirs.usherbrooke.ca:11143/5387
Date	January 2014
Creators	Goulet, Sylvain
Contributors	Wang, Shengrui, Hébert, Matthieu
Publisher	Université de Sherbrooke
Source Sets	Université de Sherbrooke
Language	French
Detected Language	French
Type	Mémoire
Rights	© Sylvain Goulet

Page generated in 0.0019 seconds

Techniques d'identification d'entités nommées et de classification non-supervisée pour des requêtes de recherche web à l'aide d'informations contenues dans les pages web visitées

Description

Links & Downloads

Tags

Additional Fields