Dans ce mémoire, nous traitons du sujet de la recherche d’information dynamique en milieu complexe. Celle-ci a pour but d’inclure l’utilisateur dans la boucle. Ainsi, l’utilisateur a la possibilité d’interagir avec le système en surlignant les passages pertinents et en indiquant le degré d’importance selon ses intérêts. Dans le domaine de la recherche d’information, les milieux complexes peuvent être définis comme des corpus de textes au sein desquels il est difficile de trouver une information à partir d’une requête générale. Par exemple, si l’utilisateur effectuait une recherche sur les impacts du virus Ebola durant la crise en Afrique en 2014-2015, il pourrait être intéressé par différents aspects liés à ce virus (économiques, de santé publique, etc.). Notre objectif est de modéliser ces différents aspects et de diversifier les documents présentés, afin de couvrir le maximum de ses intérêts. Dans ce mémoire, nous explorons différentes méthodes de diversification des résultats. Nous réalisons une étude de l’impact des entités nommées et des mots-clés contenus dans les passages issus du retour de l’utilisateur afin de créer une nouvelle requête qui affine la recherche initiale de l’utilisateur en trouvant les mots les plus pertinents par rapport à ce qu’il aura surligné. Comme l’interaction se base uniquement sur la connaissance acquise durant la recherche et celle-ci étant courte, puisque l’utilisateur ne souhaite pas une longue phase d’annotation, nous avons choisi de modéliser le corpus en amont, via les « word embeddings » ou plongements lexicaux, ce qui permet de contextualiser les mots et d’étendre les recherches à des mots similaires à notre requête initiale. Une approche de recherche dynamique doit, en outre, être capable de trouver un point d’arrêt. Ce point d’arrêt doit amener un équilibre entre trop peu et trop plein d’information, afin de trouver un bon compromis entre pertinence et couverture des intérêts.
Identifer | oai:union.ndltd.org:LAVAL/oai:corpus.ulaval.ca:20.500.11794/29523 |
Date | 30 April 2018 |
Creators | Joganah, Robin |
Contributors | Lamontagne, Luc, Khoury, Richard |
Source Sets | Université Laval |
Language | French |
Detected Language | French |
Type | mémoire de maîtrise, COAR1_1::Texte::Thèse::Mémoire de maîtrise |
Format | 1 ressource en ligne (x, 98 pages), application/pdf |
Rights | http://purl.org/coar/access_right/c_abf2 |
Page generated in 0.002 seconds