Global ETD Search

1	Plate-forme pour l'indexation spatiale multi-niveaux d'un corpus territorialisé Lesbegueries, Julien 26 November 2007 (has links) (PDF) Notre travail s'insère dans la problématique de l'accès à l'information spatiale présente dans des corpus textuels territoriaux. Nous proposons d'aller au-delà des systèmes de recherche d'information classiques basés sur l'analyse statistique des documents, peu adaptés pour ce cas particulier, via un traitement linguistique ciblé interprétant l'information spatiale. Notre hypothèse est que des traitements relativement peu coûteux suffisent à dégager l'essentiel de l'information. Ils sont un bon point de départ pour une interprétation plus poussée par la suite, utilisant les propriétés géographiques de l'information extraite afin de développer un système d'indexation à plusieurs niveaux d'abstraction.<br />Nous proposons en effet une méthode de recherche d'information spatiale multi-niveaux indexant un corpus textuel brut. Cette méthode qui extrait l'information d'un corpus et l'interprète, permet d'améliorer l'efficacité de systèmes de recherche d'information à chaque fois que l'interrogation comporte une connotation spatiale. L'interprétation permet en outre de retrouver le contexte dans lequel l'information spatiale a été utilisée. En particulier, elle permet d'indexer des unités de texte en leur associant des contextes de type itinéraire, description locale ou comparaison de lieux. [INFO:INFO_OH] Computer Science/Other raisonnement spatial qualitatif système d'information géographique
2	Méthodes de sélection de collections dans un environnement de recherche d'informations distribuée Abbaci, Faïza 20 June 2003 (has links) (PDF) Le thème de cette thèse concerne le domaine de la recherche d'information distribuée (RID). Un système de RID (SRID) de recherche d'information distribuée gère la recherche sur un ensemble de collections de documents distribuées soit sur un réseau local, soit sur un ensemble plus étendu. Un SRID se compose, en général, d'un courtier et d'un ensemble de serveurs. Chaque serveur détient une collection de documents et un système de recherche d'information qui assure la recherche dans cette collection. Le courtier représente la composante avec laquelle l'utilisateur communique. A la réception d'une requête, le courtier choisit un sous-ensemble de serveurs parmi ceux qu'il connaît, auxquels il achemine la requête. Cette opération est appelée sélection de serveurs. Nous proposons dans cette thèse trois méthodes de sélection de serveurs. Ces méthodes ne nécessitent aucune coopération des serveurs interrogés, et aucune mise à jour de données au niveau du courtier. recherche d'information distribuée collections de documents système de recherche d'information requête sélection de serveurs courtier
3	Un modèle logique général pour les systèmes de recherche d'informations : application au prototype RIME Nie, Jianyun 13 July 1990 (has links) (PDF) La définition d'un modèle d'évaluation est le problème clé d'un système de recherche d'informations. De nombreux modelés existent, qui sont généralement spécifiques a un type d'application particulier et avec lesquels la prise en compte de la sémantique est difficile. Dans la première partie de cette thèse, nous dégageons d'abord deux critères pour la valuation de la correspondance entre un document et une requête: l'exhaustivité et la spécificité du document pour la requête. Nous définissons ensuite un modèle général fonde sur la logique modale floue pour la valuation des deux critères. Ce modèle est compare avec quelques modèles existants pour démontrer sa généralité. Dans la seconde partie de la thèse, le modèle propose est applique au processus d'interrogation du prototype rime pour la recherche d'informations médicales. Ce prototype possède une interface en langue quasi naturelle (un sous-ensemble du français). Un processus d'interrogation se décompose en deux parties: l'interprétation des requêtes en langue quasi naturelle et l'évaluation des requêtes en utilisant le modèle général précédemment défini. Ces deux parties sont étudiées en détail. Une réalisation est finalement présentée, ainsi que son expérimentation sur un corpus médical système de recherche d'information modélisation logique logique modale informatique médicale représentation sémantique interrogation en langue naturelle intelligence artificielle base de données déductives
4	Indexation de textes médicaux par extraction de concepts, et ses utilisations Pouliquen, Bruno 07 June 2002 (has links) (PDF) Nous nous intéressons à l'accès à l'information médicale. Nous avons utilisé un lexique de flexions, dérivations et synonymes de mots spécifiquement créé pour le domaine médical, issu de la base de connaissances "Aide au Diagnostic Médical". Nous avons exploité les mots composés et les associations de mots de ce lexique pour optimiser l'indexation d'une phrase en mots de référence. Nous avons créé un outil d'indexation permettant de reconnaître un concept d'un thésaurus médical dans une phrase en langage naturel. Nous avons ainsi pu indexer des documents médicaux par un ensemble de concepts, ensuite nous avons démontré l'utilité d'une telle indexation en développant un système de recherche d'information et divers outils: extraction de mots-clés, similarité de documents et synthèse automatique de documents. Cette indexation diminue considérablement la complexité de la représentation des connaissances contenues dans les documents en langage naturel. Les résultats des évaluations montrent que cette indexation conserve néanmoins la majeure partie de l'information sémantique. Indexation Médecine Système de recherche d'information Lexique Thésaurus Web
5	La gestion de la recherche collaborative d'information dans le cadre du processus d'intelligence économique Odumuyiwa, Victor 13 December 2010 (has links) (PDF) La maîtrise de l'information interne et externe de l'organisation est déterminante pour la réussite du processus d'intelligence économique (IE) visant à la résolution d'un problème décisionnel. La collecte et le traitement de l'information parmi les acteurs impliqués dans le processus d'IE nécessitent un processus de collaboration. Cette thèse porte sur la gestion du processus de collaboration dans la recherche d'information (RI) afin de faciliter la résolution d'un problème décisionnel. Nous avons développé deux modèles et un système de recherche collaborative d'information (RCI) pour faciliter la gestion des activités collectives ainsi que la collaboration synchrone et explicite entre des collaborateurs lors de la RI. Le première modèle est la pyramide de collaboration composé de six phases nécessaires pour la réussite d'une RCI. Ces phases sont: (1) la phase de confiance de départ, (2) la phase de compréhension partagée du problème à résoudre, (3) la phase de communication, (4) la phase de partage de connaissances, (5) la phase de conscience de groupe et (6) la phase de répartition des tâches. Le deuxième modèle est un modèle de communication pour la RCI. Ce modèle que nous nommons COCIR (Communication model for Collaborative Information Retrieval) est une modélisation du contexte collaboratif pour le partage de connaissances lors de la RI. Les attributs de ce modèle permettent de contextualiser chaque échange dans la collaboration afin de gérer les différents types de connaissances exprimées et ceci pour faciliter le partage de connaissances entre les collaborateurs. Ces deux modèles ont été implémentés dans le système MECOCIR que nous avons développé pour valider nos propositions. [SHS] Humanities and Social Sciences [INFO] Computer Science Recherche collaborative d'information intelligence économique pyramide de collaboration partage de connaissance conscience de groupe collaboration synchrone modèle de communication répartition des tâches système de recherche d'information COCIR MECOCIR
6	Appariement de contenus textuels dans le domaine de la presse en ligne : développement et adaptation d'un système de recherche d'information / Pairing textual content in the field of on-line news : development and adaptation of an information retrieval system Désoyer, Adèle 27 November 2017 (has links) L'objectif de cette thèse, menée dans un cadre industriel, est d'apparier des contenus textuels médiatiques. Plus précisément, il s'agit d'apparier à des articles de presse en ligne des vidéos pertinentes, pour lesquelles nous disposons d'une description textuelle. Notre problématique relève donc exclusivement de l'analyse de matériaux textuels, et ne fait intervenir aucune analyse d'image ni de langue orale. Surviennent alors des questions relatives à la façon de comparer des objets textuels, ainsi qu'aux critères mobilisés pour estimer leur degré de similarité. L'un de ces éléments est selon nous la similarité thématique de leurs contenus, autrement dit le fait que deux documents doivent relater le même sujet pour former une paire pertinente. Ces problématiques relèvent du domaine de la recherche d'information (ri), dans lequel nous nous ancrons principalement. Par ailleurs, lorsque l'on traite des contenus d'actualité, la dimension temporelle est aussi primordiale et les problématiques qui l'entourent relèvent de travaux ayant trait au domaine du topic detection and tracking (tdt) dans lequel nous nous inscrivons également.Le système d'appariement développé dans cette thèse distingue donc différentes étapes qui se complètent. Dans un premier temps, l'indexation des contenus fait appel à des méthodes de traitement automatique des langues (tal) pour dépasser la représentation classique des textes en sac de mots. Ensuite, deux scores sont calculés pour rendre compte du degré de similarité entre deux contenus : l'un relatif à leur similarité thématique, basé sur un modèle vectoriel de ri; l'autre à leur proximité temporelle, basé sur une fonction empirique. Finalement, un modèle de classification appris à partir de paires de documents, décrites par ces deux scores et annotées manuellement, permet d'ordonnancer les résultats.L'évaluation des performances du système a elle aussi fait l'objet de questionnements dans ces travaux de thèse. Les contraintes imposées par les données traitées et le besoin particulier de l'entreprise partenaire nous ont en effet contraints à adopter une alternative au protocole classique d'évaluation en ri, le paradigme de Cranfield. / The goal of this thesis, conducted within an industrial framework, is to pair textual media content. Specifically, the aim is to pair on-line news articles to relevant videos for which we have a textual description. The main issue is then a matter of textual analysis, no image or spoken language analysis was undertaken in the present study. The question that arises is how to compare these particular objects, the texts, and also what criteria to use in order to estimate their degree of similarity. We consider that one of these criteria is the topic similarity of their content, in other words, the fact that two documents have to deal with the same topic to form a relevant pair. This problem fall within the field of information retrieval (ir) which is the main strategy called upon in this research. Furthermore, when dealing with news content, the time dimension is of prime importance. To address this aspect, the field of topic detection and tracking (tdt) will also be explored.The pairing system developed in this thesis distinguishes different steps which complement one another. In the first step, the system uses natural language processing (nlp) methods to index both articles and videos, in order to overcome the traditionnal bag-of-words representation of texts. In the second step, two scores are calculated for an article-video pair: the first one reflects their topical similarity and is based on a vector space model; the second one expresses their proximity in time, based on an empirical function. At the end of the algorithm, a classification model learned from manually annotated document pairs is used to rank the results.Evaluation of the system's performances raised some further questions in this doctoral research. The constraints imposed both by the data and the specific need of the partner company led us to adapt the evaluation protocol traditionnal used in ir, namely the cranfield paradigm. We therefore propose an alternative solution for evaluating the system that takes all our constraints into account. Système de recherche d'information Recommandation basée sur le contenu Apprentissage supervisé Cadre d'évaluation Contexte industriel Information retrieval system Topic detection and tracking Content-Based recommendation Supervised learning Evaluation framework Industrial context

1

Page generated in 0.1707 seconds