Global ETD Search

11	Recherche de réponses précises à des questions médicales : le système de questions-réponses MEANS / Finding precise answers to medical questions : the question-answering system MEANS Ben Abacha, Asma 28 June 2012 (has links) La recherche de réponses précises à des questions formulées en langue naturelle renouvelle le champ de la recherche d’information. De nombreux travaux ont eu lieu sur la recherche de réponses à des questions factuelles en domaine ouvert. Moins de travaux ont porté sur la recherche de réponses en domaine de spécialité, en particulier dans le domaine médical ou biomédical. Plusieurs conditions différentes sont rencontrées en domaine de spécialité comme les lexiques et terminologies spécialisés, les types particuliers de questions, entités et relations du domaine ou les caractéristiques des documents ciblés. Dans une première partie, nous étudions les méthodes permettant d’analyser sémantiquement les questions posées par l’utilisateur ainsi que les textes utilisés pour trouver les réponses. Pour ce faire nous utilisons des méthodes hybrides pour deux tâches principales : (i) la reconnaissance des entités médicales et (ii) l’extraction de relations sémantiques. Ces méthodes combinent des règles et patrons construits manuellement, des connaissances du domaine et des techniques d’apprentissage statistique utilisant différents classifieurs. Ces méthodes hybrides, expérimentées sur différents corpus, permettent de pallier les inconvénients des deux types de méthodes d’extraction d’information, à savoir le manque de couverture potentiel des méthodes à base de règles et la dépendance aux données annotées des méthodes statistiques. Dans une seconde partie, nous étudions l’apport des technologies du web sémantique pour la portabilité et l’expressivité des systèmes de questions-réponses. Dans le cadre de notre approche, nous exploitons les technologies du web sémantique pour annoter les informations extraites en premier lieu et pour interroger sémantiquement ces annotations en second lieu. Enfin, nous présentons notre système de questions-réponses, appelé MEANS, qui utilise à la fois des techniques de TAL, des connaissances du domaine et les technologies du web sémantique pour répondre automatiquement aux questions médicales. / With the dramatic growth of digital information, finding precise answers to natural language questions is more and more essential for retrieving domain knowledge in real time. Many research works tackled answer retrieval for factual questions in open domain. Less works were performed for domain-specific question answering such as the medical domain. Compared to the open domain, several different conditions are met in the medical domain such as specialized vocabularies, specific types of questions, different kinds of domain entities and relations. Document characteristics are also a matter of importance, as, for example, clinical texts may tend to use a lot of technical abbreviations while forum pages may use long “approximate” terms. We focus on finding precise answers to natural language questions in the medical field. A key process for this task is to analyze the questions and the source documents semantically and to use standard formalisms to represent the obtained annotations. We propose a medical question-answering approach based on: (i) NLP methods combing domain knowledge, rule-based methods and statistical ones to extract relevant information from questions and documents and (ii) Semantic Web technologies to represent and interrogate the extracted information. Questions-réponses Extraction d’information Domaine médical Entités nommées Relations sémantiques Apprentissage Patrons Question answering Information extraction Medical domain Named entities Semantic relations Machine learning Patterns
12	Questions-Réponses en domaine ouvert : sélection pertinente de documents en fonction du contexte de la question Foucault, Nicolas 16 December 2013 (has links) (PDF) Les problématiques abordées dans ma thèse sont de définir une adaptation unifiée entre la sélection des documents et les stratégies de recherche de la réponse à partir du type des documents et de celui des questions, intégrer la solution au système de Questions-Réponses (QR) RITEL du LIMSI et évaluer son apport. Nous développons et étudions une méthode basée sur une approche de Recherche d'Information pour la sélection de documents en QR. Celle-ci s'appuie sur un modèle de langue et un modèle de classification binaire de texte en catégorie pertinent ou non pertinent d'un point de vue QR. Cette méthode permet de filtrer les documents sélectionnés pour l'extraction de réponses par un système QR. Nous présentons la méthode et ses modèles, et la testons dans le cadre QR à l'aide de RITEL. L'évaluation est faite en français en contexte web sur un corpus de 500 000 pages web et de questions factuelles fournis par le programme Quaero. Celle-ci est menée soit sur des documents complets, soit sur des segments de documents. L'hypothèse suivie est que le contenu informationnel des segments est plus cohérent et facilite l'extraction de réponses. Dans le premier cas, les gains obtenus sont faibles comparés aux résultats de référence (sans filtrage). Dans le second cas, les gains sont plus élevés et confortent l'hypothèse, sans pour autant être significatifs. Une étude approfondie des liens existant entre les performances de RITEL et les paramètres de filtrage complète ces évaluations. Le système de segmentation créé pour travailler sur des segments est détaillé et évalué. Son évaluation nous sert à mesurer l'impact de la variabilité naturelle des pages web (en taille et en contenu) sur la tâche QR, en lien avec l'hypothèse précédente. En général, les résultats expérimentaux obtenus suggèrent que notre méthode aide un système QR dans sa tâche. Cependant, de nouvelles évaluations sont à mener pour rendre ces résultats significatifs, et notamment en utilisant des corpus de questions plus importants. [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Traitement automatique des langues Questions-Réponses Recherche d'information RITEL Quaero Séléction de documents Modèle de langue Classification de pages web Segmentation de pages web Apprentissage automatique
13	Modélisation du dialogue homme-machine pour la recherche d'informations : approche questions-réponses Loisel, Alain 20 October 2008 (has links) (PDF) Cette thèse décrit la conception d'un système de dialogue Homme- Machine pour la recherche d'informations capable d'interagir avec l'utilisateur en langue naturelle en utilisant des stratégies coopératives. Pour étudier les processus dialogiques impliqués dans la recherche d'informations, une méthodologie ascendante a été adoptée. Une série d'expérimentations a permis le recueil de corpus de dialogues humains présentant de telles recherches dans le cadre du système de documentation médicale CISMeF. L'analyse des dialogues recueillis a montré que leur structure correspond bien aux structures sémantiques de l'approche " questionsréponses ". Fondé sur un modèle existant nommé GoDIS, notre système y intègre de nombreux ajouts permettant d'améliorer la cohérence du dialogue et de proposer des exemples, des choix, des assistances. Une implémentation de ce modèle est réalisée et des pistes d'évaluation sont proposées. [INFO] Computer Science [INFO] Informatique Dialogue homme-machine Stratégue dialogique Recherche d'informations Cohérence dialogique Approche questions-réponses Gestionnaire de dialogue Issue-based Dialogue
14	Modélisation du dialogue homme-machine pour la recherche d'informations : approche questions-réponses / Dialogue system modeling for information retrieval with an issue-based approach Loisel, Alain 20 October 2008 (has links) Cette thèse décrit la conception d’un système de dialogue Homme- Machine pour la recherche d’informations capable d’interagir avec l’utilisateur en langue naturelle en utilisant des stratégies coopératives. Pour étudier les processus dialogiques impliqués dans la recherche d’informations, une méthodologie ascendante a été adoptée. Une série d’expérimentations a permis le recueil de corpus de dialogues humains présentant de telles recherches dans le cadre du système de documentation médicale CISMeF. L’analyse des dialogues recueillis a montré que leur structure correspond bien aux structures sémantiques de l’approche « questionsréponses ». Fondé sur un modèle existant nommé GoDIS, notre système y intègre de nombreux ajouts permettant d’améliorer la cohérence du dialogue et de proposer des exemples, des choix, des assistances. Une implémentation de ce modèle est réalisée et des pistes d’évaluation sont proposées. / This thesis describes the design of a computer-human dialog system for information search. This system is able to interact with the user in natural language using cooperative strategies. To study the dialog processes involved during information search, a bottom-up approach was adopted. Experiments have been set up to obtain human dialogs related to such searches in the context of the health information system CISMeF. It turns out that the structure arising from the analysis of the dialogs matches a semantic approach called “issue-based dialog”. Starting from the model GoDIS, our artificial agent model adds several enhancements that allow to propose examples, assistance and choices. The model is implemented and some elements of evaluation are discussed. Dialogue homme-machine Stratégue dialogique Recherche d'informations Cohérence dialogique Approche questions-réponses Gestionnaire de dialogue Issue-based approach Dialogue system modeling CISMeF GoDIS
15	Questions-Réponses en domaine ouvert : sélection pertinente de documents en fonction du contexte de la question / Open domain question-answering : relevant document selection geared to the question Foucault, Nicolas 16 December 2013 (has links) Les problématiques abordées dans ma thèse sont de définir une adaptation unifiée entre la sélection des documents et les stratégies de recherche de la réponse à partir du type des documents et de celui des questions, intégrer la solution au système de Questions-Réponses (QR) RITEL du LIMSI et évaluer son apport. Nous développons et étudions une méthode basée sur une approche de Recherche d’Information pour la sélection de documents en QR. Celle-ci s’appuie sur un modèle de langue et un modèle de classification binaire de texte en catégorie pertinent ou non pertinent d’un point de vue QR. Cette méthode permet de filtrer les documents sélectionnés pour l’extraction de réponses par un système QR. Nous présentons la méthode et ses modèles, et la testons dans le cadre QR à l’aide de RITEL. L’évaluation est faite en français en contexte web sur un corpus de 500 000 pages web et de questions factuelles fournis par le programme Quaero. Celle-ci est menée soit sur des documents complets, soit sur des segments de documents. L’hypothèse suivie est que le contenu informationnel des segments est plus cohérent et facilite l’extraction de réponses. Dans le premier cas, les gains obtenus sont faibles comparés aux résultats de référence (sans filtrage). Dans le second cas, les gains sont plus élevés et confortent l’hypothèse, sans pour autant être significatifs. Une étude approfondie des liens existant entre les performances de RITEL et les paramètres de filtrage complète ces évaluations. Le système de segmentation créé pour travailler sur des segments est détaillé et évalué. Son évaluation nous sert à mesurer l’impact de la variabilité naturelle des pages web (en taille et en contenu) sur la tâche QR, en lien avec l’hypothèse précédente. En général, les résultats expérimentaux obtenus suggèrent que notre méthode aide un système QR dans sa tâche. Cependant, de nouvelles évaluations sont à mener pour rendre ces résultats significatifs, et notamment en utilisant des corpus de questions plus importants. / This thesis aims at defining a unified adaptation of the document selection and answer extraction strategies, based on the document and question types, in a Question-Answering (QA) context. The solution is integrated in RITEL (a LIMSI QA system) to assess the contribution. We develop and investigate a method based on an Information Retrieval approach for the selection of relevant documents in QA. The method is based on a language model and a binary model of textual classification in relevant or irrelevant category. It is used to filter unusable documents for answer extraction by matching lists of a priori relevant documents to the question type automatically. First, we present the method along with its underlying models and we evaluate it on the QA task with RITEL in French. The evaluation is done on a corpus of 500,000 unsegmented web pages with factoid questions provided by the Quaero program (i.e. evaluation at the document level or D-level). Then, we evaluate the methodon segmented web pages (i.e. evaluation at the segment level or S-level). The idea is that information content is more consistent with segments, which facilitates answer extraction. D-filtering brings a small improvement over the baseline (no filtering). S-filtering outperforms both the baseline and D-filtering but not significantly. Finally, we study at the S-level the links between RITEL’s performances and the key parameters of the method. In order to apply the method on segments, we created a system of web page segmentation. We present and evaluate it on the QA task with the same corpora used to evaluate our document selection method. This evaluation follows the former hypothesis and measures the impact of natural web page variability (in terms of size and content) on RITEL in its task. In general, the experimental results we obtained suggest that our IR-based method helps a QA system in its task, however further investigations should be conducted – especially with larger corpora of questions – to make them significant. Traitement automatique des langues Questions-Réponses Recherche d’information RITEL Quaero Séléction de documents Modèle de langue Classification de pages web Segmentation de pages web Apprentissage automatique Natural language processing Question & Answering Information retrieval RITEL Quaero Document selection Language modeling Web page classification Web page segmentation Machine learning
16	Des énigmes de la recherche d'information : contribution à l'analyse du couple question-réponse dans le processus d'échec documentaire chez les professionnels de l'information Perrin, Olivier 10 October 2013 (has links) (PDF) Cette étude prend place dans le paradigme " orienté usager " des études en Sciences de l'information et de la communication, puisqu'elle aborde un continent peu exploré des aspects humains, socioprofessionnels et éthiques du processus de la recherche et de la restitution de l'information conduit par des professionnels de l'information (bibliothécaires, documentalistes), agissant pour des usagers en quête d'information. L'un des enjeux de ce travail est, en remettant la " question " au centre des préoccupations des professionnels de l'information, de tenter de faire apparaître le rôle et les fonctions de la question dans ses modalités d'accès à la connaissance, au savoir et à l'information dans la société de l'information et du savoir ; puis de s'interroger sur les modalités et les raisons des difficultés que des professionnels peuvent rencontrer parfois dans les situations complexes du réel du travail lors de leur mission de service -en présentiel ou à distance- de renseignement aux usagers. En s'appuyant sur deux études empiriques, cette thèse examine plus précisément du côté des professionnels médiateurs de l'information, quelques uns de ces obstacles, que nous avons qualifiés d'"échec documentaire", qui peuvent surgir pendant les phases cognitives, documentaires, communicationnelles de la recherche et de la restitution (réponse), de l'information à l'usager questionneur. Bibliothécaires-France Bibliothèques --Enquêtes--France Recherche de l'information Recherche d'information Recherche documentaire Echec documentaire Centres de documentation Question réponse Renseignement Systèmes de questions réponses Documentalistes
17	Analyse temporelle et sémantique des réseaux sociaux typés à partir du contenu de sites généré par des utilisateurs sur le Web / Temporal and semantic analysis of richly typed social networks from user-generated content sites on the web Meng, Zide 07 November 2016 (has links) Nous proposons une approche pour détecter les sujets, les communautés d'intérêt non disjointes,l'expertise, les tendances et les activités dans des sites où le contenu est généré par les utilisateurs et enparticulier dans des forums de questions-réponses tels que StackOverFlow. Nous décrivons d'abordQASM (Questions & Réponses dans des médias sociaux), un système basé sur l'analyse de réseauxsociaux pour gérer les deux principales ressources d’un site de questions-réponses: les utilisateurs et lecontenu. Nous présentons également le vocabulaire QASM utilisé pour formaliser à la fois le niveaud'intérêt et l'expertise des utilisateurs. Nous proposons ensuite une approche efficace pour détecter lescommunautés d'intérêts. Elle repose sur une autre méthode pour enrichir les questions avec un tag plusgénéral en cas de besoin. Nous comparons trois méthodes de détection sur un jeu de données extrait dusite populaire StackOverflow. Notre méthode basée sur le se révèle être beaucoup plus simple et plusrapide, tout en préservant la qualité de la détection. Nous proposons en complément une méthode pourgénérer automatiquement un label pour un sujet détecté en analysant le sens et les liens de ses mots-clefs.Nous menons alors une étude pour comparer différents algorithmes pour générer ce label. Enfin, nousétendons notre modèle de graphes probabilistes pour modéliser conjointement les sujets, l'expertise, lesactivités et les tendances. Nous le validons sur des données du monde réel pour confirmer l'efficacité denotre modèle intégrant les comportements des utilisateurs et la dynamique des sujets / We propose an approach to detect topics, overlapping communities of interest, expertise, trends andactivities in user-generated content sites and in particular in question-answering forums such asStackOverFlow. We first describe QASM (Question & Answer Social Media), a system based on socialnetwork analysis to manage the two main resources in question-answering sites: users and contents. Wealso introduce the QASM vocabulary used to formalize both the level of interest and the expertise ofusers on topics. We then propose an efficient approach to detect communities of interest. It relies onanother method to enrich questions with a more general tag when needed. We compared threedetection methods on a dataset extracted from the popular Q&A site StackOverflow. Our method basedon topic modeling and user membership assignment is shown to be much simpler and faster whilepreserving the quality of the detection. We then propose an additional method to automatically generatea label for a detected topic by analyzing the meaning and links of its bag of words. We conduct a userstudy to compare different algorithms to choose the label. Finally we extend our probabilistic graphicalmodel to jointly model topics, expertise, activities and trends. We performed experiments with realworlddata to confirm the effectiveness of our joint model, studying the users’ behaviors and topicsdynamics Web social sémantique Analyse des médias sociaux Modèle graphique probabiliste Sites de questions-réponses Contenu généré par l’utilisateur Modélisation des thématiques Détection d’expertise Détection de communautés recouvrantes Social semantic web Social media mining Probabilistic graphical model Question answer sites User-generated content Topic modeling Expertise detection Overlapping community detection

Page generated in 0.0858 seconds