1 |
Compound terms for information retrievalLu, Cuihua January 2004 (has links)
Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.
|
2 |
Réseaux de neurones pour le traitement automatique du langage: conception et réalisatin de filtres d'informationsStricker, Mathieu 12 1900 (has links) (PDF)
En raison de l'augmentation constante du volume d'information accessible électroniquement, la conception et la mise en uvre d'outils efficaces, permettant notamment à l'utilisateur de n'avoir accès qu'à l'information qu'il juge pertinente, devient une nécessité absolue. Comme la plupart de ces outils sont destinés à être utilisés dans un cadre professionnel, les exigences de fiabilité et de convivialité sont très importantes; les problèmes à résoudre pour satisfaire ces exigences sont nombreux et difficiles. L'accès à cette information pertinente peut se faire en fournissant à un utilisateur des documents pertinents ou en lui proposant des passages de documents pertinents (ou des réponses à des questions). Le premier cas relève du domaine de la recherche de textes et le second du domaine de l'extraction d'informations. C'est dans le domaine très actif de la recherche de textes que s'est situé notre travail, réalisé dans le cadre d'une collaboration entre Informatique CDC, filiale de la Caisse des Dépôts et Consignations, et le Laboratoire d'Électronique de l'ESPCI. Le but de nos travaux a été de développer un modèle fondé sur l'apprentissage numérique pour la catégorisation de textes ou, plus précisément, pour ce qui correspond à la tâche de routing dans le découpage de la conférence TREC (Text REtrieval Conference). L'approche que nous avons conçue nous a permis d'obtenir un résultat très satisfaisant: nous avons remporté la tâche de "routing" de la compétition TREC 9, devançant notamment Microsoft. Le point essentiel de notre approche est l'utilisation d'un classifieur qui est un réseau de neurones dont l'architecture prend en considération le contexte local des mots. La mise en uvre d'une méthode de sélection des entrées nous a permis de réduire à une vingtaine le nombre de descripteurs de chaque texte; néanmoins, le nombre de paramètres reste élevé eu égard au nombre d'exemples disponibles (notamment lors de la compétition TREC 9). Il a donc été nécessaire de mettre en uvre une méthode de régularisation pour obtenir des résultats significatifs à l'issue des apprentissages. Nos résultats ont été validés d'une part grâce au corpus Reuters-21578 qui est souvent utilisé par la communauté de la catégorisation de textes, et d'autre part, par la participation aux sous-tâches de routing de TREC-8 et TREC-9, qui ont permis d'effectuer des comparaisons chiffrées avec d'autres approches. Nos travaux ont été intégrés dans l'application ExoWeb développée à la Caisse des Dépôts, pour y ajouter des fonctionnalités opérationnelles originales. Cette application offrait, sur l'intranet du groupe, un service de catégorisation de dépêches AFP en temps réel; cette catégorisation s'effectuait grâce à des modèles à bases de règles. La première fonctionnalité nouvelle résultant de nos travaux est un outil qui permet à l'administrateur du système de surveiller automatiquement le vieillissement de filtres construits sur des modèles à base de règles. L'idée de cette application est de fabriquer une "copie" d'un filtre à base de règles avec un filtre utilisant un réseau de neurones. Comme le réseau de neurones produit une probabilité de pertinence et non une réponse binaire, il est possible d'attirer l'attention de l'administrateur sur les documents pour lesquels les filtres et les réseaux de neurones fournissent des réponses divergentes: documents considérés comme pertinents par la méthode à base de règles, mais obtenant une probabilité proche de zéro avec le réseau de neurones, et documents considérés comme non pertinents avec le premier et obtenant une probabilité de pertinence proche de un avec le second. Nous avons également proposé les bases d'une deuxième application, qui permet à un utilisateur de fabriquer lui-même un filtre à sa convenance avec un travail minimum. Pour réaliser cette application, il est nécessaire que l'utilisateur fournisse une base de documents pertinents. Cela peut se faire grâce à l'utilisation d'un moteur de recherche conjointement avec un réseau de neurones ou uniquement grâce au moteur de recherche.
|
3 |
Statistical Source Expansion for Question AnsweringSchlaefer, Nico 01 January 2011 (has links)
A source expansion algorithm automatically extends a given text corpus with related information from large, unstructured sources. While the expanded corpus is not intended for human consumption, it can be leveraged in question answering (QA) and other information retrieval or extraction tasks to find more relevant knowledge and to gather additional evidence for evaluating hypotheses. In this thesis, we propose a novel algorithm that expands a collection of seed documents by (1) retrieving related content from the Web or other large external sources, (2) extracting self-contained text nuggets from the related content, (3) estimating the relevance of the text nuggets with regard to the topics of the seed documents using a statistical model, and (4) compiling new pseudo-documents from nuggets that are relevant and complement existing information. In an intrinsic evaluation on a dataset comprising 1,500 hand-labeled web pages, the most elective statistical relevance model ranked text nuggets by relevance with 81% MAP, compared to 43% when relying on rankings generated by a web search engine, and 75% when using a multi-document summarization algorithm. These differences are statistically significant and result in noticeable gains in search performance in a task-based evaluation on QA datasets. The statistical models use a comprehensive set of features to predict the topicality and quality of text nuggets based on topic models built from seed content, search engine rankings and surface characteristics of the retrieved text. Linear models that evaluate text nuggets individually are compared to a sequential model that estimates their relevance given the surrounding nuggets. The sequential model leverages features derived from text segmentation algorithms to dynamically predict transitions between relevant and irrelevant passages. It slightly outperforms the best linear model while using fewer parameters and requiring less training time. In addition, we demonstrate that active learning reduces the amount of labeled data required to fit a relevance model by two orders of magnitude with little loss in ranking performance. This facilitates the adaptation of the source expansion algorithm to new knowledge domains and applications. Applied to the QA task, the proposed method yields consistent and statistically significant performance gains across different datasets, seed corpora and retrieval strategies. We evaluated the impact of source expansion on search performance and end-to-end accuracy using Watson and the OpenEphyra QA system, and datasets comprising over 6,500 questions from the Jeopardy! quiz show and TREC evaluations. By expanding various seed corpora with web search results, we were able to improve the QA accuracy of Watson from 66% to 71% on regular Jeopardy! questions, from 45% to 51% on Final Jeopardy! questions and from 59% to 64% on TREC factoid questions. We also show that the source expansion approach can be adapted to extract relevant content from locally stored sources without requiring a search engine, and that this method yields similar performance gains. When combined with the approach that uses web search results, Watson's accuracy further increases to 72% on regular Jeopardy! data, 54% on Final Jeopardy! and 67% on TREC questions.
|
4 |
Etude et développement d’un concept de caractérisation rapide d’antennes basé sur le principe du retournement temporel du champ électromagnétique en chambre réverbérante / Study and development of antenna quick characterization concept based on time reversal principle of electromagnetic fields in a reverberation chamberMeton, Philippe 18 September 2015 (has links)
La thèse porte sur la génération de fronts d’ondes de test en milieu réverbérant pour la mesure d’antennes Ultra Large Bande. L’objectif est de générer des fronts d’ondes déterministes convergents, respectant les standards de mesure d'antennes, dans un milieu diffusif caractérisé par une décohérence spatiale, temporelle et fréquentielle. Les performances intéressantes, visées pour l’application, sont la génération temps réel, l’utilisation d’un nombre limité de sources et l’obtention d’un rendement de conversion d’énergie élevé. Tout d’abord, nous présentons des concepts de mesure d’antennes et montrons, les limites des méthodes actuelles pour la réalisation de caractérisations rapides permettant un niveau de rapport signal à bruit satisfaisant et n'utilisant pas de sources multiples. Puis, nous introduisons notre moyen d’essai, le système Time reversal Electromagnetic Chamber (TREC), constitué notamment d’une chambre réverbérante, dans laquelle un principe non standard de retournement temporel est utilisé pour générer des fronts d’ondes cohérents et convergents d’espace libre. Nous cherchons alors à étendre les capacités de la TREC à la génération des fronts d’ondes de test convergents et localement plans. Dans une phase d'étude préalable, nous développons deux approches pour synthétiser la propagation en espace libre des fronts d’ondes de mesure. Les techniques utilisées reposent sur l’utilisation de l’opérateur Slepian, permettant la résolution des contraintes imposées par les propriétés spécifiques des distributions de champ. La solution optimale de caractérisation a permis de générer des fronts d'ondes comportant une résolution angulaire. La synthèse des fronts d'ondes de test est utilisée dans des simulations électromagnétiques de TREC 2D et 3D. Les résultats ont validé la faisabilité de la génération de fronts d’ondes convergents, localement plans et résolus angulairement. / This contribution corresponds to the generation of test wavefronts in reverberation chamber for antenna Ultra Wide Band characterization. We were interested in generating deterministic convergent wavefronts, fulfilling the antenna measurement standard, in a diffusive medium characterized by a spatial, temporal and frequency decoherence. The interesting performances referred to the application, are the real-time synthesis, the use of a limited number of sources and the high energy conversion efficiency. First we present the concepts of antenna measurement and the limitations of current methods for achieving quick characterization with a sufficient signal to noise ratio without multiple sources. Then, we introduce our system, the Time Reversal Electromagnetic Chamber (TREC), which is mainly constituted by a reverberation chamber, in which a non-standard time reversal principle is used for coherent convergent free space wavefronts generation. Then we try to extend the TREC capacities to the generation of free space convergent and locally plan wavefronts. In a preliminary study, we develop two approaches to synthesize the free space propagation of the wavefronts. The used techniques are based on the utilization of the operator Slepian, allowing the resolution of the constraints determined by the specific properties of the field distribution. The optimal solution allowed generating wavefronts characterized by angular resolution. Test wavefronts synthesis is used in 2D and 3D TREC electromagnetic simulations. Results validated the feasibility of the generation of locally plan convergent wavefronts with angular resolution.
|
5 |
Etude théorique et expérimentale des techniques de retournement temporel : application à la caractérisation de composants et dispositifs dans une chambre réverbérante / Theoretical and experimental studie of time reversal technics : application to the caracterization of components and devices inside a reveberation chamberMoussa, Houmam 11 July 2011 (has links)
Dans le cadre de nos travaux de recherche, nous sommes parvenus à introduire une utilisation déterministe des chambres réverbérantes, en proposant un nouveau paradigme de la technique du retournement temporel. Nous sommes capable de réaliser le même type de tests d'immunité rayonnée que dans une chambre anéchoïque, tout en profitant des avantages liés aux propriétés physiques des milieux fortement réverbérants comme la génération de champs de fortes intensités à partir de niveaux de puissances injectées relativement faibles.En effet, les études menées dans cette thèse ont démontré la faisabilité d'un moyen de test d'immunité rayonnée novateur, permettant la génération de fronts d'onde cohérents dans une cavité résonante et dont la direction de propagation et la polarisation sont contrôlées sans aucun déplacement mécanique des sources génératrice du champ ou de l'équipement sous test. Un autre avantage majeur de ce nouveau système, baptisé chambre électromagnétique à retournement temporel (TREC), réside dans le fait de pouvoir générer dans une chambre réverbérante, des champs impulsionnels dont l'extension temporelle est de courte durée alors que cette capacité n'était pas envisageable avant ces travaux.Pour cela, la TREC repose sur la connaissance du champ sur une surface de mesure arbitraire, située entre les sources et l'objet sous test, dans la direction de propagation du front d'onde souhaitée. Cette phase de caractérisation peut être réalisée à l'aide d'une mesure de la fonction de transfert entre le port des antennes sources et une sonde de champ déplacée sur la surface de mesure.Le principe de notre système se base sur l'association de la technique du retournement temporel et du principe d'équivalence. Le retournement temporel permet d'assurer une fenêtre temporelle, dans laquelle les conditions de propagation du champ dans la chambre réverbérante sont identiques à celles en espace libre, et permet d'obtenir une propagation d'un front d'onde convergent vers une source ponctuelle qui aurait initialement créé un front d'onde divergent. Le principe d'équivalence permet de passer d'une source ponctuelle à une source de rayonnement étendue, permettant de créer une distribution spatiale du champ arbitraire et de contrôler ainsi sa direction de propagation et sa polarisation.Ce nouveau système à été validé, dans un premier temps, à l'aide d'un ensemble de simulations numériques exploratoires pour déterminer les paramètres influents sur ses performances. Puis il a été étudié à partir de mesures réalisées dans la chambre réverbérante du Département de Recherche en Électromagnétisme, à Supélec, démontrant ainsi de façon expérimentale la faisabilité et l'intérêt du développement de ce moyen de test, complémentaire à l'utilisation actuelle des chambres réverbérantes à brassage de modes pour la génération de front d'onde cohérents pulsés. / In the framework of our research work, we present an innovative system which allows to control the spatio-temporal distribution of a coherent field in an strongly reflecting environment. This system called " Time reversal electromagnetic chamber" (TREC), makes possible the generation of high intensity pulsed wavefront, in a reverberating chamber, and whose direction of propagation and polarisation are modifieable in real time without any mechanical mouvement of neither the sources generating the field, here radio antennas, nor the equipment under test.For this, the TREC is based on knowledge of the field on an arbitrary surface of measurement, located between the sources and the object under test, in the direction of propagation of the wavefront desired. This phase of characterization may be performed with the help of a measurement of the transfer functions between the port of the antennas and a field probe moved on the arbitrary surface of measurement.The principle of the TREC is based on the association of the technique of time reversal and of the principle of equivalence. Time reversal allows to ensure a temporal window in which the conditions of propagation of the field in the reverberation chamber are identical to those in free space and which allows to obtain a propagation of a wavefront converging towards a punctual source which would initially have created a diverging wavefront. The equivalence principle allows to go from a punctual source to a an extended source of radiation, thus allowing to create an arbitrary spatial distribution of the field and thereby to control its direction of propagation.This new system was validated with the help, at first, of a set of numerical exploratory simulations in order to determine the influential parameters on its performance and then studied from measurements carried out in the reverberation chamber of the ``Département de recherche en électromagnétisme'', at Supélec, thus demonstrating experimentally the feasibility and the interest of the development of this testing facility for the generation of pulsed coherent wavefronts, complementary to the current use mode-stirred reverberation chambers.
|
6 |
What the BERT? : Fine-tuning KB-BERT for Question Classification / Vad i BERT? : Finjustering av KB-BERT för frågeklassificeringCervall, Jonatan January 2021 (has links)
This work explores the capabilities of KB-BERT on the downstream task of Question Classification. The TREC data set for Question Classification with the Li and Roth taxonomy was translated to Swedish, by manually correcting the output of Google’s Neural Machine Translation. 500 new data points were added. The fine-tuned model was compared with a similarly trained model based on Multilingual BERT, a human evaluation, and a simple rule-based baseline. Out of the four methods of this work, the Swedish BERT model (SwEAT- BERT) performed the best, achieving 91.2% accuracy on TREC-50 and 96.2% accuracy on TREC-6. The performance of the human evaluation was worse than both BERT models, but doubt is cast on how fair this comparison is. SwEAT-BERTs results are competitive even when compared to similar models based on English BERT. This furthers the notion that the only roadblock in training language models for smaller languages is the amount of readily available training data. / Detta arbete utforskar hur bra den svenska BERT-modellen, KB-BERT, är på frågeklassificering. BERT är en transformermodell som skapar kontextuella, bidirektionella ordinbäddningar. Det engelska datasetet för frågeklassificering, TREC, översattes till svenska och utökades med 500 nya datapunkter. Två BERT-modeller finjusterades på detta nya TREC-dataset, en baserad på KB-BERT och en baserad på Multilingual BERT, en flerspråkig variant av BERT tränad på data från 104 språk (däribland svenska). En regel-baserad modell byggdes som en nedre gräns på problemet, och en mänsklig klassificeringsstudie utfördes som jämförelse. BERT-modellen baserad på KB-BERT (SwEAT-BERT) uppnådde 96.2% korrekthet på TREC med 6 kategorier, och 91.2% korrekthet på TREC med 50 kategorier. Den mänskliga klassificeringen uppnådde sämre resultat än båda BERT-modellerna, men det är tvivelaktigt hur rättvis denna jämförelse är. SwEAT-BERT presterade bäst av metoderna som testades i denna studie, och konkurrenskraftigt i jämförelse med engelska BERT-modeller finjusterade på det engelska TREC-datasetet. Detta resultat stärker uppfattningen att tillgänglighet till träningsdata är det enda som står i vägen för starkare språkmodeller för mindre språk.
|
7 |
Contribution à l'étude de la reconstitution immunitaire après miniallogreffe de cellules souches hématopoïétiques.Castermans, Emilie 23 June 2008 (has links)
Les principaux échecs des greffes de cellules souches allogéniques (HSCT) sont la rechute et les infections, accompagnées ou non de GvHD (Graft versus Host Disease, maladie du greffon contre lhôte), manifestations qui pourraient être partiellement attribuées à un déficit immunitaire (rechute, infections) ou à une réaction immunitaire exacerbée envers le receveur (GvHD) (Baron, Storer et al. 2006). Létude de la reconstitution du système immunitaire, et particulièrement, lymphocytaire, savère dès lors capitale dans le développement des HSCT.
Nous avons investigué la reconstitution immune de 50 patients traités par HSCT nonmyéloablative classique vs HSCT nonmyéloablative déplétée en lymphocytes T CD8+. 50 patients ont été randomisés : greffon déplété en CD8 (n=22) vs non manipulé (n=28). Lâge médian était de 57 ans au moment de la greffe (range 36-69). Le régime de conditionnement consistait en une irradiation corporelle totale de 2 Gy avec ou sans ajout de Fludarabine. 20 patients ont reçu une greffe de donneur familial, 14 de donneurs non familiaux HLA identiques, et 16 de donneurs non familiaux présentant une disparité HLA. La reconstitution immunitaire la première année après HCT a été monitorée par cytométrie en flux, analyse de la diversité du répertoire du TCR (spectratyping), quantification de sjTREC (signal joint T cell receptor excision circle, marqueur de la thymopoïèse). La déplétion des CD8 a réduit la reconstitution des taux de CD8 durant les 6 premiers mois postgreffe (P<0.0001) mais na pas présenté dimpact significatif sur la récupération des autres populations cellulaires. Les concentrations de sjTREC et des taux de CD3 ont augmenté parallèlement entre le jour 100 et le jour 365 après greffe (P=0.006 et P=0.022, respectivement), suggérant ainsi la néoproduction de lymphocytes T par le thymus, même chez ces patients âgés. Les facteurs associés à une concentration conséquente de TREC un an après greffe incluent 1° le choix dun donneur non familial HLA-matched (P=0.029), 2° de hautes concentrations de lymphocytes T dans le greffon (P=0.002), et 3° labsence de GVHD chronique (P<0.0001).
Nos données suggèrent un modèle biphasique de reconstitution du pool lymphocytaire T: 1) une expansion des T matures du greffon en périphérie durant les 3 premiers mois ;2) une néoproduction active par voie intrathymique assurant la reconstitution du système immunitaire à plus long terme.
Combien de temps cette néosynthèse intrathymique perdure-t-elle ? Quels facteurs laffectent ? Est-elle associée à une diversité accrue du répertoire lymphocytaire ?
Ces questions nous ont amenés à étudier la reconstitution immunitaire à long terme (entre 1 et 6.5 ans) de 73 patients après minigreffe (211 points au total). Nous avons observé un maintien de la thymopoïèse réenclenchée au cours de la première année postgreffe chez les patients âgés de moins de 50 ans et de 50-60 ans. Cette reprise de la thymopoïèse na pas été mise en évidence au sein du groupe des plus de 60 ans. Ainsi, une application clinique concrète à cette observation pourrait être ladministration de greffons particulièrement riches en lymphocytes T à ce type de patients, puisquils seront plus susceptibles de développer une lymphopénie persistante postgreffe par absence de réenclenchement de la voie thymodépendante. Les facteurs associés à une reconstitution thymodépendante à long terme après minigreffe étaient : 1°labsence de cGvHD (P<0.0001); 2°lâge du receveur (P<0.0001); 3° la concentration en lymphocytes T dans le greffon (P=0. 0.0038) ; 4°laugmentation de la diversité HLA (P=0.0001). Enfin, une tendance non significative à une augmentation parallèle de la diversité du répertoire TCR et des concentrations en sjTREC a été mise en évidence. Cette analyse doit être confirmée par létude dun plus grand nombre de sujets.
Afin déliminer au maximum les influences extrathymiques sur les taux de TREC périphériques, nous comptons mesurer pour chaque patient des TREC précoces (BTREC) et un TREC tardif (sjTREC), et calculer un ratio reflétant exactement le nombre de divisions intrathymiques. Cette méthode a été validée dans notre centre au cours dune expansion de lymphocytes T in vitro au moyen de billes anti-CD3 anti-CD28, expansion durant laquelle nous avons pu observer une diminution des sjTREC et des BTREC, mais pas du ratio sjTREC/BTREC. Lanalyse des ratios de TREC des patients greffés est actuellement à létude.
Une troisième étude a été également menée afin déclaircir le lien entre GvHD, thymopoïèse et présence de lymphocytes T régulateurs (TRegs) chez 64 patients après HCT. Lémergence dun nouveau marqueur spécifique des TRegs, le CD127, a permis pour la première fois une isolation sans équivoque des TRegs (Liu, Putnam et al. 2006). Nous navons pas pu mettre en évidence de différence significative entre lapparition dune cGvHD chez les patients présentant après greffe des taux de TRegs supérieurs ou inférieurs à la médiane (P=0.13). Inversement, loccurrence de cGvHD na pas paru significativement affecter les concentrations en TRegs après greffe (P=0.1). Nous avons également mis en évidence une corrélation positive significative entre le taux de sjTREC/ml et le taux de TReg/ul au J100 (R=0.46, P=0.007) et à 1 an R=0.47, P=0.001). Afin de déterminer lorigine précise de ces TReg après greffe (thymus du donneur?), nous réalisons actuellement des mesures de sjTREC et de chimérisme sur les populations cellulaires triées au moyen du triple marquage CD4+CD25+CD127- (cellules T classiques vs régulatrices).
|
8 |
Modeling the Predictors of Nurses’ Research Use in Canadian Long-Term Care HomesDemery Varin, Melissa 06 September 2018 (has links)
Factors affecting the use of research evidence by nurses in long-term care (LTC) settings are largely unknown. In this thesis nurses referred to registered nurses (RNs) and licensed practical nurses (LPNs). A secondary analysis of data (n=756 nurses) from the Translating Research in Elder Care program was performed to construct Generalized Estimating Equation models of the predictors of nurses' self-reported instrumental, conceptual and persuasive research use. Positive attitudes towards research and better access to structural and electronic resources predicted all three kinds of research use. Additional statistically significant predictors suggest that individual variables play a more prominent role than contextual variables in predicting conceptual and persuasive use of research evidence, while instrumental research use is predicted equally by individual and organizational variables.
|
9 |
Vers une représentation du contexte thématique en Recherche d'Information / Generative models of topical context for Information RetrievalDeveaud, Romain 29 November 2013 (has links)
Quand des humains cherchent des informations au sein de bases de connaissancesou de collections de documents, ils utilisent un système de recherche d’information(SRI) faisant office d’interface. Les utilisateurs doivent alors transmettre au SRI unereprésentation de leur besoin d’information afin que celui-ci puisse chercher des documentscontenant des informations pertinentes. De nos jours, la représentation du besoind’information est constituée d’un petit ensemble de mots-clés plus souvent connu sousla dénomination de « requête ». Or, quelques mots peuvent ne pas être suffisants pourreprésenter précisément et efficacement l’état cognitif complet d’un humain par rapportà son besoin d’information initial. Sans une certaine forme de contexte thématiquecomplémentaire, le SRI peut ne pas renvoyer certains documents pertinents exprimantdes concepts n’étant pas explicitement évoqués dans la requête.Dans cette thèse, nous explorons et proposons différentes méthodes statistiques, automatiqueset non supervisées pour la représentation du contexte thématique de larequête. Plus spécifiquement, nous cherchons à identifier les différents concepts implicitesd’une requête formulée par un utilisateur sans qu’aucune action de sa part nesoit nécessaire. Nous expérimentons pour cela l’utilisation et la combinaison de différentessources d’information générales représentant les grands types d’informationauxquels nous sommes confrontés quotidiennement sur internet. Nous tirons égalementparti d’algorithmes de modélisation thématique probabiliste (tels que l’allocationde Dirichlet latente) dans le cadre d’un retour de pertinence simulé. Nous proposonspar ailleurs une méthode permettant d’estimer conjointement le nombre de conceptsimplicites d’une requête ainsi que l’ensemble de documents pseudo-pertinent le plusapproprié afin de modéliser ces concepts. Nous évaluons nos approches en utilisantquatre collections de test TREC de grande taille. En annexes, nous proposons égalementune approche de contextualisation de messages courts exploitant des méthodesde recherche d’information et de résumé automatique / When searching for information within knowledge bases or document collections,humans use an information retrieval system (IRS). So that it can retrieve documentscontaining relevant information, users have to provide the IRS with a representationof their information need. Nowadays, this representation of the information need iscomposed of a small set of keywords often referred to as the « query ». A few wordsmay however not be sufficient to accurately and effectively represent the complete cognitivestate of a human with respect to her initial information need. A query may notcontain sufficient information if the user is searching for some topic in which she is notconfident at all. Hence, without some kind of context, the IRS could simply miss somenuances or details that the user did not – or could not – provide in query.In this thesis, we explore and propose various statistic, automatic and unsupervisedmethods for representing the topical context of the query. More specifically, we aim toidentify the latent concepts of a query without involving the user in the process norrequiring explicit feedback. We experiment using and combining several general informationsources representing the main types of information we deal with on a dailybasis while browsing theWeb.We also leverage probabilistic topic models (such as LatentDirichlet Allocation) in a pseudo-relevance feedback setting. Besides, we proposea method allowing to jointly estimate the number of latent concepts of a query andthe set of pseudo-relevant feedback documents which is the most suitable to modelthese concepts. We evaluate our approaches using four main large TREC test collections.In the appendix of this thesis, we also propose an approach for contextualizingshort messages which leverages both information retrieval and automatic summarizationtechniques
|
10 |
Avaliação da função tímica em pacientes com diabetes mellitus tipo 1 submetidos ao transplante autólogo de células-tronco hematopoéticas / Evaluation of thymic function in type 1 diabetes mellitus patients following autologous hematopoietic stem cell transplantation.Azevedo, Júlia Teixeira Cottas de 19 August 2013 (has links)
O diabetes mellitus tipo 1 (DM-1) é uma doença autoimune órgão-específica caracterizada pela destruição seletiva das células pancreáticas produtoras de insulina. A imunossupressão em altas doses seguida do transplante autólogo de células-tronco hematopoéticas (TACTH) constitui uma alternativa terapêutica recente e promissora para o DM-1 recém-diagnosticado, impedindo a progressão da destruição das células pancreáticas produtoras de insulina e induzindo independência insulínica por um período prolongado na maioria dos pacientes. O princípio dessa terapia baseia-se na eliminação das células autorreativas pela imunossupressão intensa e na reconstituição de um sistema imunológico novo e tolerante após o transplante. Com o objetivo de avaliar a função do timo e sua contribuição na geração do repertório de células T nos pacientes com DM-1 após o TACTH, nesse trabalho foram avaliados os níveis de T cell receptor excision circles (TRECs) em células T do sangue periférico e a diversidade do repertório de células T dos pacientes com DM-1 (n=23) antes e em diversos períodos após o transplante. A quantificação absoluta dos níveis de TRECs (número de moléculas de TRECs/100g de DNA) foi realizada pela técnica de PCR em tempo real e a avaliação do repertório de células T foi realizada pela técnica de TCRBV CDR3 Spectratyping. Dentre os vinte e três pacientes, vinte alcançaram a independência insulínica por períodos variáveis de tempo e três não responderam ao tratamento. Não foi observada a restrição do repertório de células T nos pacientes com DM-1 no período pré-transplante, ou seja, quando recém-diagnosticados. Foram identificadas cinco famílias V (7, 18, 19, 20 e 22) em expansão clonal nos pacientes com DM-1. As famílias V 7, 18, 19, 20 apresentaram-se em expansão clonal antes do transplante e se mantiveram com frequência elevada após o transplante, enquanto a família V 22 apresentou aumento da frequência somente nos períodos mais tardios após o transplante. Nos primeiros meses após o transplante, houve redução do número de moléculas de TRECs e restrição do repertório de células T. Contudo, um ano após o transplante, o número de moléculas de TRECs atingiram valores normais e o repertório de células T apresentou-se com ampla diversidade. Nossos resultados mostraram que o TACTH foi capaz de induzir mudanças na composição do repertório de células T dos pacientes com DM-1 após a terapia de IAD/TACTH, evidenciadas por alterações qualitativas e quantitativas dos picos de CDR3 do TCR, sugerindo a reconstituição de um repertório de células T diverso até dois anos pós-transplante. Embora tenha ocorrido reativação da função tímica após o transplante, evidenciada pelo aumento dos níveis de TRECs de um ano e meio a cinco anos pós-transplante, a diversidade do repertório das células T diminuiu a partir de dois anos e meio pós-transplante, sugerindo uma reconstituição tímica de novo de células T naive que expressam preferencialmente algumas cadeias V. Estas evidências imunológicas poderiam explicar a melhora clínica (independência insulínica) temporária observada na maioria dos pacientes após a terapia de IAD/TACTH. / Type 1 diabetes mellitus (T1D) is an organ-specific autoimmune disease characterized by insulin-producing pancreatic cell destruction. High-dose immunosuppression followed by autologous hematopoietic stem cell transplantation (AHSCT) is a recent and promising therapeutic approach for treatment of T1D, preventing the progress of destruction of pancreatic cells and inducing insulin independence for a prolonged period in most patients. The rationale of the AHSCT is based on the elimination of autoreactive cells by the intense immunosuppression and on the reconstitution of a new and tolerant immune system after transplantation. Aiming at assessing the thymic role in the production of new T cell repertoire in T1D patients after AHSCT, in this study was evaluated the levels of T cell receptor excision circles (TRECs) in T cells of peripheral blood as well as the clonality and diversity of T cell repertoire in T1D patients (n=23) before and several periods after transplantation. The absolute quantification of TRECs levels (number of molecules of TRECs/100ng of DNA) was performed by real-time PCR and the analysis of T cell repertoire was performed by TCRBV CDR3 Spectratyping. Among the twenty-three patients, twenty achieved insulin independence for variable periods and three did not respond to the treatment. The T cell repertoire in T1D patients was not restricted in pre-transplantation, i.e., when newly diagnosed. It was identified five V families (7, 18, 19, 20 e 22) in the clonal expansion in T1D patients. The V families 7, 18, 19, 20 were in clonal expansion before transplantation and maintained with high frequency after transplantation, whereas the V 22 family increased its frequency only in the later periods after transplantation. It was observed that the numbers of molecules of TRECs decreased and the T cell repertoire was restricted in the early months after transplantation. However, the levels of TRECs were normalized and the T cell repertoire showed diversity one year after transplantation. Our results indicate that AHSCT was able to induce changes in the composition of the T cell repertoire of patients after AHSCT, evidenced by qualitative and quantitative changes in the composition of T-cell receptor -chain CDR3 peaks, suggesting the reconstitution of diverse T cell repertoire up to two years after transplantation. Although there was reactivation of thymic function after transplantation, as evidenced by increased levels of TRECs from one and a half year to five years after transplantation, the diversity of the T cells repertoire decreased from two and a half years after transplantation, suggesting a reconstruction of new naive T cells that preferentially express some V chains. These immunological evidences could explain the temporary clinical improvement (insulin independence) observed in most patients after IAD / AHSCT therapy.
|
Page generated in 0.0342 seconds