Spelling suggestions: "subject:"visualisation"" "subject:"isualisation""
401 |
Visual User Interface for PDAsRicknäs, Daniel, Stam, Frida January 2003 (has links)
This report is a part of a diploma work, conducted as a part of a Master of Science degree. The diploma work consists of a preliminary study, two case studies, a user study, a paper and this report. It was created at the Linköping University for the department of Science and Technology, in cooperation with Unilever Research in the UK, and partly with the EC founded project, Smartdoc IST-2000-28137. Hand-held, mobile devices like Personal Digital Assistances (PDAs) are becoming increasingly popular in today’s wireless world. While trying to pack all the possible information into a small window, a nightmarish scenario is created for the interface designer to deal with. The goal for this project was to investigate different Visual User Interfaces (VUIs)on PDAs, and how to apply desktop interaction techniques to PDAs. A VUI model based on Zooming User Interface (ZUI) techniques, to adapt two complete different visualisation application areas; on-line brand-based shopping and flood warning system for PDAs, is presented. The on-line brand- based shopping was evaluated in a benchmark usability study comparing it to traditional PC based on-line shopping.
|
402 |
Comparing 3D interfaces of virtual factories : an iconic 3D interface against an abstract 3D visualisationMuñoz, Álvaro Aranda January 2014 (has links)
Context. 3D visualisations are highly demanded in different industries such as virtual factories. However, the benefits that 3D representations can bring to this industry have not been fully explored, being most of the representations either photorealistic or presenting abstract visualisations. Objectives. This thesis explores and compares two prototypes that present a visualisation of the process state of a factory. The first prototype presents a generic interface in which primitive 3D shapes convey the information of the factory status. The second prototype is complemented with specific and iconic 3D models of the factory that help the users associating the conveyed information to the factory flow. The motivation behind this dissertation is that the type of generic interface presented can lead to more reusable interfaces in the future. Methods. For the creation and development of the prototypes, the user-centered design process was followed in which the designs are iterated with users of the factory. Based on the two prototypes, a usability evaluation is conducted to analyse the perceived usability and the usability performance. This is complemented with post-interviews with all the participants. The results are presented attending to the triangulation methodology to support the strength of the qualitative findings. Conclusions. The results show that both interfaces are perceived as highly usable. However, the 3D iconic interface seemed to help the users more in depicting a better mental model of the factory flow, helping the users to complete most of the tasks with faster times. / This thesis explores and compares two prototypes that present a visualisation of the process state of a factory. The first prototype presents a generic interface in which primitive 3D shapes convey the information of the factory status. The second prototype is complemented with specific and iconic 3D models of the factory that help the users associating the conveyed information to the factory flow. The motivation behind this dissertation is that the type of generic interface presented can lead to more reusable interfaces in the future.
|
403 |
Visualising Interval-Based SimulationsPawlik, Amadeusz, Andersson, Henry January 2015 (has links)
Acumen is a language and tool for modeling and simulating cyber-physical systems. It allows the user to conduct simulations using a technique called rigorous simulation that produces results with explicit error bounds, expressed as intervals. This feature can be useful when designing and testing systems where the reliability of results or taking uncertainty into account is important. Unfortunately, analyzing these simulation results can be difficult, as Acumen supports only two ways of presenting them: raw data tables and 2D-plots. These views of the data make certain kinds of analysis cumbersome, such as understanding correlations between variables. This is especially true when the model in question is large. This project proposes a new way of visualising rigorous simulation results in Acumen. The goal of this project is to create a method for visualising intervallic values in 3D, and implement it in Acumen. To achieve that, every span of values is represented as a series of overlapping objects. This family of objects, which constitutes an under-approximation of the true simulation result, is then wrapped inside a semi-translucent box that is a conservative over-approximation of the simulation result. The resulting implementation makes for a combination of mathematical correctness (rigour), and mediation of intervals in question. It enables the user to explore the results of his rigorous simulations as conveniently as with the existing, non-rigorous simulation methods, using the 3D visualisation to simplify the study of real-life problems. To our knowledge, no existing software features visualisation of interval-based simulation results, nor is there any convention for doing this. Some ways in which the proposed solution could be improved are suggested at the end of this report
|
404 |
Study on the cerebrospinal fluid volumes / Étude des volumes du liquide cérébrospinalLebret, Alain 05 December 2013 (has links)
Cette thèse contribue au manque d'outils informatiques pour l'analyse d'images médicales et le diagnostic, en particulier en ce qui concerne l'étude des volumes du liquide cérébrospinal. La première partie concerne la mesure du volume des compartiments du liquide à partir d'images corps entier, pour une population composée d'adultes sains et de patients atteints d'hydrocéphalie. Les images sont obtenues à partir d'une séquence IRM développée récemment et mettant en évidence le liquide par rapport aux structures voisines, de manière à faciliter sa segmentation. Nous proposons une méthode automatique de segmentation et de séparation des volumes permettant une quantification efficace et reproductible. Le ratio des volumes des compartiments sous-arachnoïdien et ventriculaire est constant chez l'adulte sain, ce qui permet de conserver une pression intracrânienne stable. En revanche, il diminue et varie fortement chez les patients atteints d'hydrocéphalie. Ce ratio fournit un index physiologique fiable pour l'aide au diagnostic de la maladie. La seconde partie de la thèse est consacrée à l'analyse de la distribution du liquide dans le compartiment sous-arachnoïdien intracrânial supérieur. Il convient de souligner que ce compartiment, particulièrement complexe d'un point de vue anatomique, demeure peu étudié. Nous proposons deux techniques de visualisation de la distribution du volume liquidien contenu dans ce compartiment, qui produisent des images bidimensionnelles à partir des images d'origine. Ces images permettent de caractériser la distribution du volume liquidien et de son réseau, tout en distinguant les adultes sains des patients souffrant d'hydrocéphalie / This work aims to contribute to the lack of computational methods for medical image analysis and diagnosis about the study of cerebrospinal fluid volumes. In the first part, we focus on the volume assessment of the fluid spaces, from whole body images, in a population consisting of healthy adults and hydrocephalus patients. To help segmentation, these images, obtained from a recent "tissue-specific" magnetic resonance imaging sequence, highlight cerebrospinal fluid unlike its neigh borhood structures. We propose automatic segmentation and separation methods of the different spaces, which allow efficient and reproducible quantification. We show that the ratio of the total subarachnoid space volume to the ventricular one is a proportionality constant for healthy adults, to support a stable intracranial pressure. However, this ratio decreases and varies significantly among patients suffering from hydrocephalus. This ratio provides a reliable physiological index to help in the diagnosis of hydrocephalus. The second part of this work is dedicated to the fluid volume distribution analysis within the superior cortical subarachnoid space. Anatomical complexity of this space induces that it remains poorly studied. We propose two complementary methods to visualize the fluid volume distribution, and which both produce two-dimensional images from the original ones. These images, called relief maps, are used to characterize respectively, the fluid volume distribution and the fluid network, to classify healthy adults and patients with hydrocephalus, and to perform patient monitoring before and after surgery
|
405 |
Etude du perçage et du soudage laser : dynamique du capillaire / Study of drilling and welding laser : dynamics of keyholeMostafa, Massaud 15 December 2011 (has links)
L’objectif de ce travail est d'étudier expérimentalement la formation du capillaire durant le perçage et le soudage par faisceau laser, et de développer une simulation numérique permettant de reproduire la dynamique de formation et d'évolution du capillaire. Nous avons fait le choix d’utiliser comme matériau test le Zinc, en raison de ses propriétés thermodynamiques. Afin de simplifier le problème, nous avons étudié dans un premier temps le mécanisme de perçage. Deux méthodes expérimentales ont été utilisées pour caractériser l'évolution de la géométrie du capillaire : La méthode DODO (Direct Observation of Drilled hOle ) permet de visualiser le capillaire après perçage pour différentes durées et la méthode Zn-Quartz permet d’observer directement son évolution temporelle par camera rapide à travers une lame de quartz. Puis nous avons utilisé cette évolution pour mettre au point une simulation du mécanisme de perçage. Après avoir étudié le dépôt de puissance à l’intérieur d’un capillaire en tenant compte des réflexions multiples et estimé l'importance de la perte d'énergie et de matière lors du processus, nous avons développé une simulation en utilisant le logiciel Comsol Multiphysics couplant l'équation thermique, l'équation de Navier Stokes et prenant en compte le déplacement du métal fondu sous l’action de la pression de recul. Dans ce cas, on observe la formation d’un bourrelet important au bord du trou et une augmentation de la profondeur du capillaire. Ensuite nous avons étudié la formation du capillaire durant le soudage laser, c'est-à-dire avec déplacement de la source. A partir des techniques mises en œuvre pour l’étude du perçage nous avons obtenu l’évolution de la forme du capillaire dans le cas du soudage Zn/Quartz. Nous avons réalisé une simulation relativement simple en supposant la géométrie et la température du capillaire connues a priori. Nous avons constaté qu’un modèle simple, modélisant uniquement les transferts thermiques par conduction, permet de bien simuler la forme de la zone fondue pour les couples Zn/Zn et Zn-quartz. / The aim of the present work is to study experimentally the formation of the capillary during the drilling and welding by laser beam and to develop the numerical simulation which allows following the dynamics and the evolution of the keyhole. The zinc was chosen as a test material because its thermodynamical properties are well known. To simplify the problem, in the first place the drilling mechanism was studied. Two experimental methods were used to characterize the evolution of the keyhole: the Direct Observation of Drilled Hole method, which allows the visualization of the keyhole after the application of laser pulses of different durations, and Zn-Quartz method, which allows the direct observation of keyhole evolution with CCD camera through the layer of quartz. Then, the information on keyhole evolution was used to develop the simulation of drilling mechanism. After studying the beam power deposition inside the capillary with taking in account the multiple photon reflections, and after estimation of the energy and matter loss during the process, we developed the simulation with FEM software COMSOL Multiphysics, which contains coupled heat transfer, fluid flow and free surface problem allowing considering the effect of recoil pressure on liquid phase ejection. We could observe the formation of an important bolster surrounding the keyhole and the increase of keyhole depth with time. Next, we studied the formation of the keyhole during the laser welding, in other words, during the displacement of the heat source. Using the same technique that was developed for laser drilling, we have obtained the information on keyhole evolution during zinc-quartz welding. We have created the simple simulation, where keyhole temperature and profile were considered as known a priori. We have stated that this model, which takes in account only conduction heat transfer problem, allows to reproduce well the shape of the melted zone both for zinc-zinc and zinc-quartz couples
|
406 |
Emotion recognition from speech using prosodic featuresVäyrynen, E. (Eero) 29 April 2014 (has links)
Abstract
Emotion recognition, a key step of affective computing, is the process of decoding an embedded emotional message from human communication signals, e.g. visual, audio, and/or other physiological cues. It is well-known that speech is the main channel for human communication and thus vital in the signalling of emotion and semantic cues for the correct interpretation of contexts. In the verbal channel, the emotional content is largely conveyed as constant paralinguistic information signals, from which prosody is the most important component. The lack of evaluation of affect and emotional states in human machine interaction is, however, currently limiting the potential behaviour and user experience of technological devices.
In this thesis, speech prosody and related acoustic features of speech are used for the recognition of emotion from spoken Finnish. More specifically, methods for emotion recognition from speech relying on long-term global prosodic parameters are developed. An information fusion method is developed for short segment emotion recognition using local prosodic features and vocal source features. A framework for emotional speech data visualisation is presented for prosodic features.
Emotion recognition in Finnish comparable to the human reference is demonstrated using a small set of basic emotional categories (neutral, sad, happy, and angry). A recognition rate for Finnish was found comparable with those reported in the western language groups. Increased emotion recognition is shown for short segment emotion recognition using fusion techniques. Visualisation of emotional data congruent with the dimensional models of emotion is demonstrated utilising supervised nonlinear manifold modelling techniques. The low dimensional visualisation of emotion is shown to retain the topological structure of the emotional categories, as well as the emotional intensity of speech samples.
The thesis provides pattern recognition methods and technology for the recognition of emotion from speech using long speech samples, as well as short stressed words. The framework for the visualisation and classification of emotional speech data developed here can also be used to represent speech data from other semantic viewpoints by using alternative semantic labellings if available. / Tiivistelmä
Emootiontunnistus on affektiivisen laskennan keskeinen osa-alue. Siinä pyritään ihmisen kommunikaatioon sisältyvien emotionaalisten viestien selvittämiseen, esim. visuaalisten, auditiivisten ja/tai fysiologisten vihjeiden avulla. Puhe on ihmisten tärkein tapa kommunikoida ja on siten ensiarvoisen tärkeässä roolissa viestinnän oikean semanttisen ja emotionaalisen tulkinnan kannalta. Emotionaalinen tieto välittyy puheessa paljolti jatkuvana paralingvistisenä viestintänä, jonka tärkein komponentti on prosodia. Tämän affektiivisen ja emotionaalisen tulkinnan vajaavaisuus ihminen-kone – interaktioissa rajoittaa kuitenkin vielä nykyisellään teknologisten laitteiden toimintaa ja niiden käyttökokemusta.
Tässä väitöstyössä on käytetty puheen prosodisia ja akustisia piirteitä puhutun suomen emotionaalisen sisällön tunnistamiseksi. Työssä on kehitetty pitkien puhenäytteiden prosodisiin piirteisiin perustuvia emootiontunnistusmenetelmiä. Lyhyiden puheenpätkien emotionaalisen sisällön tunnistamiseksi on taas kehitetty informaatiofuusioon perustuva menetelmä käyttäen prosodian sekä äänilähteen laadullisten piirteiden yhdistelmää. Lisäksi on kehitetty teknologinen viitekehys emotionaalisen puheen visualisoimiseksi prosodisten piirteiden avulla.
Tutkimuksessa saavutettiin ihmisten tunnistuskykyyn verrattava automaattisen emootiontunnistuksen taso käytettäessä suppeaa perusemootioiden joukkoa (neutraali, surullinen, iloinen ja vihainen). Emootiontunnistuksen suorituskyky puhutulle suomelle havaittiin olevan verrannollinen länsieurooppalaisten kielten kanssa. Lyhyiden puheenpätkien emotionaalisen sisällön tunnistamisessa saavutettiin taas parempi suorituskyky käytettäessä fuusiomenetelmää. Emotionaalisen puheen visualisoimiseksi kehitetyllä opetettavalla epälineaarisella manifoldimallinnustekniikalla pystyttiin tuottamaan aineistolle emootion dimensionaalisen mallin kaltainen visuaalinen rakenne. Mataladimensionaalisen kuvauksen voitiin edelleen osoittaa säilyttävän sekä tutkimusaineiston emotionaalisten luokkien että emotionaalisen intensiteetin topologisia rakenteita.
Tässä väitöksessä kehitettiin hahmontunnistusmenetelmiin perustuvaa teknologiaa emotionaalisen puheen tunnistamiseksi käytettäessä sekä pitkiä että lyhyitä puhenäytteitä. Emotionaalisen aineiston visualisointiin ja luokitteluun kehitettyä teknologista kehysmenetelmää käyttäen voidaan myös esittää puheaineistoa muidenkin semanttisten rakenteiden mukaisesti.
|
407 |
Verification of timed automata : reachability, liveness and modelling / Vérification d'automates temporisés : sûreté, vivacité et modélisationTran, Thanh tung 04 November 2016 (has links)
Cette thèse revisite les algorithmes standards pour les problèmes d'accessibilité et de vivacité des automates temporisés. L'algorithme standard pour tester l'accessibilité consiste à utiliser l'inclusion de zones pour explorer efficacement un arbre de recherche abstrait. Cependant, l'ordre du parcours du graphe a une forte incidence sur l'efficacité de l'algorithme. Dans cette thèse nous introduisons deux stratégies, nommées ranking et waiting, et une combinaison des deux. De nombreux exemples montrent que la combinaison des deux stratégies aide l'algorithme d'accessibilité à éviter des explorations non nécessaires. Le problème de vivacité est couramment vérifiées par l'analyse des cycles dans l'automate temporisé. Contrairement à l'algorithme d'accessibilité, l'algorithme pour l'analyse de vivacité ne peut pas librement utiliser l'inclusion de zones. Par conséquent, il y a des situations où l'algorithme doit faire une longue exploration avant de conclure l'existence d'un cycle. Nous proposons une analyse accélérée des cycles, nommées w-iterability checking, qui permet d'améliorer la performance de l'algorithme de vivacité des automates temporisés. En plus, nous proposons une modélisation du mécanisme de démarrage du protocole FlexRay. La modélisation permet à vérifier le mécanisme dans configurations différents du réseau FlexRay. Nous présentons également un outil de visualisation qui aide à mieux comprendre le fonctionnement des algorithmes d'analyse. / This thesis revisits the standard algorithms for reachability and liveness analysis of timed automata. The standard algorithm for reachability analysis consists in using zone inclusion to efficiently explore a finite abstract zone graph of a timed automaton. It has been observed that the search order may strongly affect the performance of the algorithm. For the same algorithm, one search order may introduce a lot more exploration than another. In order to deal with the search order problem, we propose two strategies, named ranking strategy and waiting strategy, and a combination of the two. We show on a number of examples, the combining strategy helps to reduce unnecessary exploration in the standard algorithms. The standard algorithm for liveness analysis consists in looking for reachability of cycles in timed automata. But unlike the algorithm for safety analysis, the algorithm for liveness analysis cannot freely use zone inclusion. Consequently, there are situations where the algorithm has to perform a long exploration before reporting the result. In this thesis, we propose an accelerated checking for cycles in timed automata, named !-iterability checking, to improve the performance of the state-of-the-art algorithm for liveness analysis of timed automata. Furthermore, we present a new model for the startup procedure of FlexRay. The model allows to verify the procedure on different configurations of FlexRay networks. It also allows to evaluate the performance of our new strategies for safety analysis of timed automata. In addition, we present a methodology that uses visualization tools to get more insights into the execution of the algorithms.
|
408 |
Reconstruction spatio-temporelle de la ville de Reims à partir de documents anciens / Spatio-temporal reconstruction of the city of Reims relying on old documentsYounes, Lara 04 December 2014 (has links)
Ces travaux de thèse constituent la première étape d'une réflexion sur la conception d'un système participatif visant la reconstruction et la visualisation de l'espace urbain de la ville de Reims au cours du temps. Dans ces travaux, nous abordons les problèmes de reconnaissance, de reconstruction et géoréférencement spatio-temporel. Ce projet s'appuie sur l'exploitation des sources historiques iconographiques et contextuelles hétérogènes et éparses, dont une collection de cartes postales anciennes et le cadastre actuel géoréférencé.Dans l'objectif d'un travail participatif, il s'avère nécessaire de procurer une aide efficace à l'utilisateur lorsqu'il apporte de nouvelles connaissances dans le système. Une solution robuste doit être apportée en raison de multiples évolutions ou déformations du modèle urbain à travers le temps. Nous avons développé une solution répondant à ce besoin. Elle s'appuie sur des briques de traitement complémentaires, en interaction avec l'utilisateur et s'insère naturellement dans une approche incrémentale de reconstruction. Nous proposons une solution permettant d'extraire, de reconstruire en 3D et de visualiser des bâtiments multi-façades présents dans les cartes postales sans disposer des dimensions réelles des bâtiments. La construction du modèle repose sur l'identification de façades 2D. Elle est obtenue au travers de l'analyse du contenu de l'image. Cette phase d'identification permet de procéder à la reconstruction de modèles 3D, d'extraire des textures 2D associées à ces modèles ainsi que d'enrichir dynamiquement notre système. Les caractéristiques retrouvées dans les images infèrent une estimation sur leur datation, et l'alignement des modèles reconstruits avec le cadastre sur le géoréférencement des bâtiments. Le système ainsi construit constitue une amorce pour la conception d'un système d'information géographique participatif 3D+T permettant aux citoyens de Reims de s'approprier l'histoire de leur ville. / This thesis is the first step toward the design of a Volunteered system for the reconstruction and visualization of urban space in the city of Reims through time. In this work, we address the problems of spatio-temporal recognition, reconstruction and georeferencing. This project relies on the use of heterogeneous and sparse iconographic and contextual historical data, particularly a collection of old postcards and the current cadastral map.With the aim of a Volunteered work, it is necessary to provide useful help to the user when bringing new knowledge into the system. A robust solution is required due to multiple changes of the urban model through time. We have developed a solution to meet those needs. This process fits in an incremental approach of reconstruction and will be completed by a user. We propose to extract, reconstruct and visualize 3D multi-façade buildings from old postcards with no knowledge on their real dimensions. The construction of the models is based on 2D façades identification. It can be obtained through image analysis. This identification allows the reconstruction of 3D models, the extraction of their associated 2D façades textures and the enhancement of the system. The features found in the images infer an estimate of their dating, and the alignment of the models with the cadastral map allows there georeferencing. The system thus constructed is a primer for the design of a Volunteered 3D+T GIS for Reims citizens to capture the history of their city.
|
409 |
Étude expérimentale et numérique des écoulements diphasiques et du diagnostic des échangeurs industriels à plaques et ondes / Experimental and numerical studies of two phase flow distribution and diagnostic of plate and fin industrial heat exchangersSaad, Selma Ben 24 January 2012 (has links)
Ce travail concerne l'étude expérimentale et numérique de la distribution simple et double phase dans un échangeur à plaques et ondes. Des mesures expérimentales de débit et de pression et des visualisations par caméra rapide ont permis de caractériser l'écoulement du mélange eau/air à la pression atmosphérique et dans des conditions adiabatiques. Les simulations numériques par CFD ont permis de caractériser les pertes de charges en simple phase dans les ondes « serrated » et de simuler les régimes d'écoulement diphasiques (bulles, poches, bulles toriques,...) au niveau du distributeur. Des traçages au sel analysé par conductimétrie ont permis de caractériser les régimes d'écoulement diphasiques et de faire le diagnostic de l'échangeur : déterminer les défauts, leurs amplitudes et leurs localisations. Ces trois moyens : visualisation et mesure expérimentale des distributions des phases et des pertes de charges, simulation de type CFD et traçage ont mis en évidence les paramètres influant sur la distribution comme les alimentations des fluides, les propriétés physiques des fluides, la géométrie du distributeur, les régimes d'écoulement, afin d'améliorer les performances des systèmes avec échange thermique / This work deals with experimental and numerical studies of single and two-phase flow distribution in a plate and fin heat exchanger. Flow rates and pressure measurements, as well as visualization using speed camera have been used to characterize the air/water flow at atmospheric pressure and at adiabatic conditions. CFD simulations have permitted to calculate pressure drop in single phase flow of offset strip fins and to simulate two phase flow patterns (bubbles, slug, toric bubbles,...) in the distributor. Tracer experiments using salt and conductimetry allowed to characterize single and two phase flow distribution and to perform a diagnosis of the heat exchanger: find the defaults, their amplitudes and their localizations. All these methods: experimental data, CFD simulations and tracer methodology allowed to point out the important parameters affecting the distribution like same or opposed inlet fluid alimentations, physical properties, distributor design and the flow patterns, to improve overall performances of heat transfer systems
|
410 |
Development of new computational methods for a synthetic gene set annotation / Développement de nouvelles méthodes informatiques pour une annotation synthétique d’un ensemble de gènes.Ayllón-Benítez, Aarón 05 December 2019 (has links)
Les avancées dans l'analyse de l'expression différentielle de gènes ont suscité un vif intérêt pour l'étude d'ensembles de gènes présentant une similarité d'expression au cours d'une même condition expérimentale. Les approches classiques pour interpréter l'information biologique reposent sur l'utilisation de méthodes statistiques. Cependant, ces méthodes se focalisent sur les gènes les plus connus tout en générant des informations redondantes qui peuvent être éliminées en prenant en compte la structure des ressources de connaissances qui fournissent l'annotation. Au cours de cette thèse, nous avons exploré différentes méthodes permettant l'annotation d'ensembles de gènes.Premièrement, nous présentons les solutions visuelles développées pour faciliter l'interprétation des résultats d'annota-tion d'un ou plusieurs ensembles de gènes. Dans ce travail, nous avons développé un prototype de visualisation, appelé MOTVIS, qui explore l'annotation d'une collection d'ensembles des gènes. MOTVIS utilise ainsi une combinaison de deux vues inter-connectées : une arborescence qui fournit un aperçu global des données mais aussi des informations détaillées sur les ensembles de gènes, et une visualisation qui permet de se concentrer sur les termes d'annotation d'intérêt. La combinaison de ces deux visualisations a l'avantage de faciliter la compréhension des résultats biologiques lorsque des données complexes sont représentées.Deuxièmement, nous abordons les limitations des approches d'enrichissement statistique en proposant une méthode originale qui analyse l'impact d'utiliser différentes mesures de similarité sémantique pour annoter les ensembles de gènes. Pour évaluer l'impact de chaque mesure, nous avons considéré deux critères comme étant pertinents pour évaluer une annotation synthétique de qualité d'un ensemble de gènes : (i) le nombre de termes d'annotation doit être réduit considérablement tout en gardant un niveau suffisant de détail, et (ii) le nombre de gènes décrits par les termes sélectionnés doit être maximisé. Ainsi, neuf mesures de similarité sémantique ont été analysées pour trouver le meilleur compromis possible entre réduire le nombre de termes et maintenir un niveau suffisant de détails fournis par les termes choisis. Tout en utilisant la Gene Ontology (GO) pour annoter les ensembles de gènes, nous avons obtenu de meilleurs résultats pour les mesures de similarité sémantique basées sur les nœuds qui utilisent les attributs des termes, par rapport aux mesures basées sur les arêtes qui utilisent les relations qui connectent les termes. Enfin, nous avons développé GSAn, un serveur web basé sur les développements précédents et dédié à l'annotation d'un ensemble de gènes a priori. GSAn intègre MOTVIS comme outil de visualisation pour présenter conjointement les termes représentatifs et les gènes de l'ensemble étudié. Nous avons comparé GSAn avec des outils d'enrichissement et avons montré que les résultats de GSAn constituent un bon compromis pour maximiser la couverture de gènes tout en minimisant le nombre de termes.Le dernier point exploré est une étape visant à étudier la faisabilité d'intégrer d'autres ressources dans GSAn. Nous avons ainsi intégré deux ressources, l'une décrivant les maladies humaines avec Disease Ontology (DO) et l'autre les voies métaboliques avec Reactome. Le but était de fournir de l'information supplémentaire aux utilisateurs finaux de GSAn. Nous avons évalué l'impact de l'ajout de ces ressources dans GSAn lors de l'analyse d’ensembles de gènes. L'intégration a amélioré les résultats en couvrant d'avantage de gènes sans pour autant affecter de manière significative le nombre de termes impliqués. Ensuite, les termes GO ont été mis en correspondance avec les termes DO et Reactome, a priori et a posteriori des calculs effectués par GSAn. Nous avons montré qu'un processus de mise en correspondance appliqué a priori permettait d'obtenir un plus grand nombre d'inter-relations entre les deux ressources. / The revolution in new sequencing technologies, by strongly improving the production of omics data, is greatly leading to new understandings of the relations between genotype and phenotype. To interpret and analyze data grouped according to a phenotype of interest, methods based on statistical enrichment became a standard in biology. However, these methods synthesize the biological information by a priori selecting the over-represented terms and focus on the most studied genes that may represent a limited coverage of annotated genes within a gene set. During this thesis, we explored different methods for annotating gene sets. In this frame, we developed three studies allowing the annotation of gene sets and thus improving the understanding of their biological context.First, visualization approaches were applied to represent annotation results provided by enrichment analysis for a gene set or a repertoire of gene sets. In this work, a visualization prototype called MOTVIS (MOdular Term VISualization) has been developed to provide an interactive representation of a repertoire of gene sets combining two visual metaphors: a treemap view that provides an overview and also displays detailed information about gene sets, and an indented tree view that can be used to focus on the annotation terms of interest. MOTVIS has the advantage to solve the limitations of each visual metaphor when used individually. This illustrates the interest of using different visual metaphors to facilitate the comprehension of biological results by representing complex data.Secondly, to address the issues of enrichment analysis, a new method for analyzing the impact of using different semantic similarity measures on gene set annotation was proposed. To evaluate the impact of each measure, two relevant criteria were considered for characterizing a "good" synthetic gene set annotation: (i) the number of annotation terms has to be drastically reduced while maintaining a sufficient level of details, and (ii) the number of genes described by the selected terms should be as large as possible. Thus, nine semantic similarity measures were analyzed to identify the best possible compromise between both criteria while maintaining a sufficient level of details. Using GO to annotate the gene sets, we observed better results with node-based measures that use the terms’ characteristics than with edge-based measures that use the relations terms. The annotation of the gene sets achieved with the node-based measures did not exhibit major differences regardless of the characteristics of the terms used. Then, we developed GSAn (Gene Set Annotation), a novel gene set annotation web server that uses semantic similarity measures to synthesize a priori GO annotation terms. GSAn contains the interactive visualization MOTVIS, dedicated to visualize the representative terms of gene set annotations. Compared to enrichment analysis tools, GSAn has shown excellent results in terms of maximizing the gene coverage while minimizing the number of terms.At last, the third work consisted in enriching the annotation results provided by GSAn. Since the knowledge described in GO may not be sufficient for interpreting gene sets, other biological information, such as pathways and diseases, may be useful to provide a wider biological context. Thus, two additional knowledge resources, being Reactome and Disease Ontology (DO), were integrated within GSAn. In practice, GO terms were mapped to terms of Reactome and DO, before and after applying the GSAn method. The integration of these resources improved the results in terms of gene coverage without affecting significantly the number of involved terms. Two strategies were applied to find mappings (generated or extracted from the web) between each new resource and GO. We have shown that a mapping process before computing the GSAn method allowed to obtain a larger number of inter-relations between the two knowledge resources.
|
Page generated in 0.1518 seconds