311 |
Étude sur l’influence du vocabulaire utilisé pour l’indexation des images en contexte de repérage multilingueMénard, Elaine 27 November 2008 (has links)
Depuis quelques années, Internet est devenu un média incontournable pour la diffusion de ressources multilingues. Cependant, les différences linguistiques constituent souvent un obstacle majeur aux échanges de documents scientifiques, culturels, pédagogiques et commerciaux. En plus de cette diversité linguistique, on constate le développement croissant de bases de données et de collections composées de différents types de documents textuels ou multimédias, ce qui complexifie également le processus de repérage documentaire. En général, on considère l’image comme « libre » au point de vue linguistique. Toutefois, l’indexation en vocabulaire contrôlé ou libre (non contrôlé) confère à l’image un statut linguistique au même titre que tout document textuel, ce qui peut avoir une incidence sur le repérage.
Le but de notre recherche est de vérifier l’existence de différences entre les caractéristiques de deux approches d’indexation pour les images ordinaires représentant des objets de la vie quotidienne, en vocabulaire contrôlé et en vocabulaire libre, et entre les résultats obtenus au moment de leur repérage. Cette étude suppose que les deux approches d’indexation présentent des caractéristiques communes, mais également des différences pouvant influencer le repérage de l’image. Cette recherche permet de vérifier si l’une ou l’autre de ces approches d’indexation surclasse l’autre, en termes d’efficacité, d’efficience et de satisfaction du chercheur d’images, en contexte de repérage multilingue.
Afin d’atteindre le but fixé par cette recherche, deux objectifs spécifiques sont définis : identifier les caractéristiques de chacune des deux approches d’indexation de l’image ordinaire représentant des objets de la vie quotidienne pouvant influencer le repérage, en contexte multilingue et exposer les différences sur le plan de l’efficacité, de l’efficience et de la satisfaction du chercheur d’images à repérer des images ordinaires représentant des objets de la vie quotidienne indexées à l’aide d’approches offrant des caractéristiques variées, en contexte multilingue. Trois modes de collecte des données sont employés : l’analyse des termes utilisés pour l’indexation des images, la simulation du repérage d’un ensemble d’images indexées selon chacune des formes d’indexation à l’étude réalisée auprès de soixante répondants, et le questionnaire administré aux participants pendant et après la simulation du repérage. Quatre mesures sont définies pour cette recherche : l’efficacité du repérage d’images, mesurée par le taux de succès du repérage calculé à l’aide du nombre d’images repérées; l’efficience temporelle, mesurée par le temps, en secondes, utilisé par image repérée; l’efficience humaine, mesurée par l’effort humain, en nombre de requêtes formulées par image repérée et la satisfaction du chercheur d’images, mesurée par son autoévaluation suite à chaque tâche de repérage effectuée.
Cette recherche montre que sur le plan de l’indexation de l’image ordinaire représentant des objets de la vie quotidienne, les approches d’indexation étudiées diffèrent fondamentalement l’une de l’autre, sur le plan terminologique, perceptuel et structurel. En outre, l’analyse des caractéristiques des deux approches d’indexation révèle que si la langue d’indexation est modifiée, les caractéristiques varient peu au sein d’une même approche d’indexation. Finalement, cette recherche souligne que les deux approches d’indexation à l’étude offrent une performance de repérage des images ordinaires représentant des objets de la vie quotidienne différente sur le plan de l’efficacité, de l’efficience et de la satisfaction du chercheur d’images, selon l’approche et la langue utilisées pour l’indexation. / During the last few years, the Internet has become an indispensable medium for the dissemination of multilingual resources. However, language differences are often a major obstacle to the exchange of scientific, cultural, educational and commercial documents. Besides this linguistic diversity, many databases and collections now contain documents in various formats that can also adversely affect their retrieval process. In general, images are considered to be language-independent resources. Nevertheless, the image indexing process using either a controlled or uncontrolled vocabulary gives the image a linguistic status similar to any other textual document and thus leads to the same difficulties in their retrieval.
The goal of our research is to first identify the differences between the indexing approaches using a controlled and an uncontrolled vocabulary for ordinary images of everyday-life objects and to then differentiate between the results obtained at the time of image retrieval. This study supposes that the two indexing approaches show not only common characteristics, but also differences that can influence image retrieval. Thus, this research makes it possible to indicate if one of these indexing approaches surpasses the other in terms of effectiveness, efficiency, and satisfaction of the image searcher in a multilingual retrieval context.
For this study, two specific objectives are defined: to identify the characteristics of each approach used for ordinary image indexing of everyday-life objects that can effect image retrieval in a multilingual context; and to explore the differences between the two indexing approaches in terms of their effectiveness, their efficiency, and the satisfaction of the image searcher when trying to retrieve ordinary images of everyday-life objects indexed according to either approach in a multilingual retrieval context. Three methods of data collection are used: an analysis of the image indexing terms, a simulation of the retrieval of a set of images indexed according to each of the two indexing approaches conducted with sixty respondents, and a questionnaire submitted to the participants during and after the retrieval simulation. Four measures are defined in this research: the effectiveness of image retrieval measured by the success rate calculated in terms of the number of retrieved images; time efficiency measured by the average time, in seconds, used to retrieve an image; human efficiency measured in terms of the human effort represented per average number of queries necessary to retrieve an image; and the satisfaction of the image searcher measured by the self-evaluation of the participant of the retrieval process after each completed task.
This research shows that in terms of ordinary image indexing representing everyday-life objects, the two approaches investigated are fundamentally distinct on the terminological, perceptual, and structural perspective. Additionally, the analysis of the characteristics of the two indexing approaches reveals that if the indexing language differs, the characteristics vary little within the same indexing approach. Finally, this research underlines that the two indexing approaches of ordinary images representing everyday-life objects have a retrieval performance that is different in terms of its effectiveness, efficiency, and satisfaction of the image searcher according to the approach and the language used for indexing.
|
312 |
De l'usage des métadonnées dans l'objet sonoreDebaecker, Jean 12 October 2012 (has links) (PDF)
La reconnaissance des émotions dans la musique est un challenge industriel et académique. À l'heure de l'explosion des contenus multimédias, il devient nécessaire de concevoir des ensembles structurés de termes et concepts facilitant l'organisation et l'accès aux connaissances. Dans les bibliothèques musicales, l'analyse des sentiments et la classification par émotion sont très émergentes et demeurent un objet de recherche ambitieux. La gestion des contenus d'un objet sonaore numérisé répond à une indexation documentaire à trois niveaux : " contenu - auctorialité - matérialisation ". Ce triptyque nous semble tomber en désuétude et ne correspond plus aux attentes de l'usager. L'information musicale appelle ainsi à une production et représentation nouvelle. Notre problématique est la suivante : est-il possible d'avoir une connaissance a priori de l'émotion en vue de son élicitation ? Autrement dit, dans quelles mesures est-il possible de bâtir une structure formelle algorithmique permettant d'isoler le mécanisme déclencheur des émotions? Est-il possible de connaître l'émotion que l'on ressentira à l'écoute d'une chanson, avant de l'écouter ? Suite à l'écoute, son élicitation est-elle possible ? Est-il possible de formaliser une émotion dans le but de la sauvegarder et, ou, de la partager ? Dans ce travail de thèse, nous proposons d'abord un aperçu de l'existant et du contexte applicatif. Plusieurs scénarios très concrets sont envisageables, parmi eux : un répondeur téléphonique triant les messages enregistrés en fonction de leur humeur ; recherche de musique apaisante après une journée de travail ; recherche de musique excitante pour accompagner une activité sportive ; recherche d'opinions sur les réseaux sociaux, etc. ; Dans une seconde partie nous proposons une réflexion sur les enjeux épistémologiques intrinsèques et liés à l'indexation même de l'émotion. La " mise en œuvre d'une solution d'indexation automatique fait appel à de nombreux domaines scientifiques ".1 Afin de saisir la complexité de l'indexation de l'émotion pour l'enrichissement des métadonnées, nous allons adopter une méthodologie exploratoire interdisciplinaire. En effet, à travers une démarche psychologique, physiologique et philosophique, nous proposerons un cadre conceptuel de cinq démonstrations faisant état de l'impossible mesure de l'émotion, en vue de son élicitation. Une fois dit, à travers notre cadre théorique, qu'il est formellement impossible d'indexer les émotions ; il nous incombe de comprendre la mécanique d'indexation cependant proposée par les industriels et académiques. La réalité du terrain est telle que plusieurs interfaces web ou logicielles proposent des services d'expérience de moteur de recherche fouillant une base de données, avec des métadonnées sur les émotions. Dans la dernière partie, nous proposerons, via des enquêtes quantitatives et qualitatives, une analyse afin de soumettre une matrice algorithmique basée sur le web social capable de faire des préconisations d'écoute d'œuvres musicales eu égards aux émotions.
|
313 |
Analyse et interprétation de scènes visuelles par approches collaborativesStrat, Sabin Tiberius 04 December 2013 (has links) (PDF)
Les dernières années, la taille des collections vidéo a connu une forte augmentation. La recherche et la navigation efficaces dans des telles collections demande une indexation avec des termes pertinents, ce qui nous amène au sujet de cette thèse, l'indexation sémantique des vidéos. Dans ce contexte, le modèle Sac de Mots (BoW), utilisant souvent des caractéristiques SIFT ou SURF, donne de bons résultats sur les images statiques. Notre première contribution est d'améliorer les résultats des descripteurs SIFT/SURF BoW sur les vidéos en pré-traitant les vidéos avec un modèle de rétine humaine, ce qui rend les descripteurs SIFT/SURF BoW plus robustes aux dégradations vidéo et qui leurs donne une sensitivité à l'information spatio-temporelle. Notre deuxième contribution est un ensemble de descripteurs BoW basés sur les trajectoires. Ceux-ci apportent une information de mouvement et contribuent vers une description plus riche des vidéos. Notre troisième contribution, motivée par la disponibilité de descripteurs complémentaires, est une fusion tardive qui détermine automatiquement comment combiner un grand ensemble de descripteurs et améliore significativement la précision moyenne des concepts détectés. Toutes ces approches sont validées sur les bases vidéo du challenge TRECVid, dont le but est la détection de concepts sémantiques visuels dans un contenu multimédia très riche et non contrôlé.
|
314 |
Contributions to 3D-shape matching, retrieval and classificationTabia, Hedi 27 September 2011 (has links) (PDF)
Une nouvelle approche pour la mise en correspondance des objets 3D en présence des transformations non-rigides et des modèles partiellement similaires est proposée dans le cadre de cette thèse. L'approche est composée de deux phases. Une première phase pour la description d'objets et une deuxième phase de mesure de similarité. Pour décrire un objet 3D, nous avons choisi une méthode basée sur des descripteurs locaux. La méthode consiste à extraire d'un objet 3D un ensemble de points caractéristiques pour lesquels deux descripteurs locaux sont calculés. Le premier descripteur Geodesic cord descriptor représente la distribution des distances géodésiques entre un point caractéristique et l'ensemble des points de la surface de l'objet 3D. Le deuxième descripteur Curve based descriptor permet de représenter la surface 3D de l'objet par un ensemble de courbes. La forme de ces courbes est analysée à l'aide d'outils issus de la géométrie Riemannienne. Pour mesurer la similarité entre les objets 3D, nous avons utilisé deux techniques différentes dont l'une est basée sur les fonctions de croyance et l'autre est basée sur les sac-de-mots. Afin de valider notre approche nous l'avons adaptée à deux applications différentes à savoir la recherche et la classification d'objets 3D. Les résultats obtenus sur différent benchmarks montrent une efficacité et une pertinence comparés avec les autres méthodes de l'état-de-l'art.
|
315 |
Détection robuste de jonctions et points d'intérêt dans les images et indexation rapide de caractéristiques dans un espace de grande dimension / Robust junction for line-drawing images and time-efficient feature indexing in feature vector spacePham, The Anh 27 November 2013 (has links)
Les caractéristiques locales sont essentielles dans de nombreux domaines de l’analyse d’images comme la détection et la reconnaissance d’objets, la recherche d’images, etc. Ces dernières années, plusieurs détecteurs dits locaux ont été proposés pour extraire de telles caractéristiques. Ces détecteurs locaux fonctionnent généralement bien pour certaines applications, mais pas pour toutes. Prenons, par exemple, une application de recherche dans une large base d’images. Dans ce cas, un détecteur à base de caractéristiques binaires pourrait être préféré à un autre exploitant des valeurs réelles. En effet, la précision des résultats de recherche pourrait être moins bonne tout en restant raisonnable, mais probablement avec un temps de réponse beaucoup plus court. En général, les détecteurs locaux sont utilisés en combinaison avec une méthode d’indexation. En effet, une méthode d’indexation devient nécessaire dans le cas où les ensembles de points traités sont composés de milliards de points, où chaque point est représenté par un vecteur de caractéristiques de grande dimension. / Local features are of central importance to deal with many different problems in image analysis and understanding including image registration, object detection and recognition, image retrieval, etc. Over the years, many local detectors have been presented to detect such features. Such a local detector usually works well for some particular applications but not all. Taking an application of image retrieval in large database as an example, an efficient method for detecting binary features should be preferred to other real-valued feature detection methods. The reason is easily seen: it is expected to have a reasonable precision of retrieval results but the time response must be as fast as possible. Generally, local features are used in combination with an indexing scheme. This is highly needed for the case where the dataset is composed of billions of data points, each of which is in a high-dimensional feature vector space.
|
316 |
La classification à facettes pour la gestion des connaissances métier : méthodologie d’élaboration de FolkClassifications à facettes / Faceted Classification for Knowledge Management in specific trades, Method for the development of FolkFaceted ClassificationsDesfriches Doria, Orélie 26 November 2013 (has links)
Tout d’abord, nous abordons les problématiques liées à l’organisation et à la gestion des connaissances ainsi que les principes présidant à l’élaboration des classifications à facettes. Nous proposons ensuite une synthèse des méthodes existantes d’élaboration de classifications à facettes. Nous poursuivons en réalisant une analyse de l’impact des types de Systèmes d’Information sur l’activité de gestion de l’information. Ce faisant, nous produisons une analyse de l’activité inspirée de la Théorie de l’Activité, et influencée par les travaux de la psychologie du travail et de l’ergonomie cognitive. Le prototype Hypertagging développé dans le cadre du projet Miipa-Doc fondé sur le tagging des utilisateurs et structuré par les principes de la classification à facettes est présenté. Notre expérimentation sur l’élaboration de classifications à facettes pour la gestion des documents de travail est détaillée. Enfin, nous exposons notre méthodologie d’élaboration de FolkClassifications à facettes pour la gestion des connaissances métier. Elle vise à appuyer une démarche de gestion des connaissances sur la gestion personnelle de l’information / We address Knowledge Organization and Knowldege Management general issues and we present the basic principles for the development of faceted classifications. Then we introduce a synthesis of existing methods to develop this kind of classification. Next we propose an analysis of effects of Information Systems on information management activities. By doing this, we produce an analysis of the concept of activity inspired by Activity Theory, occupational psychology and french ergonomics. A presentation of Hypertagging prototype developed in the frame of Miipa-Doc research project, based on users tagging and structured by faceted classification principles, is provided. Our experiment about generating faceted classification for document management activities is detailed. Finally, we expose our method for the development of faceted classification for Knowledge Management purposes in the context of specific trades. This Knowledge Management approach is incorporated in Knowledge Organization activities.
|
317 |
Faculté imaginale du roman et fonction de médiation : vers la construction d’un domaine info-littéraire / Imaginal faculty of novel and mediation function : towards the construction of an info-literary fieldArchambault, Michèle 30 November 2012 (has links)
La thèse, qui pose la question de la description du roman et envisage une réponse par l’interrogation d’une problématique documentaire (proposition d’un modèle théorique de représentation, base pour la conception et la réalisation d’outils de navigation raisonnée dans la fiction) conduit une réflexion sur la place de la fiction littéraire dans la construction des savoirs et, par extension, d’une culture. La réflexion et l’expérimentation se font dans le contexte scolaire du lycée d’enseignement général (définition du statut du roman dans l’utilisation qui en est faite dans les programmes et objectifs d’enseignement, analyse de la notion de lecture littéraire en lycée) et par l’analyse d’un corpus de textes : étude de La mystérieuse flamme de la Reine Loana / Umberto Eco, 2004, traduction française, Paris, Grasset et Fasquelle, 2005, doublée de l’étude d’un corpus aléatoire sur le thème de la Shoah. L’objet d’étude étant le roman, les liens entre les Sciences de l’Information et de la Communication et la sémiotique sont abordés sous un jour nouveau : construction d’une théorie sémiotique (définition, mise en place d’un langage formel, choix d’un système de représentation) adaptée à l’objet d’étude par l’explicitation des conditions de production de sens, ce qui implique une hybridation des champs (SIC et théories d’analyse littéraire). Sont développés les éléments théoriques pour un modèle de représentation de la fiction. Les définitions du roman, de la fiction littéraire narrative, de l’information, de la fictiologie (nouveau champ de recherche ouvert par l’étude) et de l'information fictiologique critique, complétées par une description du positionnement dans le champ des Sciences de l’Information et de la Communication, posent le cadre de la réflexion. Un chapitre traitant de la littérature et de la notion de mémoire permet de décrire les liens entre roman et représentation de la réalité. Pour cela, sont définies et étudiées les notions de texte, de référence et de contexte. Enfin, est explicité le titre de la thèse par la description de la faculté imaginale et de la fonction de médiation prêtées au roman. Pour clôturer cette partie d’étude, un état de l’art de la classification de la fiction est opéré par l’élaboration d’un panorama des outils proposés et utilisés, renforcé par la définition d’une recherche ouverte d’information et une étude de la notion de sens dans le traitement de la fiction. Les analyses dans le champ pratique comportent un compte-rendu d’enquêtes, menées dans le cadre de l’enseignement secondaire et de la formation des documentalistes de l’Education Nationale, sur les pratiques de lecture. L’analyse des corpus de textes permet d’interroger la problématique de la réalité visible dans le roman. Ces travaux expérimentent une ontologie fictiologique par une analyse du roman comme document et un essai de formalisation sur la littérature des camps. La proposition d’un modèle théorique à expérimenter se concrétise par l’élaboration d’un système d’organisation de connaissances info-littéraires. Une réflexion sur l’environnement technique actuel justifie les choix retenus, les propositions et solutions réfléchies. En présentant une littératie fictiologique, prolongement de la littératie médiatique, la thèse se clôture par la description d’une médiation fictiologique qui s’ancre dans une renégociation des espaces et des typologies documentaires, investiguant les pratiques participatives et collaboratives. / The dissertation, which investigates the description of the novel and considers an answer by interrogating an information problem (offering a theoretical model of representation, a basis for the conception and creation of tools for a carefully thought out navigation within fiction), carries out a reflection about the role of literary fiction in the construction of bodies of knowledge and, by extension, of a culture. These reflection and experimentation take place in the school context of the “lycee d’enseignement general” [mainstream education high school] (definition of the status of the novel in the way that it is used in education programs and objectives, analysis of the notion of literary reading in high school) and through the analysis of a body of texts: study of La Mysterieuse Flamme de la Reine Loana / Umberto Eco, 2004, French translation, Paris, Grasset et Fasquelle, 2005, combined with the study of an unpredictable collection of texts about the theme of the Shoah. Since the object of study is the novel, the links between Information and Communication Sciences and semiotics are approached in a new light: construction of a semiotic theory (definition, setting up of a formal language, choice of a representation system) made suitable to the object of study by clarifying the conditions of meaning production, which implies a hybridization of the fields (Information and Communication Sciences and literary analysis). The theoretical elements for a representation model of fiction are developed. Definitions of the novel, of literary narrative fiction, of information, of fictiology (a new field of research opened up by the study) and of critical fictiological information, complemented by a description of positioning of this research in the field of Information and Communication Sciences, frame the reflection. A chapter tackling literature and the notion of memory allows for a delineation of the links between novel and representation of reality. For this purpose, the notions of text, reference, and context are defined. Finally, the title of the dissertation is explained through the description of the imaginal faculty, and of the mediation function attributed to the novel. To close this part of the study, drafting a panorama of the proposed and employed tools helps operate a state of the art of fiction classification, reinforced by the definition of an open information research and a study of the notion of meaning in the handling of fiction. Analyses in the practical field include a report of investigations on reading practices conducted in the contexts of secondary education and of the training of ‘Education Nationale’ information librarians. Analyzing bodies of texts allows the problem of visible reality in the novel to be interrogated. This research tests out a fictiologic ontology by examining the novel as document and by attempting a formalization of the camps literature. The proposition of a theoretical model to be experimented is concretized by the development of a system of organization of information and literary knowledge. A reflection on the current technical environment justifies the choices considered, the propositions and solutions offered. By presenting a fictiological information literaty, an extension of media information literaty, the dissertation ends with the description of fictiological mediation anchored into a renegotiation of information spaces and typologies, investigating participatory and collaborative practices.
|
318 |
Hotlinks and dictionariesDouieb, Karim 29 September 2008 (has links)
Knowledge has always been a decisive factor of humankind's social evolutions. Collecting the world's knowledge is one of the greatest challenges of our civilization. Knowledge involves the use of information but information is not knowledge. It is a way of acquiring and understanding information. Improving the visibility and the accessibility of information requires to organize it efficiently. This thesis focuses on this general purpose.<p><p>A fundamental objective of computer science is to store and retrieve information efficiently. This is known as the dictionary problem. A dictionary asks for a data structure which allows essentially the search operation. In general, information that is important and popular at a given time has to be accessed faster than less relevant information. This can be achieved by dynamically managing the data structure periodically such that relevant information is located closer from the search starting point. The second part of this thesis is devoted to the development and the understanding of self-adjusting dictionaries in various models of computation. In particular, we focus our attention on dictionaries which do not have any knowledge of the future accesses. Those dictionaries have to auto-adapt themselves to be competitive with dictionaries specifically tuned for a given access sequence. <p><p>This approach, which transforms the information structure, is not always feasible. Reasons can be that the structure is based on the semantic of the information such as categorization. In this context, the search procedure is linked to the structure itself and modifying the structure will affect how a search is performed. A solution developed to improve search in static structure is the hotlink assignment. It is a way to enhance a structure without altering its original design. This approach speeds up the search by creating shortcuts in the structure. The first part of this thesis is devoted to this approach. / Doctorat en Sciences / info:eu-repo/semantics/nonPublished
|
319 |
Inférence des acteurs de la régulation des expressions géniques / The Inference of Gene Expression Regulator actors.Bourgeade, Laetitia 30 January 2015 (has links)
La quantité croissante de données générées est à l’origine de nombreuses problématiques en bioinformatique telles que le développement de nouvelles méthodes de traitement et d’analyse efficaces de ces données. Plus particulièrement, les réseaux de régulation des fonctions cellulaires sont au coeur de nombreux projets aujourd’hui. Il est donc nécessaire, afin d’appréhender correctement ces systèmes de régulation, de comprendre l’origine et de caractériser les acteurs de ces systèmes tels que les ARN et les pseudogènes.Nous avons établi une nouvelle méthode de comparaison d’une séquence ARN requête avec un jeu de séquences ARN cibles. Notre méthode se base sur (i) l’indexation préalable des graines en séquence/structure des ARN du jeu cible, (ii) la recherche des ARN cibles par détection des graines de la séquence requête présentes également dans le jeu de données cible et le chainage de ces graines, puis (iii) la complétion de l’alignement obtenu à l’aide d’un algorithme d’alignement exact incorporant des contraintes d’alignement. Cette méthode a été appliquée sur le jeu de données de BraliBase2.1. L’exactitude des résultats obtenus et l’efficacité de la méthode ont alors été comparés à la méthode d’alignement exact LocARNA et à son filtre basé sur un algorithme de chainage de graines récemment développé, ExpLocP. Notre méthode RNA-unchained permet d’améliorer significativement les temps de calcul de LocARNA et présente des temps de calcul similaires à ExpLocP, tout en améliorant l’exactitude des alignements finaux.De plus, nous avons développé une méthode, PseudOE, de détection et de caractérisation du pseudome au sein d’un génome et d’analyse comparative de ce pseudome entre plusieurs génomes. Cette méthode a ainsi permis de réaliser l’analyse du panpseudome de deux souches relativement distantes de l’espèce Oenococcus oeni et qui présentent des propriétés oenologiques opposées. On observe dans ces génomes compacts, de 1,8Mb, 8,5% de pseudogènes. Par comparaison aux autres génomes bactériens, les génomes d’O. oeni semblent sensibles à la pseudogénisation. La majorité des pseudogènes détectés ont pour origine des mutations de leur séquence et sont présents uniquement dans l’un des génomes, ce qui soutient l’hypothèse d’une origine récente de ces séquences et qui illustre la tendance des O. oeni à l’hypermutabilité. De plus, l’analyse des données fournies par PseudOE a permis la mise en évidence d’une organisation spatiale des pseudogènes au sein de territoires spécifiques du chromosome. L’ensemble de ces analyses illustre les particularités des pseudogènes chez O. oeni et apporte des informations supplémentaires concernant l’évolution des gènes/génomes dont les annotations de génomes pourraient retirer des bénéfices. / The increasing amount of available data is a source of many issues in bioinformatics such that the development of new methods of treatments and efficient analysis of data. Especially, regulatory networks are at the heart of many projects. Also, in order to understand regulatory systems, it appears to be necessary to characterize and to understand actors of these systems such as RNA and pseudogenes. We develop a new method to compare a query RNA with a static set of target RNAs. Our method is based on (i) a preliminary indexing of the sequence/structure seeds of the target RNAs, (ii) searching the potentially homolog RNAs by detecting seeds of the query present in targets, chaining these seeds, then (iii) completing the alignment using an anchor-based exact alignment algorithm. We apply our method on the benchmark Bralibase2.1. We compare our method accuracy and efficiency with the exact method LocARNA and its recent seeds-based speed-up ExpLocP. Our pipeline RNA-unchained greatly improves computation time of LocARNA and is comparable to the one of ExpLocP, while improving the overall accuracy of the final alignments.Moreover, we develop a new method, PseudOE, to detect and to characterize the pseudome of one genome, and to analyse by comparison two genomes at least. This method allows to analyse the pan-pseudome of two distantly related Oenococcus oeni strains with opposite oenological properties. Quite interestingly, with 8.5% of pseudogenes for a compact 1.8Mb genome, O. oeni appeared to be prone to pseudogenization compared to other bacteria. A great proportion of pseudogenes were found to come from mutational degradation suggesting a relatively recent origin that could illustrate the natural propensity of O. oeni for hypermutability. In addition, we identify a spatial organization of pseudogenes into dedicated chromosomal territories. These analysis illustrate peculiar properties of O. oeni pseudogenes, providing additional insights of gene/genome evolution from which future genome annotation will benefit.
|
320 |
Étude sur l’influence du vocabulaire utilisé pour l’indexation des images en contexte de repérage multilingueMénard, Elaine 27 November 2008 (has links)
No description available.
|
Page generated in 0.0734 seconds