Global ETD Search

41	From Time series signal matching to word spotting in multilingual historical document images / De la mise en correspondance de séries temporelles au word spotting dans les images de documents historiques multilingues Mondal, Tanmoy 18 December 2015 (has links) Cette thèse traite dela mise en correspondance de séquences appliquée au word spotting (localisation de motsclés dans des images de documents sans en interpréter le contenu). De nombreux algorithmes existent mais très peu d’entre eux ont été évalués dans ce contexte. Nous commençons donc par une étude comparative de ces méthodes sur plusieurs bases d’images de documents historiques. Nous proposons ensuite un nouvel algorithme réunissant la plupart des possibilités offertes séparément dans les autres algorithmes. Ainsi, le FSM (Flexible Sequence Matching) permet de réaliser des correspondances multiples sans considérer des éléments bruités dans la séquence cible, qu’ils se situent au début, à la fin ou bien au coeur de la correspondance. Nous étendons ensuite ces possibilités à la séquence requête en définissant un nouvel algorithme (ESC : Examplary Sequence Cardinality). Finalement, nous proposons une méthode d’appariement alternative utilisant une mise en correspondance inexacte de chaines de codes (shape code) décrivant les mots. / This thesis deals with sequence matching techniques, applied to word spotting (locating keywords in document images without interpreting the content). Several sequence matching techniques exist in the literature but very few of them have been evaluated in the context of word spotting. This thesis begins by a comparative study of these methods for word spotting on several datasets of historical images. After analyzing these approaches, we then propose a new algorithm, called as Flexible Sequence Matching (FSM) which combines most of the advantages offered separately by several other previously explored sequence matching algorithms. Thus, FSM is able to skip outliers from target sequence, which can be present at the beginning, at the end or in the middle of the target sequence. Moreover it can perform one-to-one, one-to-many and many-to-one correspondences between query and target sequence without considering noisy elements in the target sequence. We then also extend these characteristics to the query sequence by defining a new algorithm (ESC : Examplary Sequence Cardinality). Finally, we propose an alternative word matching technique by using an inexact chain codes (shape code), describing the words. Mise en correspondance de séquences Word Spotting DTW Shape code Sequence matching techniques Word Spotting DTW Shape code
42	Développement des nouvelles réactions catalytiques en chimie des ions N-acyliminiums initiées par l’acide triflimidique : diastéréosélectivité et multi-catalyse / Development of new catalytic reactions in N-acyliminium ion chemistry initiated by triflimidic acid : diastereoselectivity and multi-catalysis Azizi, Mohamed Salah 26 June 2014 (has links) L'acide malique est un produit naturel peu couteux. Les N,O-acetals dérivés d’acide malique sont régulièrement utilisés en chimie des ions N-acyliminiums endocycliques. L’utilisation de cette classe très populaire de précurseurs d’ions N-acyliminiums stéréopurs est à quelques exceptions près limitée aux di-acétoxylactames. Les couplages par formation de liaisons C-C de ces intermédiaires cationiques avec divers nucléophiles sont souvent décrites pour conduire à un diastéréocontrôle insuffisant. Dans cette éventualité, la séparation du mélange des diastéréoisomères formés peut également être un problème. Par conséquent, le développement de nouveaux N,O-acétals dérivés d'acide malique susceptibles d'améliorer la diastéréosélectivité de ce type d' α-amidoalkylations (et/ou de faciliter la séparation des deux diastéréoisomères), qui sont fréquemment utilisées comme étape clé dans des synthèses multiétapes de produits naturels ou leurs analogues, est souhaitable. Le travail décrit dans ce manuscrit se situe dans ce contexte, il détaille la préparation d'une librairie de nouveaux N,Oacétals stéréopurs et leur utilisation dans de nouvelles transformations, catalytiques et diastéréosélectives basées sur la chimie des ions N-acyliminiums. Cette thèse décrit l'amélioration de la diastéréosélectivité intrinsèque trans des réactions d'α- amidoalkylation d'éthers d'énol silylés par des ions N-acyliminiums optiquement purs dérivés d'acide malique catalysées par le super acide l'acide triflimidique. Nous démontrons que la nature des deux partenaires réactionnels peut être modulée pour améliorer le rapport diastéréoisomérique jusqu'à des valeurs très élevées de 98:2. Dans une seconde phase de ce travail, le développement d'une séquence cascade multicatalytique "one-pot" associant une amidoalkylation intermoléculaire de type Friedel- Crafts acido-catalysée avec une a-hydroarylation intramoléculaire catalysée par des complexes cationiques d'or, est présentée. Cette méthodologie combine deux thèmes en vogue en synthèse organique, à savoir l'organocatalyse et la catalyse à l'or, et permet un accès extrêmement rapide à de nouvelles structures polyhétérocycliques complexes fusionnées chirales. / Malic acid is an inexpensive natural product which is widely used as a chiral source in natural product synthesis. N,O-acetals derived from malic acid are regularly used in N-acyliminium ions endocyclic chemistry. The use of this very popular class of iminium ion precursors is mainly limited to stereopure 4,5-di-acetoxy lactams, the C-C bond coupling reactions of which with various nucleophiles are frequently reported to exhibit insufficient diastereocontrol. Moreover, the subsequent separation of the resulting mixture of diastereoisomers might also be an issue. Hence, developing novel N,O-acetalic malic acid derivatives is desirable in order to improve the diastereoselectivity of this type of α-amidoalkylation reactions (and/or to facilitate the separation of diastereomers) which are frequently used as a pivotal step in the context of multi-step syntheses of natural products and analogues. The work described in this manuscript lies in this context, with the preparation of a library of novel stereopure N,O-acetals and their subsequent use in new, catalytic and diastereoselective transformations based on N-acyliminiums ions chemistry. This thesis firstly describes the improvement of the intrinsic trans diastereoselectivity of the α-amidoalkylation reactions of silyl enol ethers with N-acyliminium ions derived from malic acid, generated in situ under triflimidic acid catalysis. It is shown that the structure of both reaction partners can be tuned to raise diastereomeric ratios to very high levels up to 98:2. In a second phase of this work, the development of a multicatalytic cascade sequence involving an intermolecular Friedel-Crafts type -amidoalkylation catalyzed by triflimidic acid, followed by an intramolecular hydroarylation catalyzed by cationic gold(I) complexes, is presented. The methodology developed in this second part of our work combines two hot contemporary topics of organic synthesis, namely organocatalysis and gold catalysis, and allows extremely fast access to new, sophisticated fused polyheterocyclic chiral structures. Synthèse diastéréosélective Diastéréocontrôle Séquences cascades multicatalystiques AIons N-acyliminium Catalyse à l'or Ethers d'énol silylés Hydroarylation 547
43	La pâte et le décor : considération et formes professionnelles dans le monde des pâtissiers / Of dough and decoration : consideration and professional forms in the world of pâtissiers Collas, Thomas 23 November 2015 (has links) La thèse décrit l’ensemble hétérogène et flou de produits et de situations de travail qu'embrasse le monde des pâtissiers en France de la fin des années 1970 au début des années 2010 à la lumière d'une question de sociologie : dans quelle mesure les marques de considération portées aux travailleurs et à leur travail participent-elles à stabiliser des formes professionnelles, qu'il s'agisse d’un groupe professionnel, de segments élitaires, de communautés de praticiens ou encore de trajectoires individuelles ? Les matériaux mobilisés dans les trois parties de la thèse sont issus d’un travail sur archives et d’une enquête ethnographique. Une base prosopographique de première main est exploitée à partir de méthodes d’analyse de séquences. Dans la première partie, les revendications de statut portées au nom du groupe des pâtissiers par plusieurs collectifs et les conventions esthétiques convoquées et explicitées dans ce cadre sont étudiées. Dans la deuxième partie, les rhétoriques d’excellence mises en œuvre sur trois arènes de définition du travail pâtissier (le système des concours pâtissiers, une association élitaire et les sélections critiques) sont comparées au regard des sanctions qu’elles sécrètent et des segments élitaires qu'elles concourent à stabiliser. La troisième partie est consacrée à la stabilisation de trajectoires individuelles sur les marchés du travail et sur les marchés boutiquiers, à l’appui notamment de ces marques de considération. Ce faisant, les modèles d’avantage cumulatif sont mis à l’épreuve. En filigrane, la conduite d’entreprise et les compétences décoratives apparaissent comme deux principes récurrents de considération du travail pâtissier. / The thesis describes the heterogenous world of pâtissiers – in terms of products and work situations – in France from the late 1970’s to the early 2010’s in the light of a sociological question : to what extent do marks of consideration sent to workers and to their work contribute to stabilize professional forms, be it professional groups, professional segments (elitarian or not) or individual trajectories ? The three parts of the thesis are based on empirical research, interweaving archive and ethnographic materials. An original prosopographical database is exploited through sequence analysis. The first part of the thesis presents an analysis of competing jurisdictional claims describing a group of pâtissiers and explicitly aesthetic choices that these claims reveal. In a second part, three arenas of definition of pâtissier work (pâtissier competitions, an elitarian association and critics) are compared with regard to rhetorics of excellence they convey and the elitarian segments they contribute to stabilize. The third part looks at individual trajectories that are partly built on these marks of consideration. In so doing, the cumulative advantage models are discussed. The thesis shows that entrepreneurship and decoration skills are recurrent principles of consideration of pâtissier work. Pâtissiers Sociologie des professions Sociologie de la consideration Analyse de séquences Pâtissiers Sociology of professions Sociology of consideration Sequence analysis
44	Identification et évolution des séquences orthologues par séquençage massif chez les polyploïdes / Identification and evolution of orthologous sequences in polyploid species by next-gen sequencing Boutte, Julien 03 December 2015 (has links) Les nouvelles technologies de séquençage (NTS) offrent de nouvelles opportunités d'explorer les génomes et transcriptomes d'espèces polyploïdes. L'assemblage de transcriptomes et l'identification des copies de gènes dupliqués par allopolyploïdisation (homéologues) constituent cependant un véritable défi C ‘est plus particulièrement le cas dans un contexte de superposition de plusieurs évènements de polyploïdie et en l'absence de génome de référence diploïde. Les Spartines (Poaceae, Chloridoideae) représentent un excellent système pour étudier les conséquences à court terme des évènements d'hybridation et de polyploïdisation. En effet, S. maritima (hexaploïde) s'est hybridée à deux reprises avec S. alterniflora (hexaploïde) suite à son introduction récente en Europe, formant deux hybrides homoploïdes (S. x townsendii et S. x neyrautii). La duplication du génome de S. x townsendii a formé une nouvelle espèce allododécaploïde S. anglica (à la fin du XIXème siècle) qui a depuis envahi les marais salés de plusieurs continents. L'identification des gènes dupliqués au sein de S. anglica et de ses parents est importante pour la compréhension de son succès évolutif. Cependant, leurs niveaux de ploïdie, et l'absence d'espèce diploïde de référence chez les spartines nécessitent le développement d'outils adaptés. Dans ce contexte, nous avons développé et validé différents outils bioinformatiques permettant de détecter des polymorphismes afin d'identifier les différents haplotypes au sein de jeux de données NTS. Ces approches nous ont permis d'étudier l'hétérogénéité des domaines de l'ADN ribosomique 45S de S. maritima. Nous avons mis en évidence la perte de copies homéologues en conséquence de la diploïdisation en cours. Afin de développer les ressources transcriptomiques de ces espèces, cinq nouveaux transcriptomes de référence (110 423 contigs annotés pour les 5 espèces dont 37 867 contigs non-redondants) ont été assemblés et annotés. Les co-alignements des haplotypes parentaux et hybrides/allopolyploïdes nous ont permis d'identifier les homéo-SNPs discriminant les séquences homéologues. De plus, nous avons évalué la divergence entre les copies de gènes, identifié et confirmé les évènements de duplications récents au sein des Spartines. Au cours de cette thèse, nous avons également initié des approches de phylogénomique des spartines, qui permettront de préciser l'origine évolutive des copies dupliquées. / Next generation sequencing (NGS) technologies offer new opportunities to explore polyploid genomes and their corresponding transcriptomes. However, transcriptome assemblies and identification of homoeologous gene copies (duplicated by polyploidy) remain challenging, particularly in the context of recurrent polyploidy and the absence of diploid reference parents. Spartina species (Poaceae, Chloridoideae) represent an excellent system to study the short term consequences of hybridization and polyploidization in natural populations. The European S. maritima (hexaploid) hybridized twice with the American S. alterniflora (hexaploid) following its recent introduction to Europe, which resulted in the formation of two homoploid hybrids (S. x townsendii and S. x neyrautii). Whole genome duplication of S. x townsendii resulted in the fertile new allododecaploid S. anglica species (during the 19th century) that has now invaded saltmarshes on several continents. Identification of duplicated genes in S. anglica and its parental species is critical to understand its evolutionary success but their high ploidy levels require the development of adapted tools. In this context, we developed and validated different bioinformatics tools to detect polymorphisms and identify the different haplotypes from NGS datasets. These approaches enabled the study of the heterogeneity of the highly repeated 45S rDNA in S. maritima. In order to develop transcriptomic resources for these species, 5 new reference transcriptomes (110 423 annotated contigs for the 5 species with 37 867 non-redundant contigs) were assembled and annotated. Co-alignments of parental and hybrid/allopolyploid haplotypes allowed the identification of homoeoSNPs discriminating homoelogs. The divergence between duplicated genes was used to identify and confirm the recent duplication events in Spartina. Phylogenomic approaches on Spartina were also initiated in this thesis in the perspective of exploring the evolutionary history of the duplicated copies. Homéologie SNPs Assemblage de novo de séquences Ngs Polyploïdie Spartina Homoeology SNPs De novo sequence assembly Ngs Polyploidy Spartina
45	La dissémination des séquences REP dans les génomes bactériens : caractérisation des activités des protéines TnpAREP / Characterization of TnpArep protein in REP sequence dissemination Corneloup, Alix 18 October 2016 (has links) Les génomes bactériens contiennent de nombreuses séquences répétées qui ont un rôle majeur dans la plasticité et l'évolution des génomes. Parmi elles, les séquences REP sont de courtes séquences d'ADN, trouvées en grand nombre dans des régions intergéniques de plusieurs espèces bactériennes. Ces séquences ont la particularité de présenter des structures en tige boucle précédées par un tétranucléotide conservé. Elles peuvent exister seules mais sont majoritairement groupées dans des clusters consécutifs appelés BIME. De nombreux rôles ont été attribués aux REP/BIME dans la physiologie de la cellule : elles sont notamment impliquées dans la régulation de l'expression des gènes et elles constituent des sites de fixation pour plusieurs protéines de l'hôte. Toutefois, leur origine et le mécanisme de leur dissémination dans les génomes ne sont pas connus. Récemment, un gène codant une protéine (TnpAREP) apparentée aux transposases de la famille des séquences d'insertions IS200/IS605 a été identifiée en association avec des REP/BIME au sein de structures appelées REPtron. Il a été alors proposé que les REP/BIME pourraient être des éléments transposables non-autonomes mobilisables par la protéine TnpAREP. Cette protéine fait partie de la superfamille des enzymes HuH comprenant des Relaxases, des protéines Rep des phages/plasmides à réplication en cercle roulant et certaines transposases. Elles utilisent le motif HuH (Histidine - résidu hydrophobe - Histidine) pour coordonner des cofacteurs métalliques ainsi que des résidus tyrosines pour leur activité catalytique. Comme pour les transposases HuH de la famille IS200/IS605, TnpAREP reconnait spécifiquement des substrats ADN simple brin. Elle est active in vitro sur des séquences structurées contenant des REP/BIME sous forme simple brin et celle-ci clive au niveau d'un dinucléotide spécifique. Des données cristallographiques suggèrent que TnpAREP serait monomérique, contrairement aux transposases d'IS200/IS605 qui sont des dimères obligatoires. Cela pose de nombreuses questions sur le site catalytique de l'enzyme ainsi que sur le mécanisme de prolifération des REP/BIME dans les génomes bactériens, d'autant plus qu'aucune activité de TnpAREP n'a été décrite in vivo. Mes premiers résultats portent sur la caractérisation du site catalytique de TnpAREP d'E. coli et ont permis d'exclure la possibilité d'un site catalytique hybride comme dans le cas des protéines Rep de certains plasmides. J'ai pu mettre en évidence une activité in vivo de TnpAREP : son expression sous contrôle d'un promoteur inductible à un effet toxique et induit la réponse SOS chez E. coli. J'ai également développé un test pour cartographier des sites de clivage de TnpAREP in vivo et montré que l'enzyme est capable de cliver les deux brins des plasmides et de l'ADN chromosomique. De plus, une excision d'un BIME a pu être observée dans ces conditions. J'ai aussi construit des souches bactériennes permettant d'étudier l'évolution expérimentale des REP/BIME in vivo dont les résultats sont en cours d'analyse. Enfin, nous avons élargi notre étude à un sous-groupe de TnpAREP associées à un autre type de REP/BIME. Cette analyse comparative nous a permis non seulement de généraliser des propriétés observées avec TnpAREP d'E. coli, mais aussi de révéler des caractéristiques spécifiques de ce sous-groupe. / In spite of their compact size, bacterial genomes carry many repetitive sequences, often important for genome function and evolution. Among them, REPs are short DNA found at high copy number in intergenic regions in many bacterial species. These sequences can form stem-loop structures preceded by a conserved tetranucleotide. They can exist as individual units but also as complex consecutive clusters called BIMEs. REP/BIMEs are known to interact with different proteins and several important roles have been attributed to these sequences in cell physiology. However, their origin and dissemination mechanisms are poorly understood. Recently, a first example of prokaryotic domesticated transposases (TnpAREP) was found associated with REP/BIME sequences in structure called REPtron. REP/BIMEs might represent a special type of non-autonomous transposable element mobilizable by TnpAREP. TnpAREP is member of the HuH enzymes superfamily including Relaxases, Rep proteins of RCR plasmids/ss phages and some transposases. These transposases are fundamentally different from classical transposases. They use HuH motif (Histidine-hydrophobe-Histidine) to coordinate metal cofactor and tyrosine residues (Y) as nucleophile for catalysis. TnpAREP shares certain similarities to Y1 HuH transposases encoded by the IS200/IS605 family which processes only ssDNA substrates. Analysis of E. coli TnpAREP activity in vitro also shown the strict requirement of structured single stranded REP/BIME DNA substrates. Cleavage in vitro occurs at a specific dinucleotide. In contrast to Y1 HuH transposases which are obligatory dimers, E. coli TnpAREP is a monomer as shown by structural studies. Furthermore, TnpAREP activities have never been described in vivo. This raises questions about its catalytic sites and also the way by which it promotes REP/BIME proliferation within their host genomes. The first objective of my PhD was to characterize the TnpAREP catalytic site. My results exclude the possibility of a second catalytic site as observed for REP protein of some plasmid families. Here I show that in vivo, expression of TnpAREP under control of an inducible external promoter is toxic to E. coli cells and induces SOS response, the effect depending on catalytic activity of the protein. I have developed an assay to map TnpAREP cleavage sites in vivo and show that it can cleave both DNA strands on plasmid and bacterial chromosome. In these conditions, an excision of BIME could be observed. I also constructed bacterial strains to perform REP/BIME experimental evolution, results are under analysis. Finally, we are extending our analysis to a subgroup of TnpAREP that are associated with another type of REP/BIME. This comparative analysis not only permitted to generalize some properties observed with E. coli TnpAREP but also revealed some interesting distinct characteristics of this subgroup. Séquences REP Clivage Transposition Recombinaison TnpAREP Dissémination Protéine HuH Génomes bactériens
46	Repérage automatique de séquences figées / Automatic extraction of fixed sequences Joseph, Aurélie 18 December 2013 (has links) Cette thèse vise à proposer un modèle théorique et une méthodologie permettant d’effectuer des analyses linguistiques fines des textes, permettant de rendre compte des éléments utiles des courriers à savoir : le motif/objet du courrier, l’émetteur et le destinataire du courrier. L’approche doit permettre un traitement efficace des verrous technologiques du TAL, et spécialement le problème du figement et plus particulièrement des séquences verbales figées. Il s’agit d’un phénomène extrêmement fréquent dans toutes les langues, présenté comme une des sources de difficultés majeures pour la recherche d’information et la veille dans les documents dits non structurés. La thèse comprendra une partie applicative démontrant l’efficacité de la théorie proposee, et aboutissant à un système de traitement automatique des courriers. Par ailleurs, la démarche méthodologique aboutissant aux ressources linguistiques doit permettre de définir un outil d’apprentissage automatique de ces ressources qui pourra ainsi être appliqué à de nouveaux types de documents. / The aim of this thesis is to propose a theoretic model and a methodology to make fine linguistic text analysis. That can represent elements useful in mails like: message purposes, message addressee or sender. This approach must permit an efficient processing of NLP technology issues, especially in the fixity problematic and mainly on fixed verbal sequences. This phenomenon is extremely recurrent in all languages. It is introduced as a main issue for information retrieval in unstructured documents. This thesis will include an applicative part showing the relevance of the proposed theory and to make a system to automatically process mails. Moreover, the methodology which creating linguistically resources must permit to define an automatic learning resources tool which can be applied on new kind of documents. Séquences figées Traitement automatique des courriers Collocation Repérage automatique Fixed sequences Automatic learning Automatically process mails
47	Modelling and inference for biological systems : from auxin dynamics in plants to protein sequences. / Modélisation et inférence de systèmes biologiques : de la dynamique de l’auxine dans les plantes aux séquences des protéines Grigolon, Silvia 14 September 2015 (has links) Tous les systèmes biologiques sont formés d’atomes et de molécules qui interagissent et dont émergent des propriétés subtiles et complexes. Par ces interactions, les organismes vivants peuvent subvenir à toutes leurs fonctions vitales. Ces propriétés apparaissent dans tous les systèmes biologiques à des niveaux différents, du niveau des molécules et gènes jusqu’aux niveau des cellules et tissus. Ces dernières années, les physiciens se sont impliqués dans la compréhension de ces aspects particulièrement intrigants, en particulier en étudiant les systèmes vivants dans le cadre de la théorie des réseaux, théorie qui offre des outils d’analyse très puissants. Il est possible aujourd’hui d’identifier deux classes d’approches qui sont utilisée pour étudier ces types de systèmes complexes : les méthodes directes de modélisation et les approches inverses d’inférence. Dans cette thèse, mon travail est basé sur les deux types d’approches appliquées à trois niveaux de systèmes biologiques. Dans la première partie de la thèse, je me concentre sur les premières étapes du développement des tissus biologiques des plantes. Je propose un nouveau modèle pour comprendre la dynamique collective des transporteurs de l’hormone auxine et qui permet la croissance non-homogène des tissu dans l’espace et le temps. Dans la deuxième partie de la thèse, j’analyse comment l’évolution contraint la diversité́ de séquence des protéines tout en conservant leur fonction dans différents organismes. En particulier, je propose une nouvelle méthode pour inférer les sites essentiels pour la fonction ou la structure de protéines à partir d’un ensemble de séquences biologiques. Finalement, dans la troisième partie de la thèse, je travaille au niveau cellulaire et étudie les réseaux de signalisation associés à l’auxine. Dans ce contexte, je reformule un modèle préexistant et propose une nouvelle technique qui permet de définir et d’étudier la réponse du système aux signaux externes pour des topologies de réseaux différentes. J’exploite ce cadre théorique pour identifier le rôle fonctionnel de différentes topologies dans ces systèmes. / All biological systems are made of atoms and molecules interacting in a non- trivial manner. Such non-trivial interactions induce complex behaviours allow- ing organisms to fulfill all their vital functions. These features can be found in all biological systems at different levels, from molecules and genes up to cells and tissues. In the past few decades, physicists have been paying much attention to these intriguing aspects by framing them in network approaches for which a number of theoretical methods offer many powerful ways to tackle systemic problems. At least two different ways of approaching these challenges may be considered: direct modeling methods and approaches based on inverse methods. In the context of this thesis, we made use of both methods to study three different problems occurring on three different biological scales. In the first part of the thesis, we mainly deal with the very early stages of tissue development in plants. We propose a model aimed at understanding which features drive the spontaneous collective behaviour in space and time of PINs, the transporters which pump the phytohormone auxin out of cells. In the second part of the thesis, we focus instead on the structural properties of proteins. In particular we ask how conservation of protein function across different organ- isms constrains the evolution of protein sequences and their diversity. Hereby we propose a new method to extract the sequence positions most relevant for protein function. Finally, in the third part, we study intracellular molecular networks that implement auxin signaling in plants. In this context, and using extensions of a previously published model, we examine how network structure affects network function. The comparison of different network topologies provides insights into the role of different modules and of a negative feedback loop in particular. Our introduction of the dynamical response function allows us to characterize the systemic properties of the auxin signaling when external stimuli are applied. Dynamique de l’auxine Patterns de polarité des PINs Séquences de protéines Analyse statistique Alignement de séquences Réseaux de signalisation Théorie de la réponse linéaire Auxin dynamics PIN polarity patterns Protein sequences Statistical analysis Multiple sequence alignments Signalling networks Linear response theory
48	Conception Vectorielle de Registre à rétroaction avec retenue sur les corps finis. Marjane, Abdelaziz 08 July 2011 (has links) (PDF) Dans ce mémoire, on introduit une conception vectorielle des registres à rétroaction lin éaire avec retenue introduits par Goresky et Klapper que l'on dénomme VFCSR. Via l'anneau des vecteurs de Witt, on développe une analyse de ces registres qui établit les propriétés essentielles des séquences de sortie comme l'existence de séquences de période maximale, la qualité de pseudo-al éa du point de vue de la corr élation arithm étique et statistique, le comportement de la m émoire, etc. On étudie différents modes de conception de ces registres (modes Fibonacci, Galois et Ring). Comme application, on propose un g én érateur d'al éa cryptographique en mode "stream cipher" bas e sur un registre VFCSR quadratique. séquences pseudo-aléatoires entiers p-adiques vecteurs de Witt LFSR FCSR registre à rétroaction avec retenue registre vectoriel chiffrement par flot l-séquences
49	Extraction de séquences fréquentes : des données numériques aux valeurs manquantes Fiot, Céline 28 September 2007 (has links) (PDF) La quantité de données aujourd'hui emmagasinées dans tous les domaines ainsi que leur diversité d'origines et de formats rendent impossibles l'analyse, le résumé ou l'extraction manuelle de connaissances. Pour répondre à ces besoins, diverses communautés se sont intéressées à la conception et au développement d'outils permettant d'extraire automatiquement de la connaissance de ces grandes bases. Désormais ces travaux visent à prendre en compte l'hétérogénéité de ces données, de leur format et de leur qualité. Notre travail s'inscrit dans cet axe de recherche et, plus précisément, dans le contexte de la découverte de schémas fréquents à partir de données regroupées sous la forme de séquences ordonnées. Ces schémas, appelés motifs séquentiels, n'étaient jusqu'alors extraits que sur des bases de données de séquences symboliques et parfaites, c'est-à-dire des bases ne contenant que des informations binaires ou pouvant être traitées comme telles et ne contenant aucun enregistrement incomplet. Nous avons donc proposé plusieurs améliorations des techniques d'extraction de séquences fréquentes afin de prendre en compte des données hétérogènes, incomplètes, incertaines ou mal connues de leur utilisateur, tout en minimisant les pertes éventuelles d'informations. Ainsi, le travail présenté dans cette thèse comporte la mise en oeuvre d'un cadre pour l'extraction de motifs séquentiels en présence de données numériques quantitatives, la définition de contraintes temporelles relâchées autorisant l'utilisateur à spécifier des contraintes temporelles approximatives et permettant un tri des résultats obtenus selon un indice de précision temporelle, enfin, le développement de deux approches pour l'extraction de motifs séquentiels sur des données symboliques incomplètes. Extraction de connaissances fouille de données logique floue sous-ensembles flous motifs séquentiels séquences fréquentes base de données de séquences données numériques données quantitatives données incomplètes valeurs manquantes contraintes temporelles règles d'association
50	Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication Li, Haoyuan 10 September 2009 (has links) (PDF) Les motifs séquentiels peuvent être vus comme une extension de la notion d'itemsets fréquents intégrant diverses contraintes temporelles. La recherche de tels motifs consiste ainsi à extraire des enchaînements d'ensembles d'items, couramment associés sur une période de temps bien spécifiée. La construction de règles à partir de ces motifs séquentiels permet d'étendre la notion de règles d'association pour la pris en compte de la temporalité. En fait, cette recherche met en évidence des associations inter-transactions, contrairement à celle des règles d'association qui extrait des combinaisons intra-transactions. Ce problème, posé à l'origine dans un contexte de marketing, intéresse à présent des domaines aussi variés que les télécommunications, la finance, ou encore la médecine et la bioinformatique. Même s'il existe aujourd'hui de très nombreuses approches efficaces pour extraire des motifs, ces derniers ne sont pas forcément adaptés aux besoins des applications réelles. En fait, les résultats obtenus sont basés sur une mesure statistique et ne tiennent pas compte de la connaissance du domaine. De plus, ces approches sont principalement axées sur la recherche de tendances et ne permettent pas d'extraire des connaissances sur les éléments atypiques ou inattendus. Dans le cadre de cette thèse, nous nous intéressons donc à la problématique de l'extraction de motifs séquentiels et règles inattendus en intégrant la connaissance du domaine. Le travail présenté dans cette thèse comporte la mise en œuvre d'un cadre MUSE pour l'extraction de séquences inattendues par rapport à un système de croyances, des extensions avec la théorie de logique floue, l'intégration des données hiérarchisées, la définition des motifs séquentiels et règles inattendus et, enfin, l'extraction de phrases inattendues dans des documents textes. Des expérimentations menées sur des données synthétiques et sur des données réelles sont rapportées et montrent l'intérêt de nos propositions. Extraction de connaissances fouille de données base de données de séquences mesure d'intérêt système de croyances séquences inattendues motifs séquentiels règles séquentielles logique floue hiérarchie validation classification de textes

Search results