Spelling suggestions: "subject:"motifs"" "subject:"votifs""
421 |
Indépendance de l pour certains systèmes motiviques de représentations galoisiennes.Laskar, Abhijit 08 December 2011 (has links) (PDF)
Soit $X$ une variété algébrique lisse et projectif sur un corps de nombres $F \subset \mathbb{C}$. On suppose que le motif de Hodge absolu $h^i(X)$ appartient à la catégorie Tannakienne engendrée par les motifs des variétés abélienne sur $F$. Pour tout nombre premier $\ell$, le groupe de Galois $\Gamma_F:= Gal(\bar{F}/F)$ opère sur $H_{\ell}(M)$, la réalisation $\ell$-adique de $M$. Quitte à remplacer $F$ par une extension finie, on peut supposer que cette action se factorise par un morphisme $\rho_{M,\ell}: \Gamma_F\rightarrow G_M(\ql)$, où $G_M$ est le groupe de Mumford-Tate de $M$. Fixons une valuation $v$ de $F$ et supposons $v(\ell)=0 $. La restriction $\rho_{M,\ell} \vert_{ \Gamma_{F_v}}$ définit une représentation ${}'W_v \rightarrow G_{M/\ql}$ du groupe de Weil-Deligne de $F_v$. Des conjectures de J-P Serre et J-M Fontaine indiquent que pour tout $\ell $, la représentation ${}'W_v \rightarrow G_{M/\ql}$ est définie sur $\mathbb{Q}$ et pour $\ell$ variable elles forment un système compatible de représentations. Sous certaines hypothèses supplémentaires, nous montrons que ceci est vrai si $X$ a bonne réduction en $v$ où réduction semi-stable en $v$.
|
422 |
Prédictions bioinformatiques des propriétés des domaines de reconnaissance peptidique.Becker, Emmanuelle 26 September 2007 (has links) (PDF)
Les protéines impliquées dans les voies de signalisation sont souvent activées et inactivées par des interactions de faible affinité. En particulier, les domaines protéiques liant spécifiquement de courts fragments protéiques permettent une régulation intra- et inter-moléculaire efficace des domaines catalytiques auxquels ils sont associés. Citons par exemple les domaines FHA ou des tandems BRCT fréquemment impliqués dans les réponses aux dommages de l'ADN. Etant donnée leur importance dans les réseaux d'interactions et dans la signalisation cellulaire, la prédiction par bioinformatique des propriétés de liaison de ces petits domaines constitue un enjeu majeur. Toutefois, les stratégies bioinformatiques sont jusqu'à présent limitées par des difficultés méthodologiques associées aux caractéristiques intrinsèques de ces domaines. Leurs séquences sont souvent très divergentes et les affinités pour leurs cibles physiologiques sont généralement faibles malgré une excellente spécificité. Le travail présenté dans cette thèse a donc pour objectif de dépasser les limites actuelles des outils de prédictions pour développer de nouvelles méthodologies bioinformatiques performantes. Trois points ont été plus particulièrement abordés : (i) la prédiction de la structure tridimensionnelle de ces domaines ; (ii) la prédiction des sites reconnus par ces domaines lorsque les partenaires sont connus ; (iii) la prédiction des motifs spécifiquement reconnus par ces domaines sur la base de leur structure tridimensionnelle.
|
423 |
Calcul de motifs sous contraintes pour la classification superviséeGay, Dominique 30 November 2009 (has links) (PDF)
Ces dernières années, l'extraction de motifs locaux (itemsets fréquents et règles d'association) a suscité beaucoup d'entrain pour la classification supervisée. Cette thèse traite du calcul et de l'usage de motifs sous contraintes pour la classification supervisée. Nous nous attaquons à deux problèmes difficiles en classification supervisée à base de motifs et proposons deux contributions méthodologiques : D'un côté, lorsque les attributs sont bruités, les performances des classifieurs peuvent être désastreuses. Les méthodes existantes consistent à corriger les valeurs d'attributs ou supprimer les objets bruités -- ce qui génère une perte d'information. Dans ce mémoire, nous proposons une méthode générique de construction de descripteurs robustes au bruit d'attributs -- sans modifier les valeurs d'attributs ni supprimer les objets bruités. Notre approche se déroule en deux étapes : premièrement nous extrayons l'ensemble des règles delta-fortes de caractérisation. Ces règles offrent des propriétés de corps minimal, de non-redondance et sont basées sur les itemsets delta-libres et leur delta-fermeture -- qui ont déjà fait leur preuve pour la caractérisation de groupements dans des contextes bruités. Deuxièmement, nous construisons un nouveau descripteur numérique robuste pour chaque règle extraite. Les expérimentations menées dans des données bruitées, montrent que des classifieurs classiques sont plus performants en terme de précision sur les données munies des nouveaux descripteurs que sur les données avec les attributs originaux. D'autre part, lorsque la distribution des classes est inégale, les approches existantes de classification à base de motifs ont tendance à être biaisées vers la classe majoritaire. La précision sur la (ou les) classe(s) majoritaire(s) est alors élevée au détriment de la précision sur la (ou les) classe(s) minoritaire(s). Nous montrons que ce problème est dû au fait que les approches existantes ne tiennent pas compte de la répartition des classes et/ou de la fréquence relative des motifs dans chacune des classes de la base. Pour pallier ce problème, nous proposons un nouveau cadre de travail dans lequel nous extrayons un nouveau type de motifs : les règles de caractérisation One-Versus-Each (OVE-règles). Ce nouveau cadre de travail nécessite le paramétrage d'un nombre conséquent de seuils de fréquence et d'infréquence. Pour ce faire, nous proposons un algorithme d'optimisation de paramètres, fitcare ainsi qu'un algorithme d'extraction d'OVE-règles. Les expérimentations menées sur des données UCI multi-classes disproportionnées et sur des données de diagnostic de méningite aigüe, montrent que notre approche fitcare est plus performante que les approches existantes en terme de précision sur les classes mineures. L'application de notre méthode de classification associative à l'analyse de données d'érosion des sols en Nouvelle-Calédonie a mis en évidence l'intérêt de notre proposition pour caractériser les phénomènes d'érosion.
|
424 |
Study of the Structure and Function of CXC Chemokine Receptor 2Kwon, Hae Ryong 01 December 2010 (has links)
It has been shown that the amino terminus and second extracellular loop (EC2) of CXCR2 are crucial for ligand binding and receptor activation. The lack of an ionic lock motif in the third intracellular loop of CXCR2 focuses an investigation of the mechanism by which these two extracellular regions contribute to receptor recognition and activation.
The first objective of this investigation was to predict the structure of CXCR2 based on known structures of crystallized GPCRs. Rhodopsin, β2-adrenergic receptor, CXCR4 were used for homology modeling of CXCR2 structure. Highly conserved motifs found in sequence alignments of the template GPCRs were helpful to generate CXCR2 models. We also studied solvent accessibility of residues in the EC2 of CXCR2 in the inactive state. Most of the residues in the EC2 were found to be solvent accessible in the inactive state, suggesting the residues might be involved in ligand recognition.
Second, we studied the role of charged residues in the EC2 of CXCR2 in ligand binding and receptor activation using constitutively active mutants (CAM) of CXCR2, D9K and D9R. Combinatorial mutations consisting of the CAM in the amino terminus and single mutations of charged residues in the EC2 were generated to study two concepts including “attraction” and “repulsion” models. The mutant receptors were used to test their effects on cell surface expression, ligand binding, receptor activation through PLC-β3, and cellular transformation. All the mutations in the repulsion model result in CXCR2 receptors that are unable to bind ligand, suggesting that each of the Arg residues in the EC2 are important for ligand recognition. Interestingly, mutations in the attraction model partially inhibited receptor activation by the CAM D9K, suggesting that Glu198 and Asp199 residues in the EC2 are associated with receptor activation. Furthermore, a novel CAM, E198A/D199A, was identified in this study. These negatively charged residues are very close to a conserved disulfide bond linking the EC2 and the third transmembrane.
In this sense, these current discoveries concerning the structural basis of CXCR2 and interdisciplinary approaches would provide new insights to investigate unknown mechanisms of interaction with its cognate ligands and receptor activation.
|
425 |
Das Phantastische als Erzählstrategie in vier zeitgenössischen Romanen / The fantastic as a narrative strategy in four contemporary novelsSchnaas, Ulrike January 2004 (has links)
The present dissertation investigates the use of the fantastic and its functions in contemporary prose, the initial hypothesis being that the fantastic is not historically exhausted, but continues to be productive. The major part of this study consists of a close reading of four novels printed between 1995 and 2001: Marie Hermanson’s Värddjuret (1995), Majgull Axelsson’s Aprilhäxan (1997), Karen Duve’s Regenroman (1999) and Elfriede Kern’s Schwarze Lämmer (2001). Tzvetan Todorov’s definition of the fantastic as structural ambiguity is fundamental to the dissertation. In order not to bind the definition to a normative concept of genre, the fantastic is in this study considered as a narrative strategy. The dissertation’s analyses demonstrate that in these contemporary novels there is considerable variation of narrative devices, as well as of intertextual motifs deriving from the ‘archive’ provided by the tradition of the fantastic. The fantastic is to a great extent intertextual, but does not merely function as a “signal of fiction” in a postmodern game where ambiguity is no longer relevant. Instead, the narrated world in these novels is characterized by a deeply-rooted ambivalence, heterogeneity and instability. Both attractive and dangerous, the fantastic corresponds to a meeting with “the other” and the unknown, while dampening the conflict between the supernatural and the natural so clearly seen in Todorov. What is central is not the crisis of perception undergone by the novel’s characters as they choose between two opposing views of reality, but their mental state of mind. These characters are in a condition of “betwixt and between”, which in all four novels is linked to the theme of the artist. Via the fantastic, Regenroman initiates a confrontation with male myths of the artist and images of women. Schwarze Lämmer also engages the romantic fantastic tradition and investigates the link between adolescent delusions of grandeur and artistic creativity. Värddjuret, on the other hand, depicts the genesis of a female artist, while Aprilhäxan presents the female artist’s monstrous image of herself and fantasies of omnipotence. An additional function of the fantastic in these four novels is to thematize a concept of reality that is based, not on the contrast between the natural and the supernatural, but on the possibility of several different realities.
|
426 |
miRNAMatcher: High throughput miRNA discovery using regular expressions obtained via a genetic algorithm.Duvenage, Eugene. January 2008 (has links)
<p>In summary there currently exist techniques to discover miRNA however both require many calculations to be performed during the identification limiting their use at a genomic level. Machine learning techniques are currently providing the best results by combining a number of calculated and statistically derived features to identify miRNA candidates, however almost all of these still include computationally intensive secondary-structure calculations. It is the aim of this project to produce a miRNA identification process that minimises and simplifies the number of computational elements required during the identification process.</p>
|
427 |
Deciphering enhancer activity in Drosophila based on transcription factor occupancy and chromatin state chromatin state characterizationGirardot, Charles 09 July 2012 (has links) (PDF)
La caractérisation des modules cis-régulateurs (CRM) ainsi que de leur activité sont essentiels pour comprendre la régulation des gènes au cours du développement des métazoaires. La technique de l'immunoprécipitation de la chromatine suivie du séquenage à haut débit de l'ADN (ChIP-seq) constitue une approche puissante pour localiser les CRM. Afin de localiser des facteurs génériques au sein de tissus spécifiques, nous avons développé une approche ChIP-seq sur des noyaux triés par cytométrie de flux et localisons des modifications post-traductionelles de l'histone H3, ainsi que l'ARN polymérase II (PolII) dans le mésoderme de la Drosophile. Nous montrons que les CRM actifs sont caractérisés par la présence d'H3 modifiés (K27Ac et K79me3) et de PolII. De plus, la présence et la forme des signaux correspondants à ces marques corrèlent dynamiquement avec l'activité des CRM. Enfin, nous prédisons la présence de CRM actifs et confirmons leur activité in vivo à 89%. Paralllement, nous étudions comment cinq facteurs essentiels au développement cardiaque se coordonnent en cis au sein du mésoderme dorsal, précurseur des mésodermes cardiaque (MC) et viscéral (MV). Nous démontrons que ces facteurs sont recrutés en tant que collectif au niveau des CRM cardiaques via un nombre limité de sites de fixation et en l'absence de contraintes architecturales. En outre, nous découvrons que ces facteurs cardiaques sont recrutés au niveau de CRM actifs dans le MV voisin et activement réprimés dans le MC, reflétant ainsi l'origine tissulaire commune de ces deux populations cellulaires. Nous concluons que les CRM impliqués dans le développement peuvent présenter une empreinte développementale.
|
428 |
Analysis of the subsequence composition of biosequencesCunial, Fabio 07 May 2012 (has links)
Measuring the amount of information and of shared information in biological strings, as well as relating information to structure, function and evolution, are fundamental computational problems in the post-genomic era. Classical analyses of the information content of biosequences are grounded in Shannon's statistical telecommunication theory, while the recent focus is on suitable specializations of the notions introduced by Kolmogorov, Chaitin and Solomonoff, based on data compression and compositional redundancy. Symmetrically, classical estimates of mutual information based on string editing are currently being supplanted by compositional methods hinged on the distribution of controlled substructures.
Current compositional analyses and comparisons of biological strings are almost exclusively limited to short sequences of contiguous solid characters. Comparatively little is known about longer and sparser components, both from the point of view of their effectiveness in measuring information and in separating biological strings from random strings, and from the point of view of their ability to classify and to reconstruct phylogenies. Yet, sparse structures are suspected to grasp long-range correlations and, at short range, they are known to encode signatures and motifs that characterize molecular families.
In this thesis, we introduce and study compositional measures based on the repertoire of distinct subsequences of any length, but constrained to occur with a predefined maximum gap between consecutive symbols. Such measures highlight previously unknown laws that relate subsequence abundance to string length and to the allowed gap, across a range of structurally and functionally diverse polypeptides. Measures on subsequences are capable of separating only few amino acid strings from their random permutations, but they reveal that random permutations themselves amass along previously undetected, linear loci. This is perhaps the first time in which the vocabulary of all distinct subsequences of a set of structurally and functionally diverse polypeptides is systematically counted and analyzed.
Another objective of this thesis is measuring the quality of phylogenies based on the composition of sparse structures. Specifically, we use a set of repetitive gapped patterns, called motifs, whose length and sparsity have never been considered before. We find that extremely sparse motifs in mitochondrial proteomes support phylogenies of comparable quality to state-of-the-art string-based algorithms. Moving from maximal motifs -- motifs that cannot be made more specific without losing support -- to a set of generators with decreasing size and redundancy, generally degrades classification, suggesting that redundancy itself is a key factor for the efficient reconstruction of phylogenies. This is perhaps the first time in which the composition of all motifs of a proteome is systematically used in phylogeny reconstruction on a large scale.
Extracting all maximal motifs, or even their compact generators, is infeasible for entire genomes. In the last part of this thesis, we study the robustness of measures of similarity built around the dictionary of LZW -- the variant of the LZ78 compression algorithm proposed by Welch -- and of some of its recently introduced gapped variants. These algorithms use a very small vocabulary, they perform linearly in the input strings, and they can be made even faster than LZ77 in practice. We find that dissimilarity measures based on maximal strings in the dictionary of LZW support phylogenies that are comparable to state-of-the-art methods on test proteomes. Introducing a controlled proportion of gaps does not degrade classification, and allows to discard up to 20% of each input proteome during comparison.
|
429 |
A structural classification of protein-protein interactions for detection of convergently evolved motifs and for prediction of protein binding sites on sequence levelHenschel, Andreas 03 February 2009 (has links) (PDF)
BACKGROUND: A long-standing challenge in the post-genomic era of Bioinformatics is the prediction of protein-protein interactions, and ultimately the prediction of protein functions. The problem is intrinsically harder, when only amino acid sequences are available, but a solution is more universally applicable. So far, the problem of uncovering protein-protein interactions has been addressed in a variety of ways, both experimentally and computationally. MOTIVATION: The central problem is: How can protein complexes with solved threedimensional structure be utilized to identify and classify protein binding sites and how can knowledge be inferred from this classification such that protein interactions can be predicted for proteins without solved structure? The underlying hypothesis is that protein binding sites are often restricted to a small number of residues, which additionally often are well-conserved in order to maintain an interaction. Therefore, the signal-to-noise ratio in binding sites is expected to be higher than in other parts of the surface. This enables binding site detection in unknown proteins, when homology based annotation transfer fails. APPROACH: The problem is addressed by first investigating how geometrical aspects of domain-domain associations can lead to a rigorous structural classification of the multitude of protein interface types. The interface types are explored with respect to two aspects: First, how do interface types with one-sided homology reveal convergently evolved motifs? Second, how can sequential descriptors for local structural features be derived from the interface type classification? Then, the use of sequential representations for binding sites in order to predict protein interactions is investigated. The underlying algorithms are based on machine learning techniques, in particular Hidden Markov Models. RESULTS: This work includes a novel approach to a comprehensive geometrical classification of domain interfaces. Alternative structural domain associations are found for 40% of all family-family interactions. Evaluation of the classification algorithm on a hand-curated set of interfaces yielded a precision of 83% and a recall of 95%. For the first time, a systematic screen of convergently evolved motifs in 102.000 protein-protein interactions with structural information is derived. With respect to this dataset, all cases related to viral mimicry of human interface bindings are identified. Finally, a library of 740 motif descriptors for binding site recognition - encoded as Hidden Markov Models - is generated and cross-validated. Tests for the significance of motifs are provided. The usefulness of descriptors for protein-ligand binding sites is demonstrated for the case of &quot;ATP-binding&quot;, where a precision of 89% is achieved, thus outperforming comparable motifs from PROSITE. In particular, a novel descriptor for a P-loop variant has been used to identify ATP-binding sites in 60 protein sequences that have not been annotated before by existing motif databases.
|
430 |
Groupe fondamental premier à p, nombre de Milnor des singularités isolées, motifs de dimension inférieure ou égale à 1Orgogozo, Fabrice 30 June 2003 (has links) (PDF)
Dans le premier chapitre, on démontre divers résultats sur le plus grand quotient du groupe fondamental étale premier aux caractéristiques, parmi lesquels la formule de Künneth et l'invariance par changement de corps séparablement clos pour les schémas de type fini sur un corps. Ces énoncés sont déduits de faits généraux sur les images directes de champs, une fois spécialisés au cas des torseurs sous un groupe constant fini d'ordre inversible sur la base. Des résultats analogues<br />pour le groupe fondamental modéré sont également discutés.<br /><br />Au deuxième chapitre, on déduit de la formule du conducteur, conjecturée par S. Bloch, celle de P. Deligne exprimant, dans le cas d'une singularité isolée, la dimension totale des cycles évanescents en fonction du nombre de Milnor.<br />En particulier, la formule de Deligne est établie en dimension relative un.<br /><br />Dans le troisième chapitre, on compare les 1-isomotifs de P. Deligne sur un corps avec la théorie de V. Voevodsky en dimension inférieure à 1.
|
Page generated in 0.0457 seconds