211 |
Système d'information géographique temporelle maritime ; Des distances linéaires à l'analyse temps réel des trajectoiresDevogele, Thomas 01 December 2009 (has links) (PDF)
Les Systèmes d'Information Géographique (SIG) gèrent des informations complexes localisées dans un espace géographique. Durant la dernière décennie, ces systèmes ont vu l'émergence d'une part des SIG en trois dimensions et plus particulièrement des modèles numériques de terrain (MNT) et d'autre part de l'intégration de données temporelles. Les travaux de recherche en informatique présentés dans ce manuscrit s'attaquent à ces deux thématiques et sont appliqués au domaine maritime. En termes de MNT, ces recherches ont essentiellement porté sur l'intégration de MNT terrestre et maritime. Une méthode de fusion générant un MNT continu a été définie. Elle est basée sur l'appariement d'éléments caractéristiques linéaires (crêtes, talwegs, lignes de rupture de pente). Elle emploie des distances linéaires discrètes introduites par Fréchet. Ces distances fournissent des vecteurs d'appariement autorisant la fusion de MNT à l'aide d'une technique de déformation élastique. En ce qui concerne les SIG spatio-temporels, ces travaux concernent les déplacements d'objets mobiles et plus particulièrement les navires. Dans le cadre de la navigation maritime, les SIG ont une place prépondérante via les aides à la navigation, les systèmes de surveillance du trafic et les simulateurs de formation. Dans ce cadre, un nouveau modèle de représentation des déplacements, la vue relative, a été formalisé. Ce formalisme s'appuie sur la perception humaine de l'espace spatio-temporel et des objets mobiles. Cette représentation est complémentaire de la représentation absolue. Les déplacements relatifs vis-à-vis d'un objet référent sont ainsi plus facilement analysables. Les évolutions des distances et des vitesses relatives sont mieux perçues. Parallèlement, une simulation des activités de navires à l'aide de systèmes multi-agents a été conçue. Les déplacements simultanés d'un grand nombre de navires dans un environnement maritime sont ainsi simulés. Elle prend en compte les différentes activités concurrentes des objets mobiles et les contraintes géographiques. Qui plus est, elle intègre des raisonnements à base de patrons pour reproduire les raisonnements humains. Finalement, à partir des bases de données historiques des positions d'objets mobiles dans un environnement ouvert, des techniques d'extractions des trajectoires et de fouille de données spatio-temporelles ont été réalisées. Elles permettent pour chaque itinéraire et chaque type d'objets de définir des routes types spatio-temporelles et de détecter à la volée des comportements inhabituels. Ces travaux, bien qu'appliqués au domaine maritime, sont génériques. Les méthodes de fusion de MNT peuvent être appliquées à tous types de MNT ayant des zones de recouvrement. De même, les travaux de modélisation, d'analyses et de simulation sur les objets mobiles sont adaptables à tous les déplacements d'objets mobiles dans des espaces ouverts.
|
212 |
Développement et mise en oeuvre de détecteurs silicium à micropistes pour l'expérience STARGuédon, Magalie 11 May 2005 (has links) (PDF)
Cette étude s'inscrit dans le cadre de la recherche de la formation d'un plasma de quarks et de gluons dans l'expérience STAR au RHIC. Elle concerne l'ajout d'un ensemble cylindrique de détecteurs en silicium, à micropistes, double face (SSD) au trajectographe interne du détecteur STAR. Cet ajout permet une amélioration globale de la trajectographie du détecteur STAR. Le SSD forme un cylindre de 1 m de long pour 23 cm de rayon et est composé de 320 modules compacts identiques. Les modules sont formés d'un détecteur, de 12 circuits de lecture ALICE 128C, de 12 rubans TAB, d'un circuit de contrôle COSTAR et de 2 circuits hybrides qui supportent l'ensemble des composants. La thèse montre le gain en performances physiques apportées par le SSD, ainsi que les différents choix technologiques, en particulier celui des détecteurs en silicium à micropistes, ainsi qu'une caractérisation des performances sous faisceau. Tous les composants sont décrits ainsi que leurs caractéristiques et l'ensemble des procédures de test qui ont été définie pour chacun des composants afin d'en établir la fonctionnalité et les propriétés. L'ensemble des données des composants et des tests est stocké dans une base de données. Les résultats obtenus pour la production des modules et de leurs composants sont présentés. Deux études parallèles ont été menées : l'une sur l'influence de la température environnementale, l'autre sur le réglage optimal des blocs analogiques du circuit ALICE 128C. L'installation du SSD sur le site de RHIC, sa mise en opération et les premières prises de données physiques sont présentées.
|
213 |
Federation de données semi-structurées avec XMLDang Ngoc, Tuyet Tram 10 June 2003 (has links) (PDF)
Contrairement aux données traditionnelles, les données semi-structurées<br />sont irrégulières : des données peuvent manquer, des concepts<br />similaires peuvent être représentés par différents types de données,<br />et les structures même peuvent être mal connues. Cette absence <br />de schéma prédéfini, permettant de tenir compte de toutes les données<br />du monde extérieur, présente l'inconvénient de complexifier les<br />algorithmes d'intégration des données de différentes sources.<br /><br />Nous proposons une architecture de médiation basée entièrement sur XML.<br />L'objectif de cette architecture de médiation est de fédérer des sources de<br />données distribuées de différents types.<br />Elle s'appuie sur le langage XQuery, un langage fonctionnel<br />conçu pour formuler des requêtes sur des documents XML. Le médiateur analyse<br />les requêtes exprimées en XQuery et répartit l'exécution de la requête<br />sur les différentes sources avant de recomposer les résultats.<br /><br />L'évaluation des requêtes doit se faire en exploitant au maximum les<br />spécificités des données et permettre une optimisation efficace.<br />Nous décrivons l'algèbre XAlgebre à base d'opérateurs conçus<br />pour XML. Cette algèbre a pour but de construire des plans d'exécution pour<br />l'évaluation de requêtes XQuery et traiter des tuples d'arbres XML.<br /><br />Ces plans d'exécution doivent pouvoir être modélisés par un modèle<br />de coût et celui de coût minimum sera sélectionné pour l'exécution. <br />Dans cette thèse, nous définissons un modèle de coût pour les données<br />semi-structurées adapté à notre algèbre.<br /><br />Les sources de données (SGBD, serveurs Web, moteur de recherche)<br />peuvent être très hétérogènes, elles peuvent avoir des<br />capacités de traitement de données très différentes, mais aussi avoir<br />des modèles de coût plus ou moins définis. <br />Pour intégrer ces différentes informations dans<br />l'architecture de médiation, nous devons déterminer comment communiquer<br />ces informations entre le médiateur et les sources, et comment les intégrer.<br />Pour cela, nous utilisons des langages basés sur XML comme XML-Schema et MathML<br />pour exporter les informations de métadonnées, de formules de coûts<br />et de capacité de sources.<br />Ces informations exportées sont communiquées par l'intermédiaire d'une interface<br />applicative nommée XML/DBC.<br /><br />Enfin, des optimisations diverses spécifiques à l'architecture de médiation<br />doivent être considérées. Nous introduisons pour cela un cache sémantique<br />basé sur un prototype de SGBD stockant efficacement des données XML<br />en natif.
|
214 |
Extraction de Connaissances pour la Modelisation tri-dimensionnelle de l'Interactome StructuralGhoorah, Anisah 22 November 2012 (has links) (PDF)
L'étude structurale de l'interactome cellulaire peut conduire à des découvertes intéressantes sur les bases moléculaires de certaines pathologies. La modélisation par homologie et l'amarrage de protéines ("protein docking") sont deux approches informatiques pour modéliser la structure tri-dimensionnelle (3D) d'une interaction protéine-protéine (PPI). Des études précédentes ont montré que ces deux approches donnent de meilleurs résultats quand des données expérimentales sur les PPIs sont prises en compte. Cependant, les données PPI ne sont souvent pas disponibles sous une forme facilement accessible, et donc ne peuvent pas être re-utilisées par les algorithmes de prédiction. Cette thèse présente une approche systématique fondée sur l'extraction de connaissances pour représenter et manipuler les données PPI disponibles afin de faciliter l'analyse structurale de l'interactome et d'améliorer les algorithmes de prédiction par la prise en compte des données PPI. Les contributions majeures de cette thèse sont de : (1) décrire la conception et la mise en oeuvre d'une base de données intégrée KBDOCK qui regroupe toutes les interactions structurales domaine-domaine (DDI); (2) présenter une nouvelle méthode de classification des DDIs par rapport à leur site de liaison dans l'espace 3D et introduit la notion de site de liaison de famille de domaines protéiques ("domain family binding sites" ou DFBS); (3) proposer une classification structurale (inspirée du système CATH) des DFBSs et présenter une étude étendue sur les régularités d'appariement entre DFBSs en terme de structure secondaire; (4) introduire une approche systématique basée sur le raisonnement à partir de cas pour modéliser les structures 3D des complexes protéiques à partir des DDIs connus. Une interface web (http://kbdock.loria.fr) a été développée pour rendre accessible le système KBDOCK. Le système KBDOCK couvre plus de 2,700 hetero DDIs non-redondantes correspondant à 1,439 DFBSs localisés sur 947 domaines Pfam distincts. KBDOCK a permis de réaliser plusieurs études étendues. Par exemple, KBDOCK a été utilisé pour montrer que: (1) après de 70% de familles de domaines protéiques n'ont qu'un seul DFBS et les autres familles en ont un petit nombre seulement, ce qui suggère que les DDIs re-utilisent souvent les mêmes sites de liaison; (2) plus de 80% de DFBSs interagissent avec une seule famille de domaines protéiques et les autres DFBSs interagissent avec un petit nombre de familles, ce qui indique que la plupart des DFBSs sont principalement monogames dans leur interactions avec les autres domaines protéiques; (3) les DFBSs impliqués dans des interactions présentent des régularités en terme de structure secondaire, ce qui pourrait servir comme un descripteur complémentaire dans la prédiction d'interaction; (4) lorsque les domaines re-utilisent leur DFBS, le docking orienté vient améliorer les prédictions. Ainsi, KBDOCK constitue une ressource unifiée qui permet d'enrichir les connaissances sur l'interactome structural.
|
215 |
Extraction de séquences fréquentes : des données numériques aux valeurs manquantesFiot, Céline 28 September 2007 (has links) (PDF)
La quantité de données aujourd'hui emmagasinées dans tous les domaines ainsi que leur diversité d'origines et de formats rendent impossibles l'analyse, le résumé ou l'extraction manuelle de connaissances. Pour répondre à ces besoins, diverses communautés se sont intéressées à la conception et au développement d'outils permettant d'extraire automatiquement de la connaissance de ces grandes bases. Désormais ces travaux visent à prendre en compte l'hétérogénéité de ces données, de leur format et de leur qualité. Notre travail s'inscrit dans cet axe de recherche et, plus précisément, dans le contexte de la découverte de schémas fréquents à partir de données regroupées sous la forme de séquences ordonnées. Ces schémas, appelés motifs séquentiels, n'étaient jusqu'alors extraits que sur des bases de données de séquences symboliques et parfaites, c'est-à-dire des bases ne contenant que des informations binaires ou pouvant être traitées comme telles et ne contenant aucun enregistrement incomplet. Nous avons donc proposé plusieurs améliorations des techniques d'extraction de séquences fréquentes afin de prendre en compte des données hétérogènes, incomplètes, incertaines ou mal connues de leur utilisateur, tout en minimisant les pertes éventuelles d'informations. Ainsi, le travail présenté dans cette thèse comporte la mise en oeuvre d'un cadre pour l'extraction de motifs séquentiels en présence de données numériques quantitatives, la définition de contraintes temporelles relâchées autorisant l'utilisateur à spécifier des contraintes temporelles approximatives et permettant un tri des résultats obtenus selon un indice de précision temporelle, enfin, le développement de deux approches pour l'extraction de motifs séquentiels sur des données symboliques incomplètes.
|
216 |
L’archivage numérique des projets « Europan » comme situation d’analyse scientifique du concours d’idées en architectureGomes Alves, Lino José 12 1900 (has links)
Il existe somme toute peu de théories du projet offrant une modélisation construite à partir de la complexité et de la diversité du projet d’architecture. Pourtant,certaines situations rassemblant parfois plusieurs dizaines de projets s’offrent d’elles-mêmes comme des situations comparatives et expérimentales : les concours d’architecture, d’urbanisme et de paysage.
Le Laboratoire d’étude de l’architecture potentielle de l’Université de Montréal (Aménagement), après avoir développé un système d’archivage numérique des concours canadiens, a entrepris, avec le soutien du Groupement d’intérêt public « Europe des projets architecturaux et urbains », de développer la base de données documentaire des concours d’idées Europan. Au-delà des
questions d’archivage numérique, se profilent clairement des possibilités de théorisation s’appuyant sur les logiques d’une base de données, en particulier sur la constitution du diagramme entités et relations, modélisation indispensable à sa traduction informatique.
Cette recherche entreprend une première mise à jour de ces éléments conceptuels et tend à montrer que la base de données est un véritable modèle théorique du projet ouvrant sur de nouvelles avenues de recherche et de
connaissance. / There are not many theories of project offering a modeling constructed from the complexity and diversity of the architecture project. However, certain situations bringing together dozens of projects, present themselves as comparable and experimental situations: architectural, urban and landscape competitions.
The Laboratoire d'étude de l'architecture potentielle from the Université de Montréal (Environmental Design), having developed a system of digital archiving for Canadian competitions, has undertaken, with the support of Groupement d'intérêt public “Europe des projets architecturaux et urbains”, the development of a database comprised of the documentation of competition ideas of Europan. Beyond the issues of digital archiving, there are clearly theorizing possibilities based on the logic of a database, particularly on the structure of the entity/relationship diagram, an indispensable modeling necessary for its computer translation.
This research is undertaking a first update of these conceptual elements and suggests that the database is a theoretical model of the project opening up new venues for research and knowledge.
|
217 |
Adaptation dynamique des architectures réparties pour jeux massivement multijoueursLegtchenko, Sergey 25 October 2012 (has links) (PDF)
Durant la dernière décennie, Les jeux massivement multijoueurs (MMOGs) sont devenus extrêmement populaires et comptent désormais plus de 20 millions d'utilisateurs actifs à travers le monde. Les MMOGs sont des systèmes distribués ayant des contraintes applicatives fortes en terme de cohérence de données, persistance, réactivité et passage à l'échelle. L'évolution des besoins applicatifs du MMOG au cours du temps est difficilement prévisible car dépendante du comportement des joueurs dans le monde virtuel. C'est pourquoi, malgré un important effort de recherche dans le domaine, aucune des architectures proposées ne satisfait pleinement toutes les contraintes requises. Cette thèse explore les capacités des architectures distribuées à s'adapter à la charge applicative grâce à une prise en compte du comportement des joueurs lors de l'exécution. Le système est alors capable de détecter des évolutions qui sont difficiles à prévoir à priori, et dynamiquement allouer les ressources nécessaires à l'application. Nous décrivons différentes techniques de surveillance des joueurs et proposons des moyens de prendre en compte ces informations au niveau de l'architecture. Nos expériences, effectuées dans des conditions réalistes, montrent que nos mécanismes ont un surcoût limité et permettent d'améliorer les performances globales du système.
|
218 |
Modèles bio-informatiques pour les peptides non-ribosomiques et leurs synthétasesPupin, Maude 03 December 2013 (has links) (PDF)
Je présente dans ce mémoire de HDR le travail pionnier de la bio-informatique pour les peptides non-ribosomiques (PNR). Ces recherches ont été initiées sur Lille en 2006 et ont abouti à l'unique plate-forme d'analyse bio-informatique des PNR appelée Norine, dont je suis un des membres fondateurs. Les peptides non-ribosomiques font partie des petites molécules produites par les micro-organismes, bactéries et fungi, pour coloniser leur milieu. Ces peptides particuliers ont l'avantage d'avoir une grande variété de structures. En effet, ils peuvent être linéaires, mais aussi contenir des cycles et/ou des branchements et sont composés de plus de 500 briques de base différentes. Cette variété provient de leur synthèse réalisée par de gros complexes enzymatiques, les synthétases peptidiques non-ribosomiques (PNRS). Ceux-ci sélectionnent les acides aminés et d'autres composés, appelés monomères, puis les assemblent en formant des liaisons peptidiques et d'autres liaisons. Ainsi, les peptides non-ribosomiques présentent une grande diversité d'activités telles que antibiotique, anti-cancéreux ou immuno-suppresseur. Certains, comme la pénicilline, sont des médicaments employés fréquemment. Dans une première partie, je propose un regard différent sur les synthétases en associant les particularités des peptides aux fonctions enzymatiques nécessaires à les réaliser. Puis, je décris les principales étapes nécessaires à la conception d'un outil d'analyse des séquences protéiques de PNRS en précisant les particularités des outils existants. Ensuite, je présente ma contribution à l'exploration du potentiel de synthèse de PNR à partir de séquences génomiques ou protéiques à travers ma participation à la mise au point d'un protocole d'analyses bio-informatiques et à l'annotation de plusieurs génomes. Dans une seconde partie, je commence par préciser les apports de la plate-forme Norine sur la compréhension de la diversité des peptides non-ribosomiques, complétés par une étude de la chimie de ces molécules. Ensuite, je présente les quelques bases de données et outils en relation avec ces peptides, qui sont développés par ailleurs. Puis, je présente la plate-forme Norine en exposant mes contributions et en proposant la modernisation du processus de collecte des données et l'évolution des fonctionnalités d'interrogation via les structures peptidiques. Je termine par la présentation d'une nouvelle perspective : la chémo-informatique dédiée aux peptides non-ribosomiques avec pour objectif la prédiction d'une ou plusieurs synthétases capables de produire un peptide ayant une activité cible.
|
219 |
Étude des anomalies du développement humain# un modèle d’analyse phénotypiqueArbabzadeh, Farideh 07 1900 (has links)
Depuis le début des années 90, le projet génome humain a permis l’émergence de
nombreuses techniques globalisantes porteuses du suffixe –omique : génomique,
transcriptomique, protéomique, épigénomique, etc.…
L’étude globale de l’ensemble des phénotypes humains (« phénome ») est à l’origine de
nouvelles technologies constituant la « phénomique ». L’approche phénomique permet de
déterminer des liens entre des combinaisons de traits phénomiques.
Nous voulons appliquer cette approche à l’étude des malformations humaines en
particulier leurs combinaisons, ne formant des syndromes, des associations ou des
séquences bien caractérisés que dans un petit nombre de cas.
Afin d’évaluer la faisabilité de cette approche, pour une étude pilote nous avons décidé
d’établir une base de données pour la description phénotypique des anomalies foetales.
Nous avons effectué ces étapes :
o Réalisation d’une étude rétrospective d’une série d’autopsies de foetus au CHU
Sainte- Justine (Montréal, QC, Canada) entre 2001-2006
o Élaboration de trois thésaurus et d’une ontologie des anomalies développementales
humaines
o Construction une base de données en langage MySQL
Cette base de données multicentrique accessible sur (http://www.malformations.org), nous
permet de rechercher très facilement les données phénotypiques des 543 cas observés
porteurs d’une anomalie donnée, de leur donner une description statistique et de générer les
différents types d’hypothèses. Elle nous a également permis de sélectionner 153 cas de
foetus malformés qui font l’objet d’une étude de micropuce d’hybridation génomique
comparative (aCGH) à la recherche d’une anomalie génomique. / Since the early 90s, the Human Genome Project (HGP) has allowed the development of
numerous worldwide techniques which carried the suffix “omic”: genomic, transcriptomic,
proteomic, epigenomic, etc…. The global investigation of the sets of human phenotypes
(phenome) is called phenomic. With phenomic studies we should be able to determine the
links among similar phenotypic groups.
We wish to apply this approach to human dysmorphology, particularly malformation
combinations, which form characteristic malformation associations, malformation
sequences, malformation syndromes or malformation disorders only in a minority of cases.
As a graduate student research project, we decided to perform a retrospective study of
the sets of pathology reports including 543 fetuses autopsied in the Department of
Pathology of CHU Sainte-Justine (Montreal, QC, Canada) between 2001 and 2006.
We have established an open Malformation Database (MDB) which can be accessed at
http://www.malformations.org. To achieve this, we conducted the following steps:
o Realization of a retrospective study of fetopathology reports for fetal
malformations.
o Development of an ontology along with three thesauruses of human developmental
anomalies.
o Implementation of these thesauruses and ontology in the MySQL system.
This hypothesis-generating database allows us to easily retrieve the fetal cases
(phenotypic data) with anomalies, calculate the frequencies of these anomalies, and
evaluate the feasibility of the phenomic approach to human dysmorphogenesis. We were
able as well to select 153 cases of malformed fetuses which will be the subject of aCGH array study for genomic research of human anomalies.
|
220 |
Identification de nouveaux substrats des kinases Erk1/2 par une approche bio-informatique, pharmacologique et phosphoprotéomiqueCourcelles, Mathieu 12 1900 (has links)
La phosphorylation est une modification post-traductionnelle omniprésente des protéines Cette modification est ajoutée et enlevée par l’activité enzymatique respective des protéines kinases et phosphatases. Les kinases Erk1/2 sont au cœur d’une voie de signalisation importante qui régule l’activité de protéines impliquées dans la traduction, le cycle cellulaire, le réarrangement du cytosquelette et la transcription. Ces kinases sont aussi impliquées dans le développement de l’organisme, le métabolisme du glucose, la réponse immunitaire et la mémoire. Différentes pathologies humaines comme le diabète, les maladies cardiovasculaires et principalement le cancer, sont associées à une perturbation de la phosphorylation sur les différents acteurs de cette voie. Considérant l’importance biologique et clinique de ces deux kinases, connaître l’étendue de leur activité enzymatique pourrait mener au développement de nouvelles thérapies pharmacologiques.
Dans ce contexte, l’objectif principal de cette thèse était de mesurer l’influence de cette voie sur le phosphoprotéome et de découvrir de nouveaux substrats des kinases Erk1/2. Une étude phosphoprotéomique de cinétique d’inhibition pharmacologique de la voie de signalisation Erk1/2 a alors été entreprise. Le succès de cette étude était basé sur trois technologies clés, soit l’enrichissement des phosphopeptides avec le dioxyde de titane, la spectrométrie de masse haut débit et haute résolution, et le développement d’une plateforme bio-informatique nommée ProteoConnections. Cette plateforme permet d’organiser les données de protéomique, évaluer leur qualité, indiquer les changements d’abondance et accélérer l’interprétation des données. Une fonctionnalité distinctive de ProteoConnections est l’annotation des sites phosphorylés identifiés (kinases, domaines, structures, conservation, interactions protéiques phospho-dépendantes). Ces informations ont été essentielles à l’analyse des 9615 sites phosphorylés sur les 2108 protéines identifiées dans cette étude, soit le plus large ensemble rapporté chez le rat jusqu’à ce jour. L’analyse des domaines protéiques a révélé que les domaines impliqués dans les interactions avec les protéines, les acides nucléiques et les autres molécules sont les plus fréquemment phosphorylés et que les sites sont stratégiquement localisés pour affecter les interactions.
Un algorithme a été implémenté pour trouver les substrats potentiels des kinases Erk1/2 à partir des sites identifiés selon leur motif de phosphorylation, leur cinétique de stimulation au sérum et l’inhibition pharmacologique de Mek1/2. Une liste de 157 substrats potentiels des kinases Erk1/2 a ainsi été obtenue. Parmi les substrats identifiés, douze ont déjà été rapportés et plusieurs autres ont des fonctions associées aux substrats déjà connus. Six substrats (Ddx47, Hmg20a, Junb, Map2k2, Numa1, Rras2) ont été confirmés par un essai kinase in vitro avec Erk1. Nos expériences d’immunofluorescence ont démontré que la phosphorylation de Hmg20a sur la sérine 105 par Erk1/2 affecte la localisation nucléocytoplasmique de cette protéine.
Finalement, les phosphopeptides isomériques positionnels, soit des peptides avec la même séquence d’acides aminés mais phosphorylés à différentes positions, ont été étudiés avec deux nouveaux algorithmes. Cette étude a permis de déterminer leur fréquence dans un extrait enrichi en phosphopeptides et d’évaluer leur séparation par chromatographie liquide en phase inverse. Une stratégie analytique employant un des algorithmes a été développée pour réaliser une analyse de spectrométrie de masse ciblée afin de découvrir les isomères ayant été manqués par la méthode d’analyse conventionnelle. / Phosphorylation is an omnipresent post-translational modification of proteins that regulates numerous cellular processes. This modification is controlled by the enzymatic activity of protein kinases and phosphatases. Erk1/2 kinases are central to an important signaling pathway that modulates translation, cell cycle, cytoskeleton rearrangement and transcription. They are also implicated in organism development, glucose metabolism, immune response and memory. Different human pathologies such as diabetes, cardiovascular diseases, and most importantly cancer, are associated with misregulation or mutations in members of this pathway. Considering the biological and clinical importance of those two kinases, discovering the extent of their enzymatic activity could favor the development of new pharmacological therapies.
In this context, the principal objective of this thesis was to measure the influence of this pathway on the phosphoproteome and to discover new substrates of the Erk1/2 kinases. A phosphoproteomics study on the pharmacological inhibition kinetics of the Erk1/2 signaling pathway was initiated. The success of this study was based on three key technologies such as phosphopeptides enrichment with titanium dioxide, high-throughput and high-resolution mass spectrometry, and the development of ProteoConnections, a bioinformatics analysis platform. This platform is dedicated to organize proteomics data, evaluate data quality, report changes of abundance and accelerate data interpretation. A distinctive functionality of ProteoConnections is the annotation of phosphorylated sites (kinases, domains, structures, conservation, phospho-dependant protein interactions, etc.). This information was essential for the dataset analysis of 9615 phosphorylated sites identified on 2108 proteins during the study, which is, until now, the largest one reported for rat. Protein domain analysis revealed that domains implicated in proteins, nucleic acids and other molecules binding were the most frequently phosphorylated and that these sites are strategically located to affect the interactions.
An algorithm was implemented to find Erk1/2 kinases potential substrates of identified sites using their phosphorylation motif, serum stimulation and Mek1/2 inhibition kinetic profile. A list of 157 potential Erk1/2 substrates was obtained. Twelve of them were previously reported and many more have functions associated to known substrates. Six substrates (Ddx47, Hmg20a, Junb, Map2k2, Numa1, and Rras2) were confirmed by in vitro kinase assays with Erk1. Our immunofluorescence experiments demonstrated that the phosphorylation of Hmg20a on serine 105 by Erk1/2 affects the nucleocytoplasmic localization of this protein.
Finally, phosphopeptides positional isomers, peptides with the same amino acids sequence but phosphorylated at different positions, were studied with two new algorithms. This study allowed us to determine their frequency in an enriched phosphopeptide extract and to evaluate their separation by reverse-phase liquid chromatography. An analytical strategy that uses one of the algorithms was developed to do a targeted mass spectrometry analysis to discover the isomers that had been missed by the conventional method.
|
Page generated in 0.0693 seconds