Return to search

A space-filling structural network of PCA-derived protein complexes in Saccharomyces cerevisiae

Proteins serve various functions in a cell such as structural support, enzymatic activity, signalling pathways, and transportation of cargo. Binary coupling of proteins often reports common biological functions between the two partners. However, protein-protein interactions in the context of multi-protein complexes report a more complete spectrum of functionality in time and space. Our goal is to understand how protein complexes are manifested under varying spatial and temporal states, how they respond to signalling inputs, and which proteins act as scaffolds or linchpin components.The development and refinement of the protein-fragment complementation assay (PCA) by Michnick et al. has enabled the understanding of dynamics of binary protein interactions in the context of living cells. PCA data based on murine dihydrofolate reductase (DHFR) is a survival-selection assay. Fragments of a reporter protein are tagged onto query proteins of interest. Reconstituted DHFR protein fragments in vivo results in a scoreble phenotype-resistance to methatrexate- which is the proxy for protein-protein interactions up to a resolution of 8nm. The resolution is determined by the fragment linker length. The activity of the DHFR reporter protein is reversible and thus indirectly embeds spatial and temporal information.We constructed a probabilistic model of protein complex dynamics using binary PCA dataset based on DHFR, which incorporates dynamic information, and model spheres that are representative of respective protein sizes. We set probabilistic constraints based on distances between centers of known interacting proteins. We define the distances as the sum of the radii of the corresponding spheres. The probabilities of distances are computed from a Gaussian function. We then generate an ensemble of protein complex structures using a Markov chain Monte Carlo method, based on the Metropolis-Hastings algorithm. The ensemble surveys the posterior distribution of protein complex structures in the structure space. From the output data, we compute contact frequencies between each protein pair within the ensemble. We calculate the surface accessibility of proteins, which consists of the area that is not shadowed by interacting partners. Using surface accessibility vectors of each structure, we hierarchically cluster the ensemble to retrieve representative meta-stable states of proteins complexes. We applied this method on an extended Arp2/3-based network, comprising highly evolutionarily conserved proteins, along with other binding partners (Tarassov et al., 2008). We were able to predict direct or indirect PCA interactions by changing the linker lengths and could identify false negatives within the PCA data. Furthermore, we can investigate the integrity of protein-protein interactions and simulate the effects of binding diffusive regulatory proteins, such as CDKs and cyclins, by altering nodes and edges in our network. Our data can also be correlated with protein sequences to make predictions about regulatory motifs. The potential of this in silico modeling method circumvents many limitations of traditional experimental methods such as yeast-two-hybrid and TAP-tagging, and serves as a new platform for investigating dynamics of protein complexes using real-space time-resolved approaches. / Les protéines ont des fonctions différentes dans une cellule comme un soutien structurel, une activité enzymatique, une voie de signalisation et un transport de fret. L'interaction binaire de protéines signale souvent des fonctions biologiques qui sont communes entre les deux partenaires. Toutefois, les interactions entre deux protéines dans le contexte de complexes multi-protéiques présentent une gamme plus complète de fonctionnalités dans le temps et l'espace. Notre objectif est de comprendre comment les complexes protéiques se manifestent dans différentes conditions spatiales et temporelles, comment ils réagissent aux entrées de signalisation, et quelles protéines agissent comme des échafaudages.Le développement et le raffinement de l'analyse de complémentation protéique-fragment (PCA) par Michnick et al. ont permis à la compréhension de la dynamique des interactions protéiques binaires dans le contexte de cellules vivantes. Les données de PCA, basées de la dihydrofolate réductase murine (DHFR), est un test de survie de sélection. Les fragments d'une protéine rapporteuse sont attachés sur des protéines d'intérêt. Les fragments reconstitués protéine de DHFR in vivo donnent un phénotype de résistance à methatrexate-ce qui signale les interactions protéine-protéine à une résolution de 8 nm. La résolution est déterminée par la longueur de liaison des fragments. L'activité de la protéine rapporteuse DHFR est réversible et donc intègre indirectement des informations spatiales et temporelles.Nous avons construit un modèle probabiliste du complexe dynamique de protéines en utilisant un ensemble de données binaires du PCA-DHFR, qui inclut des informations dynamiques, et les sphères de modèle qui sont représentatives des tailles respectives des protéines. Nous avons mis des contraintes probabilistes basées sur les distances entre les centres des protéines qui interagissent. Les distances sont équivaux à la somme des rayons des sphères correspondants. Les probabilités de distances sont calculées à partir d'une fonction gaussienne. Nous avons ensuite générer un ensemble de structures de complexes protéiques en utilisant une méthode Markov Chain Monte Carlo, basée sur l'algorithme de Metropolis-Hastings. L'ensemble représente la distribution a posteriori des structures des complexes protéiques dans l'espace. D'après les données, nous calculons les fréquences de contact entre chaque paire de protéines dans l'ensemble. Nous calculons l'accessibilité surface des protéines, qui se compose de la zone qui n'est pas éclipsée par l'interaction des partenaires. En utilisant des vecteurs d'accessibilité surface de chaque structure, nous faisons un cluster hiérarchique de l'ensemble pour récupérer des représentants des états méta-stables des complexes protéiques.Nous avons appliqué cette méthode sur un réseau étendu du complexe Arp2/3, comprenant des protéines hautement conservées dans l'évolution, avec d'autres partenaires de liaison (Tarassov et al., 2008). Nous avons été en mesure de prédire les interactions directes ou indirectes du PCA en modifiant les longueurs de liaison et d'identifier les faux négatifs dans les données du PCA. En outre, nous pouvons étudier l'intégrité des interactions protéine-protéine et de simuler les effets de l'incorporation des protéines régulatrices, tels que les cyclines et CDK, en modifiant les nœuds et les bords de notre réseau. Nos données peuvent aussi être en corrélation avec des séquences de protéines pour faire des prédictions au sujet des motifs de réglementation. Le potentiel de cette méthode de modélisation in silico de contourner de nombreuses limitations de méthodes expérimentales traditionnelles sert une nouvelle plateforme pour étudier la dynamique des complexes de protéines.

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.104738
Date January 2011
CreatorsTsay, Aaron
ContributorsJacalyn Vogel (Supervisor)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageMaster of Science (Department of Biology)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.0027 seconds