Spelling suggestions: "subject:"bioinformatics"" "subject:"bionformatics""
181 |
Bioinformatics approaches towards facilitating drug developmentLee, Anna January 2011 (has links)
Drug development is currently a time-consuming, costly and challenging process. The process typically starts with the identification of a therapeutic target for a given disease. A therapeutic target is some biological molecule and the binding of compounds to target molecules is expected to cause a desired therapeutic effect. That is, target binding compounds have the potential to become drug candidates. However, there is a tendency for many drug candidates to fail during clinical trials, and consequently, very few candidates become approved new drugs. This trend suggests that the early stages of drug development should be improved to provide better drug candidates.The reasons for which a drug candidate may fail during clinical trials include unacceptable toxicity and insufficient efficacy observed in humans. These reasons suggest that the assessments of a compound during the early stages of drug development often inaccurately predict the effect of the compound in humans. One of the main goals of systems biology is to accurately predict how a given biological system responds to perturbations, e.g. treatment with a compound. This suggests that systems biology can help address challenges in drug development. However, there are currently gaps in our knowledge of systems. Here we use machine learning techniques to exploit existing systems data towards filling in these gaps. In particular, we developed a method that uses the occurrences of motifs in protein sequences to predict kinase-substrate interactions. We also developed a method that uses gene expression, protein-protein interaction and phenotype data to predict genetic interactions. These predicted interactions can facilitate the identification of potential therapeutic targets. Ultimately, a better selection of therapeutic targets should lead to better drug candidates.We also address the challenge of developing combinatorial therapies. Despite the fact that combinatorial therapies are advantageous, the scale of the experiments required to search for desirable chemical combinations is currently prohibitive. We therefore developed a method that uses system response data to predict chemical synergies towards facilitating the development of combinatorial therapies.Overall, this thesis shows how computational prediction in a systems biology framework can be used to facilitate and expedite the early stages of drug development. / Le développement des médicaments est actuellement un processus coûteux, difficile, et qui prend beaucoup de temps. Le processus commence généralement par l'identification d'une cible thérapeutique pour une maladie spécifique. Une cible thérapeutique est une molécule biologique et l'attachement des composés aux molécules cibles est supposé causer un effet thérapeutique. Donc, les composés qui attachent aux cibles ont le potentiel de devenir des candidats médicaments. Toutefois, beaucoup de candidats médicaments ont tendance à échouer pendant les essais cliniques, et par conséquence, très peu de candidats deviennent nouveaux médicaments approuvés. Cette tendance suggère que les premières étapes du développement de médicaments doit être amélioré afin de fournir des candidats médicaments de meilleure qualité.Les raisons pour lesquelles un candidat médicament peut échouer pendant les essais cliniques incluent une toxicité inacceptable et une éfficacité insuffisante observés chez les humains. Ces raisons suggèrent que les évaluations d'un composé pendant les premières étapes du développement de médicaments mal prédirent l'effet du composé chez les humains. Un des principaux objectifs de la biologie des systèmes est de prédire avec précision comment un système biologique répond à des perturbations, par exemple, un traitement avec un composé. Ceci suggère que la biologie des systèmes peut aider à aborder les défis du développement de médicaments. Toutefois, il existe actuellement des lacunes dans notre connaissance des systèmes. Ici, nous utilisons des techniques d'apprentissage automatique pour exploiter l'information existantes des systèmes pour combler ces lacunes. En particulier, nous avons développé une méthode qui utilise des occurrences des motifs dans les séquences de protéine pour prédire des interactions kinase-substrat. Nous avons aussi développé une méthode qui utilise d'expression des gènes, des interactions entre les protéines et d'information des phénotypes pour prédire des interactions génétiques. Ces interactions prédites peuvent faciliter l'identification des cibles thérapeutiques potentielles. En fin de compte, une meilleure sélection des cibles thérapeutiques devrait entraîner des candidats médicaments de meilleure qualité.Nous avons aussi abordé le défi de développer des thérapies combinatoires. Malgré le fait que les thérapies combinatoires sont avantageuses, l'ampleur des expériences nécessaires à la recherche de combinaisons chimiques souhaitables est actuellement prohibitif. Donc, nous avons développé une méthode qui utilise d'information de réponse des systèmes pour prédire des synergies chimiques en vue de faciliter le développement de thérapies combinatoires.Dans l'ensemble, cette thèse montre comment de calcul de prédiction dans une structure de biologie des systèmes peut être utilisés pour faciliter et accélérer les premières étapes du développement de médicaments.
|
182 |
A systems approach towards a functional annotation of the genome of Trypanosoma bruceiShateri Najafabadi, Hamed January 2012 (has links)
The pathogenic species of trypanosomatids, including Trypanosoma brucei, T. cruzi, and Leishmania spp, cause serious human as well as animal diseases, with a very high incidence and mortality rate if untreated. Although the genome sequences of several trypanosomatids have been known for several years, many aspects of gene function and gene regulation are still unclear in these organisms. Most importantly, the lack of similarity between the majority of their genes and characterized genes of other organisms has limited our understanding of the gene functions in trypanosomatids. Not only the functions of many genes are unknown, the factors that are involved in their regulation are mostly uncharacterized. Trypanosomatids primarily rely on post-transcriptional programs for regulation of gene expression, and transcriptional regulation is of least importance. The genomes of these organisms harbour a large number of RNA-binding proteins with potential role in regulating mRNA stability and translation; however, the sequence specificity of these RNA-binding proteins and their function is mostly unknown. The focus of this thesis is on development of new methods for homology-independent functional characterization of genes in trypanosomatids, and deciphering the programs that are involved in their regulation. First, I describe a novel universal relationship between codon usage and gene function, and show the utility of this relationship for functional characterization of genes in various organisms, including trypanosomatids. This relationship most probably points to the role of codon usage in dynamic regulation of protein expression in different conditions, and helps the cell to adapt to new environments and conditions by synchronously regulating proteins with required functions. Then, I introduce a computational approach for identification of function-specific cis-acting regulatory elements, and demonstrate the utility of this approach for identification of potential regulatory elements in trypanosomatids, as well as for prediction of gene function based on the flanking regulatory sequences. I also show that combination of cis-regulatory elements and codon usage is a strong predictor of gene function in trypanosomatids. In addition to these methods, which can identify biological processes and pathways, a new method for identification of protein molecular functions based on short sequence signatures is introduced in this thesis. I show that this new method is able to identify function-specific protein short motifs that present functional sites on proteins, and demonstrate the utility of these motifs in predicting protein molecular function in trypanosomatids. In addition to these sequence-based approaches, I also explore the possibility of predicting trypanosomatid gene functions based on co-expression. I present the first co-expression network of T. brucei, which is constructed by combining several microarray datasets from different studies, and use it for predicting new components of several essential pathways in this organism. This analysis suggested the presence of a conserved post-transcriptional regulatory network in trypanosomatids, which encouraged us to develop a novel framework for identification of regulatory programs with high network-level conservation across multiple species. This framework revealed an extensive set of conserved regulatory programs in trypanosomatids, many of which could be validated using available expression datasets as well as our microarray profiles of chemical perturbations. The studies described here contribute significantly to functional annotation of genes in trypanosomatids, and identify the regulatory mechanisms that govern gene expression in these organisms. Furthermore, the introduced methods can be used for functional annotation of many uncharacterized genes and identification of gene regulatory programs in virtually all organisms with available genome sequences. / Les espèces pathogènes de l'ordre des trypanosomatida, incluant Trypanosoma brucei, T. cruzi, et différentes espèces de Leishmania sont responsables de sérieuses maladies humaines et animales, avec une très forte incidence et taux de mortalité élevé lorsque non soignées. Bien que les génomes de plusieurs trypanosomatida soient disponibles depuis plusieurs années, de nombreux aspects de la fonction et de la régulation génique restent inexplorés chez ces organismes. Les trypanosomatida se reposent principalement sur des mécanismes post-transcriptionels pour la régulation de l'expression génique, et la régulation de la transcription n'a que peu d'importance. Les génomes de ces organismes hébergent un grand nombre de protéine se liant à l'ARN avec des rôles potentiels dans la régulation de la stabilité et de la traduction des ARNm. Néanmoins, les séquences spécifiques de ces protéines se liant à l'ARN et leurs fonctions restent principalement méconnues. L'objectif de cette thèse se situe au niveau du développement de nouvelles méthodes indépendantes de l'homologie pour permettre la caractérisation fonctionnelles de gènes chez les trypanosomatida, et de déchiffrer les mécanismes impliqués dans cette régulation. Premièrement, je décris une nouvelle relation universelle entre l'utilisation des codons et la fonction génique, et montre l'utilité de cette relation pour la caractérisation de gènes dans divers organismes, incluant les trypanosomatida. Cette relation pointe probablement vers un rôle de l'utilisation des codons dans la régulation dynamique de l'expression protéique sous diverses conditions, et aide la cellule à s'adapter à de nouveaux environnements et conditions en synchronisant la régulation des protéines avec les fonctions requises. J'ai introduis une approche computationnelle pour l'identification d'éléments cis-régulateurs fonction-spécifiques et démontré l'utilité de cette approche pour l'identification d'éléments régulateurs potentiels chez les trypanosomatida, ainsi que pour la prédiction de fonctions géniques basées sur les séquences régulatrices flanquantes. En plus de ces méthodes, qui peuvent identifier biologiquement des phénomènes et des voies métaboliques, une nouvelle procédure pour l'identification des fonctions moléculaires des protéines, basée sur de courtes signatures de séquences, est introduite dans cette thèse. Outre cette approche basée sur les séquences, j'explore également la possibilité de prédire la fonction de certains gènes des trypanosomatida en me basant sur la co-expression. Je présente le premier réseau de co-expression de T. brucei, élaboré en combinant plusieurs jeux de données de microarray provenant de différentes études, et les utilise pour prédire de nouveaux éléments de multiples voies métaboliques essentielles dans cet organisme. Cette analyse suggère la présence de réseaux post-transcriptionels conservés chez les trypanosomatida, ce qui nous encourage à mettre au point un nouveau cadre expérimental pour l'identification de mécanismes régulateurs avec un fort niveau de conservation au sein de multiples espèces. Ce cadre expérimental a révélé une somme importante de mécanismes régulateurs conservés chez les trypanosomatida, dont beaucoup pourraient êtres validés en utilisant des données d'expression disponibles ainsi qu'avec des profils de perturbations chimiques de microarrays. Les études décrites ici contribuent significativement à l'annotation génique fonctionnelle chez les trypanosomatida, et permet d'identifier des mécanismes de régulation qui gouvernent l'expression génique de ces organismes. De plus, les méthodes introduites peuvent être utilisée pour l'annotation fonctionnelle de nombreux gènes non-caractérisés et l'identification de programmes de régulation génique dans virtuellement n'importe quel organisme dont le génome est disponible.
|
183 |
Molecular pathway analysis of mouse models for breast cancerLesurf, Robert January 2009 (has links)
Human breast cancer is an extremely heterogeneous disease, consisting of a number of different subtypes with varying levels of aggressiveness reflected by distinct, but largely undefined, molecular profiles. Here we have analyzed several novel mouse models for breast cancer in the context of the human subtypes, and have shown parallels between the mice and humans at numerous biologically relevant levels. In addition, we have developed a statistical framework to help elucidate the individual molecular components that are at play across a panel of human breast or murine mammary tumors. Our results indicate that, while no mouse model captures all aspects of the human disease, they each contain components that are shared by a subset of human breast tumors. Furthermore, our statistical framework provides numerous advantages over previous methodologies, in helping to reveal the individual molecular pathways that make up the biology of the tumors. / Le cancer du sein est connue pour être une maladie très hétérogène, composé d'un nombre de différents sous-types avec différents niveaux de l'agressivité et distinctes, mais indéfini, profils moléculaires. Ici, nous avons analysé plusieurs nouveaux modèles de souris pour le cancer du sein, dans le cadre des sous-types, et nous avons trouver des parallèles à un certain nombre de niveaux pertinents biologiques. En outre, nous avons développé une méthodologie statistique pour aider à élucider les différents composants moléculaires qui sont à jouer dans un groupe de tumours de sein d'humains ou mammaires murins. Nos résultats indiquent que, même si aucun modèle de souris capte tous les aspects de la maladie chez l'homme, chacun contiennent des composants qui sont partagées par un sous-ensemble de tumeurs mammaires humaines. En outre, notre outil statistique offre de nombreux avantages par rapport aux précédentes méthodes, pour aider à révéler les voies moléculaires qui composent la biologie des tumeurs.
|
184 |
A systems biology approach to understanding the role of the endoplasmic reticulum in human diseaseGosline, Sara January 2010 (has links)
The endoplasmic reticulum (ER) is a cellular organelle responsible for lipid biosynthesis, protein folding, drug detoxification and regulation of cellular calcium levels. One third of all cellular proteins are folded and assembled in the ER, including most membrane-bound and secreted proteins that are responsible for inter-cellular signaling. As such, the ER has evolved a series of pathways collectively called Endoplasmic Reticulum Quality Control (ERQC) that ensure proteins that are properly folded, as errantly folded proteins can be toxic to the cell. These pathways play a diverse role in many human diseases. In neurodegenerative diseases such as Huntington's disease, the accumulation of protein plaques can be prevented by over-expression of protein chaperones, suggesting that weakened folding machinery causes the disease phenotype. In the case of diseases such as Cystic Fibrosis that are caused by genetic mutation to cell surface proteins, ERQC machinery degrades these mutated proteins despite their ability to function properly if they were allowed to exit the ER. In cancer, the ability of ERQC machinery to protect cells from stress enables tumor cells to survive and thrive in hypoxic and nutrient-poor environments. Systems biology methods have enabled the study of signaling pathways in human disease across the cell. However, with this breadth comes a limited ability to focus on particular areas of interest such as the ER. To address this, this thesis applies systems biology methods specifically to ER and ERQC pathways to better understand their role in human disease. We first characterize the proteins that reside in the ER and Golgi through comprehensive analysis of peptides identified in ER and Golgi fractions via mass spectrometry, providing the first experimentally-derived ER proteome. We then use this list of ER proteins to identify ER signaling pathways that distinguish between breast cancer subtypes to provide novel therapeutic approaches to treating / Le réticulum endoplasmique (RE) est un organelle cellulaire responsable de la biosynth`ese des lipides, du repliement des protéines, de la désintoxication et de la régulation des niveaux cellulaires de calcium. Un tiers des protéines cellulaires est plié et assemblé dans le RE, y compris la plupart des protéines liées à la membrane et des protéines sécrétées responsables de la signalisation inter-cellulaire. Ainsi, le RE a mis au point une série de voies de signalisation collectivement appelées Contrôle de Qualité du Réticulum Endoplasmique (CQRE) qui assurent que les protéines soient correctement pliées, étant donné que les protéines incorrectement pliées peuvent être toxiques pour la cellule. Ces voies jouent divers rôles dans de nombreuses maladies humaines. Dans les maladies neurod égénératives telles que la maladie de Huntington, l'accumulation de plaques de protéines peut être évitée par la sur-expression de protéines chaperons, ce qui sugg`ere qu'un affaiblissement de la machinerie de pliage cause le phénotype de cette maladie. Dans le cas de maladies comme la Fibrose Cystique qui sont causées par une mutation génétique des protéines de la membrane cellulaire, le CQRE dégrade ces protéines mutées bien que celles-ci fonctionneraient correctement si elles avaient été autorisées à quitter le RE. Dans le cancer, la capacité du CQRE à protéger les cellules contre le stress permet aux cellules tumorales de survivre et de se développer dans des environnements hypoxiques et pauvres en éléments nutritifs. Les méthodes de biologie des syst`emes ont permis l'étude des voies de signalisation dans les maladies humaines à travers la cellule. Cependant, avec cette large étendue, il devient difficile de se concentrer sur certains domaines d'intérêt tels que le RE. Pour résoudre ce problme, cette thse applique les méthodes de la biologie des syst`emes spécifiquement au RE et aux voies de signalisation du CQRE po
|
185 |
Models and Estimation for Phylogenetic TreesAbabneh, Faisal M January 2006 (has links)
Doctor of Philosophy(PhD) / In this thesis, we consider Markov models for matched sequences. De¯ne fij(t) = P(X(t) = i; Y (t) = jjX(0) = Y (0)); where fij is the joint probability that, for a given site, the ¯rst and second sequences have the values i and j at a given site, given that they were the same at time 0. This can generalized to several sequences. The sequences (taxa) are then arranged in an evolutionary tree (phylogenetic tree) depicting how taxa diverge from their common ancestors. We develop tests and estimation methods for the parameters of di®erent models. Standard phylogenetic methods assume stationarity, homogeneity and reversibility for the Markov processes, and often impose further restrictions on the parameters. The parameters in these cases are estimated using many popular packages, including PHYLIP and PAUP*. We describe a new and more general method for calculating the joint probability distribution under stationary and homogeneous models for the more general models with some weakening of the stationarity and homogeneity assumptions. We describe the method for a two edged tree and then extend it to the case for a K tipped tree. We discuss the case of a ¯ve edged tree for a set of bacterial sequences for which stationarity and homogeneity are not present. This data set is very similar to that of Galtier and Gouy (1995), and the search for methods appropriate for its analysis has provided the raison d'etre for this work. The extension we propose is to allow non-stationarity, so that from the root of the tree we permit di®erent Markov processes to operate along different descendant lineages; furthermore, we permit non-homogeneous Markov processes to operate across the tree. We obtain methods that
|
186 |
A quantitative study of gene identification techniques based on evolutionary rationalesKandoth, Cyriac, January 2007 (has links) (PDF)
Thesis (M.S.)--University of Missouri--Rolla, 2007. / Vita. The entire thesis text is included in file. Title from title screen of thesis/dissertation PDF file (viewed February 6, 2008) Includes bibliographical references (p. 36).
|
187 |
Global optimization in systems biology and bioinformatics /Chang, Youngjung, January 2006 (has links)
Thesis (Ph.D.)--University of Illinois at Urbana-Champaign, 2006. / Source: Dissertation Abstracts International, Volume: 68-02, Section: B, page: 0696. Adviser: Nikolaos V. Sahinidis. Includes bibliographical references (leaves 138-149) Available on microfilm from Pro Quest Information and Learning.
|
188 |
A data cleaning and annotation framework for genome-wide studies /Ramakrishnan, Ranjani. January 2007 (has links)
Thesis (M.S.) OGI School of Science & Engineering at OHSU, November 2007. / Includes bibliographical references (leaves 41 - 45).
|
189 |
Protein secondary structure prediction using support vector machines, nueral [sic] networks and genetic algorithmsReyaz-Ahmed, Anjum B. January 2007 (has links)
Thesis (M.S.)--Georgia State University, 2007. / Title from file title page. Yanqing Zhang, committee chair; Saeid Belkasim, Yingshu Li, committee members. Electronic text (79 p. : ill. (some col.)) : digital, PDF file. Description based on contents viewed Nov. 5, 2007. Includes bibliographical references (p. 76-78).
|
190 |
Distance-based indexing and its applications in bioinformaticsMao, Rui, January 1900 (has links)
Thesis (Ph. D.)--University of Texas at Austin, 2007. / Vita. Includes bibliographical references.
|
Page generated in 0.0815 seconds