Global ETD Search

231	A Wiki paradigm to manage online course content Elrufaie, Elharith Omer 01 January 2004 (has links) This project develops a new version of the Wiki style administration of online course content. It will implement a teaching and learning tool that works as a easy and quick communication interface between instructor and student. The second purpose of the project is to design an easily extendable and maintainable architecture, which provides a generic Wiki system that can work for any information technology department and handle sets of courses and insturctors. Ward Cunningham Jianmin Wang Wikis (Computer science) Web services Databases and Information Systems
232	The State Space of Complex Systems Heilmann, Frank 14 October 2005 (has links) In dieser Arbeit wird eine Beschreibung von Monte-Carlo-Verfahren zur Lösung komplexer Optimierungsaufgaben mit Hilfe von Markov-Ketten durchgeführt. Nach einer kurzen Einführung werden Lösungsmenge solcher Aufgaben und der physikalische Zustandsraum komplexer Systeme identifiziert. Zunächst wird die Dynamik von Zufallswanderern im Zustandsraum mit Hilfe von Master-Gleichungen modelliert. Durch Einführung von Performanzkriterien können verschiedene Optimierungsstrategien quantitativ miteinander verglichen werden. Insbesondere wird das Verfahren Extremal Optimization vorgestellt, dass ebenfalls als Markov-Prozess verstanden werden kann. Es wird bewiesen, dass eine im Sinne der genannten Kriterien beste Implementierung existiert. Da diese von einem sogenannten Fitness Schedule abhängt, wird dieser für kleine Beispielsysteme explizit berechnet. Daran anschließend wird die Zustandsdichte komplexer Systeme betrachtet. Nach einem kurzen Überblick über vorhandene Methoden folgt eine detaillierte Untersuchung des Verfahrens von Wang und Landau. Numerische und analytische Hinweise werden gegeben, nach denen dieser Algorithmus innerhalb seiner Klasse wahrscheinlich der Optimale ist. Eine neue Methode zur Approximation der Zustandsdichte wird vorgestellt, die insbesondere für die Untersuchung komplexer Systeme geeignet ist. Abschließend wird ein Ausblick auf zukünftige Arbeiten gegeben. info:eu-repo/classification/ddc/530 ddc:530 Globale Optimierung Kontrolltheorie Simulated annealing Statistische Physik Stochastisches Suchverfahren Extremal Optimization Transition Matrix Monte Carlo Verfahren von Wang und Landau Zustandsdichte
233	Numerical methods for density of states calculations Haber, René 24 July 2008 (has links) The parQ method, up to now only capable of calculating the density of states in the canonical ensemble, is extended to the grand canonical ensemble and compared to the Wang-Landau algorithm, a local-update flat-histogram method. Both algorithms have been implemented so that the performance and the respective benefits with increasing simulation time can be determined and compared. info:eu-repo/classification/ddc/500 ddc:500 info:eu-repo/classification/ddc/530 ddc:530 Computerphysik Lennard-Jones-Potenzial Monte Carlo Simulation Zustandsdichte Wang-Landau parQ
234	The Cultural Construction of Taiwan in the Literatures of Taiwan, China, and the United States Lin, Yu-Fang 20 April 2017 (has links) No description available. Asian American Studies Asian Literature Literature Taiwan United States China literature culture discourse Wang Chen-ho Chan Koonchung Brenda Lin identity globalization nationalism postcolonialism fiction capitalism Asian American
235	Synthèse en phase solide de pyrrolo[3,2-e][1,4]diazépin-2-ones modulateurs du système urotensinergétique Dufour-Gallant, Julien 04 1900 (has links) Les pyrrolodiazépinones ont des activités biologiques intéressantes sur différents récepteurs biologiques, ce qui en font une cible de choix pour développer de nouvelles petites molécules biologiquement actives. Une méthodologie en solution a été développée pour synthétiser des pyrrolo[3,2-e][1,4]diazépin-2-ones, qui utilise la réaction de Pictet-Spengler pour former le cycle diazépinone, comme réaction clé. Il a été démontré que le pyrrolo[3,2-e][1,4]diazépin-2-one mime un tour-γ inverse par l’analyse de cristaux par rayon X. Cette méthodologie a été transposée sur trois types de support, soit la résine de Merrifield, de Wang et un support soluble (TAP). Le système urotensinergétique joue un rôle dans certaines pathologies du système cardiovasculaire, comme l’hypertension artérielle, l’insuffisance cardiaque et l’athérosclérose. Le système urotensinergétique est exprimé dans le système circulatoire, extractoire et le système nerveux central et comprend l’UII, l’URP et le récepteur UT. L’UII et l’URP humains sont composés respectivement des séquences d’acides aminés : H-Glu-Thr-Pro-Asp-c[Cys-Phe-Trp-Lys-Tyr-Cys]-Val-OH et H-Ala-c[Cys-Phe-Trp-LysTyr-Cys]-Val-OH. L’UII est le peptide vasoconstricteur le plus puissant connu à ce jour, dont l’URP est son isoforme. Les deux peptides ont des effets biologiques différents et on peut supposer qu’ils jouent un rôle distinct dans certaines pathologies. Il a été démontré que la partie active de l’UII est composée du tripeptide : Trp-Lys-Tyr. Dans l’URP, il a été démontré que ce tripeptide forme un tour-γ inverse, ce qui fait du récepteur UT une bonne cible biologique pour tester une librairie de pyrrolo[3,2-e][1,4]diazépin-2-ones, reprenant le tripeptide Trp-Lys-Tyr. Dernièrement, l’équipe du professeur David Chatenet a mis au point un peptide, l’urocontrin en remplaçant le segment Trp par un groupement biphénylalanine, qui a démontré un comportement spécifique comme antagoniste du récepteur UT. La Librairie de pyrrolo[3,2-e][1,4]diazépin-2-ones est basée sur la séquence TrpLys-Tyr de l’UII et de l’URP et de la séquence Trp-Lys-Bip de l’urocontrin. La synthèse de la librairie est faite sur la résine de Wang. La chaîne latérale de Tyr est mimée en utilisant la tyramine, Lys et Orn sont utilisés et la chaîne latérale de Trp a été reproduite II en utilisant le biphényle (comme dans l’urocontrin), le 1-naphthyle et le 2-naphthyle, sont introduits en employant les aldéhydes respectifs dans la réaction de Pictet-Spengler, ce qui donne les pyrrolo[3,2-e][1,4]diazépin-2-ones insaturés et les saturés S- et R-. L’évaluation de l’activité biologique des pyrrolo[3,2-e][1,4]diazépin-2-ones obtenues sur le récepteur UT se fait par des tests in vitro et ex vivo. Les tests in vitro consistent en un essai de liaisons sur des cellules CHO exprimant le récepteur UT en employant hUII-125I, comme contrôle radiomarqé. Les tests ex vivo sont effectués sur des aortes de rats pour mesurer la capacité à induire des contractions ou de moduler les contractions induites par hUII et URP. Certains R-pyrrolo[3,2-e][1,4]diazépin-2-ones causent une réduction de 50% du signal radioactivité du hUII-125I. Les pyrrolo[3,2-e][1,4]diazépin-2-ones ne montrent guère d’activité ex vivo, mais ils ont la capacité de moduler les contractions induites par l’hUII et l’URP. Par exemple, l’analogue Lys R-saturé avec le biphényle inhibe toutes les contractions de l’aorte à 14 µM avec un pKb de 5,54 à 4 µM, sans influencer les contractions de l’aorte induites par l’URP. Les pyrrolo[3,2-e][1,4]diazépin-2-ones ont une sélectivité pour le système urotensinergétique et sont inactifs sur le récepteur de l’endotheline-1. Les pyrrolo[3,2-e][1,4]diazépin-2-ones sont les premières petites molécules qui peuvent moduler l’activité biologique de l’UII et URP et offrir un potentiel intéressant comme outil pour étudier le système urotensinergétique. / The pyrrolodiazepinones have interesting biological activities on various biological receptors, which makes them a prime target for developing new biologically active small molecules. A methodology in solution had been developed for synthesizing pyrrolo[3,2-e][1,4]diazepin-2-ones, which utilized the Pictet-Spengler condensation as the key reaction to form the diazepinone ring. Pyrrolo[3,2-e][1,4]diazepin-2-ones were found to mimic an inverse γ-turn conformation by X-ray crystallographic analysis. The methodology was subsequently implemented on three types of support: Merrifield resin, Wang resin and the soluble TAP support. The urotensinergic system plays a role in certain diseases of the cardiovascular system, such as hypertension, heart failure and atherosclerosis. The urotensinergic system is expressed in the circulatory system, excretory and central nervous systems and includes the endogenous ligands urotensin II (UII) and urotensin II-related peptide (URP), and the urotensin receptor UT. The ligands UII and human URP are composed of the respective amino acid sequences: H-Glu-Thr-Pro-Asp-c[Cys-Phe-Trp-Lys-Tyr-Cys]-Val-OH and H-Ala-c[Cys-Phe-Lys-Tyr-Trp-Cys]-Val-OH. The peptide UII is the most potent vasoconstrictor known to date. The two peptides have different biological effects and may exhibit distinct roles in certain diseases. Their common Trp-Lys-Tyr sequence is believed to play an important role in the activity of UII and URP, and has been suggested to adopt an inverse γ-turn conformation. Notably, the laboratory of Professor David Chatenet developed the UT receptor antagonist peptide urocontrin by replacing the Trp residue by biphenylalanine (Bip) in URP. A library of pyrrolo[3,2-e][1,4]diazepin-2-one analogs was thus designed to mimic the inverse γ-turn sequence and targeted against UT. The pyrrolo[3,2-e][1,4]diazepin-2-one library was designed based on the Trp-Lys-Tyr sequence of UII and URP, and Trp-Lys-Bip sequence of urocontrin. The synthesis of the pyrrolo[3,2-e][1,4]diazepin-2-one library was achieved on Wang resin. The side chain of Tyr was mimicked using tyramine, Lys and Orn were used as the basic amino acid component, and the side chain of Trp was replicated using biphenyl (as in urocontrin) 1-naphthyl and 2-naphthyl groups that were introduced by employing their respective aldehydes in a Pictet-Spengler reaction, which furnished unsaturated and saturated S- and R-pyrrolo[3,2-e][1,4]diazepin-2-ones. Evaluation of the biological activity of the pyrrolo[3,2-e][1,4]diazepin-2-ones on the UT receptor was performed in vitro and ex vivo. Tests in vitro measured binding in CHO-cells which expressed UT by employing hUII-125I as radiolabeled control. In rat aorta, ex vivo tests measured capacity to induce contraction, or modulate the contractions induced by hUII and URP. Certain R-pyrrolo[3,2-e][1,4]diazepin-2-ones caused an up to 50% reduction of the radioactive signal of hUII-125I. Pyrrolo[3,2-e][1,4]diazepin-2-ones exhibited little activity ex vivo; however, they modulated contractions induced by hUII and URP. For example, the saturated R-analog possessing lysine and a biphenyl side chain inhibited completely hUII-induced contractions of the aorta at 14 µM with a pKb of 5.54 at 4 µM, without influencing URP-induced contractions. Pyrrolo[3,2-e][1,4]diazepin-2-ones were selective for the urotensinergic system and inactive on the related receptor endothelin-1. Pyrrolo[3,2-e][1,4]diazepin-2-ones represent the first small molecules that can differently modulate the biological activities of UII and URP, and offer interesting potential as tools for studying the urotensinergic system. Mimes peptidiques Structure privilégiée Pyrrolo[3,2-e][1,4]diazépin-2-one Tour-γ inverse Chimiothèque Phase solide Résine de Wang Urotensine II système urotensinergétique in vitro ex vivo Peptide mimic Privileged structure reverse γ-turn chemical library solid phase Wang resin Urotensin II URP urotensinergic system
236	Modélisation des bi-grappes et sélection des variables pour des données de grande dimension : application aux données d’expression génétique Chekouo Tekougang, Thierry 08 1900 (has links) Les simulations ont été implémentées avec le programme Java. / Le regroupement des données est une méthode classique pour analyser les matrices d'expression génétiques. Lorsque le regroupement est appliqué sur les lignes (gènes), chaque colonne (conditions expérimentales) appartient à toutes les grappes obtenues. Cependant, il est souvent observé que des sous-groupes de gènes sont seulement co-régulés (i.e. avec les expressions similaires) sous un sous-groupe de conditions. Ainsi, les techniques de bi-regroupement ont été proposées pour révéler ces sous-matrices des gènes et conditions. Un bi-regroupement est donc un regroupement simultané des lignes et des colonnes d'une matrice de données. La plupart des algorithmes de bi-regroupement proposés dans la littérature n'ont pas de fondement statistique. Cependant, il est intéressant de porter une attention sur les modèles sous-jacents à ces algorithmes et de développer des modèles statistiques permettant d'obtenir des bi-grappes significatives. Dans cette thèse, nous faisons une revue de littérature sur les algorithmes qui semblent être les plus populaires. Nous groupons ces algorithmes en fonction du type d'homogénéité dans la bi-grappe et du type d'imbrication que l'on peut rencontrer. Nous mettons en lumière les modèles statistiques qui peuvent justifier ces algorithmes. Il s'avère que certaines techniques peuvent être justifiées dans un contexte bayésien. Nous développons une extension du modèle à carreaux (plaid) de bi-regroupement dans un cadre bayésien et nous proposons une mesure de la complexité du bi-regroupement. Le critère d'information de déviance (DIC) est utilisé pour choisir le nombre de bi-grappes. Les études sur les données d'expression génétiques et les données simulées ont produit des résultats satisfaisants. À notre connaissance, les algorithmes de bi-regroupement supposent que les gènes et les conditions expérimentales sont des entités indépendantes. Ces algorithmes n'incorporent pas de l'information biologique a priori que l'on peut avoir sur les gènes et les conditions. Nous introduisons un nouveau modèle bayésien à carreaux pour les données d'expression génétique qui intègre les connaissances biologiques et prend en compte l'interaction par paires entre les gènes et entre les conditions à travers un champ de Gibbs. La dépendance entre ces entités est faite à partir des graphes relationnels, l'un pour les gènes et l'autre pour les conditions. Le graphe des gènes et celui des conditions sont construits par les k-voisins les plus proches et permet de définir la distribution a priori des étiquettes comme des modèles auto-logistiques. Les similarités des gènes se calculent en utilisant l'ontologie des gènes (GO). L'estimation est faite par une procédure hybride qui mixe les MCMC avec une variante de l'algorithme de Wang-Landau. Les expériences sur les données simulées et réelles montrent la performance de notre approche. Il est à noter qu'il peut exister plusieurs variables de bruit dans les données à micro-puces, c'est-à-dire des variables qui ne sont pas capables de discriminer les groupes. Ces variables peuvent masquer la vraie structure du regroupement. Nous proposons un modèle inspiré de celui à carreaux qui, simultanément retrouve la vraie structure de regroupement et identifie les variables discriminantes. Ce problème est traité en utilisant un vecteur latent binaire, donc l'estimation est obtenue via l'algorithme EM de Monte Carlo. L'importance échantillonnale est utilisée pour réduire le coût computationnel de l'échantillonnage Monte Carlo à chaque étape de l'algorithme EM. Nous proposons un nouveau modèle pour résoudre le problème. Il suppose une superposition additive des grappes, c'est-à-dire qu'une observation peut être expliquée par plus d'une seule grappe. Les exemples numériques démontrent l'utilité de nos méthodes en terme de sélection de variables et de regroupement. / Clustering is a classical method to analyse gene expression data. When applied to the rows (e.g. genes), each column belongs to all clusters. However, it is often observed that the genes of a subset of genes are co-regulated and co-expressed in a subset of conditions, but behave almost independently under other conditions. For these reasons, biclustering techniques have been proposed to look for sub-matrices of a data matrix. Biclustering is a simultaneous clustering of rows and columns of a data matrix. Most of the biclustering algorithms proposed in the literature have no statistical foundation. It is interesting to pay attention to the underlying models of these algorithms and develop statistical models to obtain significant biclusters. In this thesis, we review some biclustering algorithms that seem to be most popular. We group these algorithms in accordance to the type of homogeneity in the bicluster and the type of overlapping that may be encountered. We shed light on statistical models that can justify these algorithms. It turns out that some techniques can be justified in a Bayesian framework. We develop an extension of the biclustering plaid model in a Bayesian framework and we propose a measure of complexity for biclustering. The deviance information criterion (DIC) is used to select the number of biclusters. Studies on gene expression data and simulated data give satisfactory results. To our knowledge, the biclustering algorithms assume that genes and experimental conditions are independent entities. These algorithms do not incorporate prior biological information that could be available on genes and conditions. We introduce a new Bayesian plaid model for gene expression data which integrates biological knowledge and takes into account the pairwise interactions between genes and between conditions via a Gibbs field. Dependence between these entities is made from relational graphs, one for genes and another for conditions. The graph of the genes and conditions is constructed by the k-nearest neighbors and allows to define a priori distribution of labels as auto-logistic models. The similarities of genes are calculated using gene ontology (GO). To estimate the parameters, we adopt a hybrid procedure that mixes MCMC with a variant of the Wang-Landau algorithm. Experiments on simulated and real data show the performance of our approach. It should be noted that there may be several variables of noise in microarray data. These variables may mask the true structure of the clustering. Inspired by the plaid model, we propose a model that simultaneously finds the true clustering structure and identifies discriminating variables. We propose a new model to solve the problem. It assumes that an observation can be explained by more than one cluster. This problem is addressed by using a binary latent vector, so the estimation is obtained via the Monte Carlo EM algorithm. Importance Sampling is used to reduce the computational cost of the Monte Carlo sampling at each step of the EM algorithm. Numerical examples demonstrate the usefulness of these methods in terms of variable selection and clustering. Groupement Clustering Ontologie des gènes Gene Ontology Expression génétique gene expression Critère d’information de déviance Deviance information criterion Algorithme de Wang-Landau Wang-Landau algorithm modèle auto-logistique auto-logistic models Sélection des variables Variable selection modèle à carreaux plaid model Algorithme EM de Monte Carlo Monte Carlo EM algorithm Importance échantillonnale Importance Sampling
237	Modèle bayésien non paramétrique pour la segmentation jointe d'un ensemble d'images avec des classes partagées / Bayesian nonparametric model for joint segmentation of a set of images with shared classes Sodjo, Jessica 18 September 2018 (has links) Ce travail porte sur la segmentation jointe d’un ensemble d’images dans un cadre bayésien.Le modèle proposé combine le processus de Dirichlet hiérarchique (HDP) et le champ de Potts.Ainsi, pour un groupe d’images, chacune est divisée en régions homogènes et les régions similaires entre images sont regroupées en classes. D’une part, grâce au HDP, il n’est pas nécessaire de définir a priori le nombre de régions par image et le nombre de classes, communes ou non.D’autre part, le champ de Potts assure une homogénéité spatiale. Les lois a priori et a posteriori en découlant sont complexes rendant impossible le calcul analytique d’estimateurs. Un algorithme de Gibbs est alors proposé pour générer des échantillons de la loi a posteriori. De plus,un algorithme de Swendsen-Wang généralisé est développé pour une meilleure exploration dela loi a posteriori. Enfin, un algorithme de Monte Carlo séquentiel a été défini pour l’estimation des hyperparamètres du modèle.Ces méthodes ont été évaluées sur des images-test et sur des images naturelles. Le choix de la meilleure partition se fait par minimisation d’un critère indépendant de la numérotation. Les performances de l’algorithme sont évaluées via des métriques connues en statistiques mais peu utilisées en segmentation d’image. / This work concerns the joint segmentation of a set images in a Bayesian framework. The proposed model combines the hierarchical Dirichlet process (HDP) and the Potts random field. Hence, for a set of images, each is divided into homogeneous regions and similar regions between images are grouped into classes. On the one hand, thanks to the HDP, it is not necessary to define a priori the number of regions per image and the number of classes, common or not.On the other hand, the Potts field ensures a spatial consistency. The arising a priori and a posteriori distributions are complex and makes it impossible to compute analytically estimators. A Gibbs algorithm is then proposed to generate samples of the distribution a posteriori. Moreover,a generalized Swendsen-Wang algorithm is developed for a better exploration of the a posteriori distribution. Finally, a sequential Monte Carlo sampler is defined for the estimation of the hyperparameters of the model.These methods have been evaluated on toy examples and natural images. The choice of the best partition is done by minimization of a numbering free criterion. The performance are assessed by metrics well-known in statistics but unused in image segmentation. Inférence bayésienne Monte Carlo séquentiel Bayésien non paramétrique Processus de Dirichlet hiérarchique Champ de Potts Algorithme de Swendsen-Wang Segmentation Image Bayesian inference Markov chain Monte Carlo Sequential Monte Carlo Non parametric Bayesian Hierarchical Dirichlet process Potts field Swendsen-Wang algorithm Segmentation Image
238	Modélisation des bi-grappes et sélection des variables pour des données de grande dimension : application aux données d’expression génétique Chekouo Tekougang, Thierry 08 1900 (has links) Le regroupement des données est une méthode classique pour analyser les matrices d'expression génétiques. Lorsque le regroupement est appliqué sur les lignes (gènes), chaque colonne (conditions expérimentales) appartient à toutes les grappes obtenues. Cependant, il est souvent observé que des sous-groupes de gènes sont seulement co-régulés (i.e. avec les expressions similaires) sous un sous-groupe de conditions. Ainsi, les techniques de bi-regroupement ont été proposées pour révéler ces sous-matrices des gènes et conditions. Un bi-regroupement est donc un regroupement simultané des lignes et des colonnes d'une matrice de données. La plupart des algorithmes de bi-regroupement proposés dans la littérature n'ont pas de fondement statistique. Cependant, il est intéressant de porter une attention sur les modèles sous-jacents à ces algorithmes et de développer des modèles statistiques permettant d'obtenir des bi-grappes significatives. Dans cette thèse, nous faisons une revue de littérature sur les algorithmes qui semblent être les plus populaires. Nous groupons ces algorithmes en fonction du type d'homogénéité dans la bi-grappe et du type d'imbrication que l'on peut rencontrer. Nous mettons en lumière les modèles statistiques qui peuvent justifier ces algorithmes. Il s'avère que certaines techniques peuvent être justifiées dans un contexte bayésien. Nous développons une extension du modèle à carreaux (plaid) de bi-regroupement dans un cadre bayésien et nous proposons une mesure de la complexité du bi-regroupement. Le critère d'information de déviance (DIC) est utilisé pour choisir le nombre de bi-grappes. Les études sur les données d'expression génétiques et les données simulées ont produit des résultats satisfaisants. À notre connaissance, les algorithmes de bi-regroupement supposent que les gènes et les conditions expérimentales sont des entités indépendantes. Ces algorithmes n'incorporent pas de l'information biologique a priori que l'on peut avoir sur les gènes et les conditions. Nous introduisons un nouveau modèle bayésien à carreaux pour les données d'expression génétique qui intègre les connaissances biologiques et prend en compte l'interaction par paires entre les gènes et entre les conditions à travers un champ de Gibbs. La dépendance entre ces entités est faite à partir des graphes relationnels, l'un pour les gènes et l'autre pour les conditions. Le graphe des gènes et celui des conditions sont construits par les k-voisins les plus proches et permet de définir la distribution a priori des étiquettes comme des modèles auto-logistiques. Les similarités des gènes se calculent en utilisant l'ontologie des gènes (GO). L'estimation est faite par une procédure hybride qui mixe les MCMC avec une variante de l'algorithme de Wang-Landau. Les expériences sur les données simulées et réelles montrent la performance de notre approche. Il est à noter qu'il peut exister plusieurs variables de bruit dans les données à micro-puces, c'est-à-dire des variables qui ne sont pas capables de discriminer les groupes. Ces variables peuvent masquer la vraie structure du regroupement. Nous proposons un modèle inspiré de celui à carreaux qui, simultanément retrouve la vraie structure de regroupement et identifie les variables discriminantes. Ce problème est traité en utilisant un vecteur latent binaire, donc l'estimation est obtenue via l'algorithme EM de Monte Carlo. L'importance échantillonnale est utilisée pour réduire le coût computationnel de l'échantillonnage Monte Carlo à chaque étape de l'algorithme EM. Nous proposons un nouveau modèle pour résoudre le problème. Il suppose une superposition additive des grappes, c'est-à-dire qu'une observation peut être expliquée par plus d'une seule grappe. Les exemples numériques démontrent l'utilité de nos méthodes en terme de sélection de variables et de regroupement. / Clustering is a classical method to analyse gene expression data. When applied to the rows (e.g. genes), each column belongs to all clusters. However, it is often observed that the genes of a subset of genes are co-regulated and co-expressed in a subset of conditions, but behave almost independently under other conditions. For these reasons, biclustering techniques have been proposed to look for sub-matrices of a data matrix. Biclustering is a simultaneous clustering of rows and columns of a data matrix. Most of the biclustering algorithms proposed in the literature have no statistical foundation. It is interesting to pay attention to the underlying models of these algorithms and develop statistical models to obtain significant biclusters. In this thesis, we review some biclustering algorithms that seem to be most popular. We group these algorithms in accordance to the type of homogeneity in the bicluster and the type of overlapping that may be encountered. We shed light on statistical models that can justify these algorithms. It turns out that some techniques can be justified in a Bayesian framework. We develop an extension of the biclustering plaid model in a Bayesian framework and we propose a measure of complexity for biclustering. The deviance information criterion (DIC) is used to select the number of biclusters. Studies on gene expression data and simulated data give satisfactory results. To our knowledge, the biclustering algorithms assume that genes and experimental conditions are independent entities. These algorithms do not incorporate prior biological information that could be available on genes and conditions. We introduce a new Bayesian plaid model for gene expression data which integrates biological knowledge and takes into account the pairwise interactions between genes and between conditions via a Gibbs field. Dependence between these entities is made from relational graphs, one for genes and another for conditions. The graph of the genes and conditions is constructed by the k-nearest neighbors and allows to define a priori distribution of labels as auto-logistic models. The similarities of genes are calculated using gene ontology (GO). To estimate the parameters, we adopt a hybrid procedure that mixes MCMC with a variant of the Wang-Landau algorithm. Experiments on simulated and real data show the performance of our approach. It should be noted that there may be several variables of noise in microarray data. These variables may mask the true structure of the clustering. Inspired by the plaid model, we propose a model that simultaneously finds the true clustering structure and identifies discriminating variables. We propose a new model to solve the problem. It assumes that an observation can be explained by more than one cluster. This problem is addressed by using a binary latent vector, so the estimation is obtained via the Monte Carlo EM algorithm. Importance Sampling is used to reduce the computational cost of the Monte Carlo sampling at each step of the EM algorithm. Numerical examples demonstrate the usefulness of these methods in terms of variable selection and clustering. / Les simulations ont été implémentées avec le programme Java. Groupement Clustering Ontologie des gènes Gene Ontology Expression génétique gene expression Critère d’information de déviance Deviance information criterion Algorithme de Wang-Landau Wang-Landau algorithm modèle auto-logistique auto-logistic models Sélection des variables Variable selection modèle à carreaux plaid model Algorithme EM de Monte Carlo Monte Carlo EM algorithm Importance échantillonnale Importance Sampling
239	Transition Matrix Monte Carlo Methods for Density of States Prediction Haber, René 03 July 2014 (has links) (PDF) Ziel dieser Arbeit ist zunächst die Entwicklung einer Vergleichsgrundlage, auf Basis derer Algorithmen zur Berechnung der Zustandsdichte verglichen werden können. Darauf aufbauend wird ein bestehendes übergangsmatrixbasiertes Verfahren für das großkanonisch Ensemble um ein neues Auswerteverfahren erweitert. Dazu werden numerische Untersuchungen verschiedener Monte-Carlo-Algorithmen zur Berechnung der Zustandsdichte durchgeführt. Das Hauptaugenmerk liegt dabei auf Verfahren, die auf Übergangsmatrizen basieren, sowie auf dem Verfahren von Wang und Landau. Im ersten Teil der Forschungsarbeit wird ein umfassender Überblick über Monte-Carlo-Methoden und Auswerteverfahren zur Bestimmung der Zustandsdichte sowie über verwandte Verfahren gegeben. Außerdem werden verschiedene Methoden zur Berechnung der Zustandsdichte aus Übergangsmatrizen vorgestellt und diskutiert. Im zweiten Teil der Arbeit wird eine neue Vergleichsgrundlage für Algorithmen zur Bestimmung der Zustandsdichte erarbeitet. Dazu wird ein neues Modellsystem entwickelt, an dem verschiedene Parameter frei gewählt werden können und für das die exakte Zustandsdichte sowie die exakte Übergangsmatrix bekannt sind. Anschließend werden zwei weitere Systeme diskutiert für welche zumindest die exakte Zustandsdichte bekannt ist: das Ising Modell und das Lennard-Jones System. Der dritte Teil der Arbeit beschäftigt sich mit numerischen Untersuchungen an einer Auswahl der vorgestellten Verfahren. Auf Basis der entwickelten Vergleichsgrundlage wird der Einfluss verschiedener Parameter auf die Qualität der berechneten Zustandsdichte quantitativ bestimmt. Es wird gezeigt, dass Übergangsmatrizen in Simulationen mit Wang-Landau-Verfahren eine wesentlich bessere Zustandsdichte liefern als das Verfahren selbst. Anschließend werden die gewonnenen Erkenntnisse genutzt um ein neues Verfahren zu entwickeln mit welchem die Zustandsdichte mittels Minimierung der Abweichungen des detaillierten Gleichgewichts aus großen, dünnbesetzten Übergangsmatrizen gewonnen werden kann. Im Anschluss wird ein Lennard-Jones-System im großkanonischen Ensemble untersucht. Es wird gezeigt, dass durch das neue Verfahren Zustandsdichte und Dampfdruckkurve bestimmt werden können, welche qualitativ mit Referenzdaten übereinstimmen. Statistische Mechanik Statistische Physik Markov-Ketten-Monte-Carlo Verfahren Simulated Annealing Zustandsdichte Wang-Landau Verfahren Übergangsmatrix Zufallsgraph Detailliertes Gleichgewicht Phasenübergang Großkanonisches Ensemble statistical mechanics statistical physics Markov-Chain Monte-Carlo Method simulated annealing density of states Wang-Landau method transition matrix random graph detailed balance phase transition grand canonical ensemble ddc:531 ddc:532 Statistische Physik Statistische Mechanik Zustandsdichte Stochastische Matrix Zufallsgraph Phasenumwandlung
240	Transport optimal : régularité et applications / Optimal Transport : Regularity and applications Gallouët, Thomas 10 December 2012 (has links) Cette thèse comporte deux parties distinctes, toutes les deux liées à la théorie du transport optimal. Dans la première partie, nous considérons une variété riemannienne, deux mesures à densité régulière et un coût de transport, typiquement la distance géodésique quadratique et nous nous intéressons à la régularité de l’application de transport optimal. Le critère décisif à cette régularité s’avère être le signe du tenseur de Ma-Trudinger-Wang (MTW). Nous présentons tout d’abord une synthèse des travaux réalisés sur ce tenseur. Nous nous intéressons ensuite au lien entre la géométrie des lieux d’injectivité et le tenseur MTW. Nous montrons que dans de nombreux cas, la positivité du tenseur MTW implique la convexité des lieux d’injectivité. La deuxième partie de cette thèse est liée aux équations aux dérivées partielles. Certaines peuvent être considérées comme des flots gradients dans l’espace de Wasserstein W2. C’est le cas de l’équation de Keller-Segel en dimension 2. Pour cette équation nous nous intéressons au problème de quantification de la masse lors de l’explosion des solutions ; cette explosion apparaît lorsque la masse initiale est supérieure à un seuil critique Mc. Nous cherchons alors à montrer qu’elle consiste en la formation d’un Dirac de masse Mc. Nous considérons ici un modèle particulaire en dimension 1 ayant le même comportement que l’équation de Keller-Segel. Pour ce modèle nous exhibons des bassins d’attractions à l’intérieur desquels l’explosion se produit avec seulement le nombre critique de particules. Finalement nous nous intéressons au profil d’explosion : à l’aide d’un changement d’échelle parabolique nous montrons que la structure de l’explosion correspond aux points critiques d’une certaine fonctionnelle. / This thesis consists in two distinct parts both related to the optimal transport theory.The first part deals with the regularity of the optimal transport map. The key tool is the Ma-Trundinger-Wang tensor and especially its positivity. We first give a review of the known results about the MTW tensor. We then explore the geometrical consequences of the MTW tensor on the injectivity domain. We prove that in many cases the positivity of MTW implies the convexity of the injectivity domain. The second part is devoted to the behaviour of a Keller-Segel solution in the super critical case. In particular we are interested in the mass quantization problem: we wish to quantify the mass aggregated when the blow-up occurs. In order to study the behaviour of the solution we consider a particle approximation of a Keller-Segel type equation in dimension 1. We define this approximation using the gradient flow interpretation of the Keller-Segel equation and the particular structure of the Wasserstein space in dimension 1. We show two kinds of results; we first prove a stability theorem for the blow-up mechanism: we exhibit basins of attraction in which the solution blows up with only the critical number of particles. We then prove a rigidity theorem for the blow-up mechanism: thanks to a parabolic rescaling we prove that the structure of the blow-up is given by the critical points of a certain functional. Transport optimal Régularité Ma-Trundinger-Wang MTW Coût Variété riemannienne Convexité Domaine d'injectivité Lipschitz C-convexité Keller-Segel Quantification de la masse Particules 1D Explosion Wasserstein Flot gradient Espace métrique Masse critique Optimal transport Regularity Ma-Trundinger-Wang MTW Cost Riemannian manifold Convexity Injectivity domain Lipschitz continuous C-convexity Keller-Segel Mass quantization Particles 1D Blow-up Wasserstein Gradient flow Metric space Critical mass

Search results