Global ETD Search

1	Molecular protein function prediction using sequence similarity-based and similarity-free approaches Kannan, Sivakumar January 2007 (has links) Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal. Annotation de génomes Prédiction de la fonction protéique Exploration de données Apprentissage machine Classification Arbre de décision Validation par connaissance expert
2	Une solution facilitant l'accessibilité et la classification des images Web pour les mal voyants Aouat, Assia Ferial January 2005 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. Accessibilité Web Image Web Classification des images Malvoyants Apprentissage Arbre de décision Service Web
3	Arbre de décision temporel multi-opérateur / Multi-operator Temporal Decision Trees Shalaeva, Vera 30 November 2018 (has links) Aujourd'hui, du fait de la multiplication du nombre des capteurs et, plus généralement, de celle des données issues de dispositifs connectés, de nombreux domaines d'activité sont intéressés par la classification automatique des séries temporelles.Au-delà de la recherche théorique de nouveaux algorithmes d'apprentissage automatique capables de traiter ces données complexes, il est important de fournir aux utilisateurs des méthodes capables de construire efficacement des modèles prédictifs, mais aussi de se focaliser sur l'explicabilité des modèles générés et la transparence des processus mis en oeuvre.Ainsi, les utilisateurs qui n'ont pas forcément des connaissances en théorie d'apprentissage peuvent prendre en main plus rapidement ces méthodes et surtout valider la qualité des connaissances apprises vis à vis de leur domaine d'expertise.Dans ce travail de doctorat, nous nous sommes intéressée à la génération d'arbres de décision sur des données temporelles qui est une approche susceptible de construire des modèles assez faciles à interpréter pour un utilisateur "non-expert". Nous avons cherché à améliorer les différentes méthodes présentes dans la littérature en nous focalisant sur trois aspects liés à la construction des noeuds de l'arbre. Premièrement, nous avons introduit la notion d'arbre de décision temporel multi-opérateur (MTDT) qui consiste à utiliser, en concurrence, plusieurs méthodes pour construire chaque noeud. D'une part cela permet d'améliorer les capacités prédictives des arbres en capturant les meilleures structures géométriques discriminantes pour chaque classe et pour chaque niveau de l'arbre. D'autre part, grâce à cette approche on améliore la lisibilité des modèles en réduisant significativement la taille des arbres qui sont produits. Deuxièmement, nous avons cherché à réduire la complexité des algorithmes en utilisant une recherche locale pour explorer les opérateurs de contruction des noeuds. Cette recherche s'appuie sur la définition de bornes dans les métriques utilisées. Enfin, nous avons développé et comparé différentes méthodes automatiques de pondération des sous-séquences des séries temporelles de manière à maximiser la précision des arbres de décision produits. / Rising interest in mining and analyzing time series data in many domains motivates designing machine learning (ML) algorithms that are capable of tackling such complex data. Except of the need in modification, improvement, and creation of novel ML algorithms that initially works with static data, criteria of its interpretability, accuracy and computational efficiency have to be fulfilled. For a domain expert, it becomes crucial to extract knowledge from data and appealing when a yielded model is transparent and interpretable. So that, no preliminary knowledge of ML is required to read and understand results. Indeed, an emphasized by many recent works, it is more and more needed for domain experts to get a transparent and interpretable model from the learning tool, thus allowing them to use it, even if they have few knowledge about ML's theories. Decision Tree is an algorithm that focuses on providing interpretable and quite accurate classification model.More precisely, in this research we address the problem of interpretable time series classification by Decision Tree (DT) method. Firstly, we present Temporal Decision Tree, which is the modification of classical DT algorithm. The gist of this change is the definition of a node's split. Secondly, we propose an extension, called Multi-operator Temporal Decision Tree (MTDT), of the modified algorithm for temporal data that is able to capture different geometrical classes structures. The resulting algorithm improves model readability while preserving the classification accuracy.Furthermore, we explore two complementary issues: computational efficiency of extended algorithm and its classification accuracy. We suggest that decreasing of the former is reachable using a Local Search approach to built nodes. And preserving of the latter can be handled by discovering and weighting discriminative time stamps of time series. Arbre de Décision Series temporelles Classification Decision Trees Time series Classification 004
4	Understanding complex systems through computational modeling and simulation / Comprendre les systèmes complexes par la modélisation et la simulation computationnelles Le, Xuan Tuan 18 January 2017 (has links) Les approches de simulation classiques ne sont en général pas adaptées pour traiter les aspects de complexité que présentent les systèmes complexes tels que l'émergence ou l'adaptation. Dans cette thèse, l'auteur s'appuie sur ses travaux menés dans le cadre d'un projet de simulation sur l’épidémie de grippe en France associée à des interventions sur une population en considérant le phénomène étudié comme un processus diffusif sur un réseau complexe d'individus, l'originalité réside dans le fait que la population y est considérée comme un système réactif. La modélisation de tels systèmes nécessite de spécifier explicitement le comportement des individus et les réactions de ceux-cis tout en produisant un modèle informatique qui doit être à la fois flexible et réutilisable. Les diagrammes d'états sont proposés comme une approche de programmation reposant sur une modélisation validée par l'expertise. Ils correspondent également à une spécification du code informatique désormais disponibles dans les outils logiciels de programmation agent. L'approche agent de type bottom-up permet d'obtenir des simulations de scénario "what-if" où le déroulement des actions peut nécessiter que les agents s'adaptent aux changements de contexte. Cette thèse propose également l'apprentissage pour un agent par l'emploi d'arbre de décision afin d'apporter flexibilité et lisibilité pour la définition du modèle de comportement des agents et une prise de décision adaptée au cours de la simulation. Notre approche de modélisation computationnelle est complémentaire aux approches traditionnelles et peut se révéler indispensable pour garantir une approche pluridisciplinaire validable par l'expertise. / Traditional approaches are not sufficient, and sometimes impossible in dealing with complexity issues such as emergence, self-organization, evolution and adaptation of complex systems. As illustrated in this thesis by the practical work of the author in a real-life project, the spreading of infectious disease as well as interventions could be considered as difusion processes on complex networks of heterogeneous individuals in a society which is considered as a reactive system. Modeling of this system requires explicitly specifying of each individual’s behaviors and (re)actions, and transforming them into computational model which has to be flexible, reusable, and ease of coding. Statechart, typical for model-based programming, is a good solution that the thesis proposes. Bottom-up agent based simulation finds emergence episodes in what-if scenarios that change rules governing agent’s behaviors that requires agents to learn to adapt with these changes. Decision tree learning is proposed to bring more flexibility and legibility in modeling of agent’s autonomous decision making during simulation runtime. Our proposition for computational models such as agent based models are complementary to traditional ones, and in some case they are unique solutions due to legal, ethical issues. Modélisation computationnelle Modélisation à base d’agents Statechart Arbre de décision Computational modeling Agent-Based model Statechart Decision tree
5	Coût-efficacité des stratégies vaccinales en France, exemple de trois pathologies infectieuses : le tétanos, la rage et les infections materno-fœtales à cytomégalovirus / Cost-effectiveness of immunization strategies against infectious diseases in France with three examples : tetanus, rabies, and cytomegalovirus maternal-fetal infections N'Diaye, Dieynaba 19 November 2014 (has links) Dans un contexte de ressources limitées, les analyses médico-économiques participent à la réflexion sur l'allocation optimale des budgets disponibles et contribuent à l'identification des priorités de santé publique. Parmi elles, les analyses coût-efficacité permettent de comparer l'efficience de différentes alternatives permettant d'aider à faire un choix. Lorsque ces analyses sont appliquées à la vaccination, elles présentent des particularités que nous avons explorées et illustrées à travers trois pathologies infectieuses prises en charge en France.Vaccination post-exposition conditionnelle au diagnostic de l'immunité avec l'exemple du tétanos, compte-tenu de la disponibilité de tests de diagnostic rapide de l'immunité antitétanique. Vaccination post-exposition conditionnelle à la nature de l'exposition avec l'exemple de la rage, compte-tenu d'un faible niveau de risque.accination préventive avant la période à risque de survenue de l'infection avec l'exemple des infections materno-f¿tales à cytomégalovirus (CMV), compte-tenu des résultats d'un nouveau candidat vaccin.Nos résultats montrent que l'efficience de stratégies vaccinales peut être optimisée si une attention particulière est portée à la mise en place d'un moyen de dépistage de l'immunité sensible et peu coûteux et si ces stratégies sont en adéquation avec le niveau du risque infectieux réel. Le coût-efficacité est également maximisé lorsque la stratégie vaccinale tient compte de l'hétérogénéité du risque infectieux au sein de la population cible. Ces résultats pourraient être utilisés par les autorités de santé pour l'évaluation d'interventions vaccinales futures ou actuellement implémentées en France. / In a context of limited resources, health economic analyses contribute to the optimal allocation of available budgets and public health priorities assessment. Among them, cost-effectiveness analyses allow to compare the efficiency of several alternatives in order to make an informed choice. When those analyses are applied to immunization interventions, they present specific characteristics that we explored and illustrated based on three infectious diseases in the French context.1) Post-exposure immunization conditional to immunity screening with the example of tetanus and the quick diagnostic tests available to screen tetanus immunity.2) Post-exposure immunization conditional to the type of exposure with the example of rabies in a low-risk context. 3) Preventive vaccination before the at-risk period of infection through the example cytomegalovirus (CMV) infections during pregnancy, with the available results of a new vaccine candidate.Our results showed that efficiency immunization strategies can be maximized if we emphasize on the implementation of screening methods that are sensitive and inexpensive, and if those strategies are in adequacy with the real risk of infection. Efficiency is also optimized when the immunization strategy takes into account the heterogeneity of the risk of infection in the target population. Those results could be used by health authorities in the evaluation of current or future immunization interventions implemented in France. Coût-Efficacité Vaccination Maladies infectieuses Arbre de décision Modèle de Markov Dépistage Cost-effectiveness Vaccination 614.4
6	Enhancing and evolving a rule-based system using historical data : a neuro-fuzzy approach Mai, Gang January 2002 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. Système à base de règles Arbre de décision flous Système de régression flous Prédiction de qualité des logiciels Réseaux de neurones
7	Mesures de discrimination et leurs applications en apprentissage inductif Dang, Thanh Ha 10 July 2007 (has links) (PDF) De nos jours, les données disponibles deviennent de plus en plus volumineuses et elles peuvent être de nature très diverse : vagues, manquantes, numériques, symboliques par exemple. Or ce qui importe à l'utilisateur, ce ne sont pas les données elles-mêmes, mais les connaissances qu'on peut en extraire. Face à la quantité de données disponibles, le traitement efficace de données est problématique. Dans cette thèse, nous adoptons une approche d'extraction de connaissances à partir de données basée sur l'apprentissage inductif, plus précisément, par arbres de décision.<br /><br />De façon générale, un système construit par apprentissage inductif a pour but de discriminer les individus de différentes classes. Sa qualité dépend de la capacité de discrimination qu'il acquiert au cours de l'apprentissage au travers des données. En particulier, un algorithme de construction d'arbre de décision procède par évaluation successive de la capacité de discrimination des attributs pour construire l'arbre de décision.<br /><br />Nos travaux concernent l'étude des mesures de discrimination tant classiques que floues, et leurs applications en apprentissage inductif. <br /><br />D'une part, nous nous intéressons aux mesures de discrimination dans la construction des arbres de décision. Dans un premier temps, ces mesures font l'objet d'une étude selon une approche axiomatique. Nous développons un nouveau modèle pour caractériser les mesures de discriminations floues. Dans un deuxième temps, nous proposons d'utiliser ces mesures dans les différentes étapes de la construction des arbres de décision flous. <br /><br />D'autre part, nous étudions l'utilisation de ces mesures de discrimination pour d'autres aspects de l'apprentissage. Nous examinons tout d'abord le problème de l'évaluation des classifieurs et proposons une méthode basée sur l'utilisation de la notion de capacité de discrimination. Enfin, nous considérons le problème du traitement des données manquantes et proposons une technique de substitution des valeurs manquantes, qui restitue la capacité de discrimination des attributs. <br /><br />Ces travaux sont validés sur des données conventionnelles et appliqués à des données réelles dans le cadre de deux applications qui concernent la classification de courriers électroniques et la classification de traces d'interactions homme-machine. apprentissage inductif arbre de décision mesure de discrimination entropie traitement de données manquantes évaluation de classifieurs
8	Une nouvelle classification des myopathies inflammatoires fondée sur des manifestations cliniques et la présence d'auto-anticorps spécifiques par analyses multidimensionnelles / A new classification of inflammatory myopathies based on clinical manifestations and the presence of myositis-specific autoantibodies by multidimensional analysis Mariampillai, Kubéraka 15 December 2017 (has links) Les myopathies inflammatoires idiopathiques (MII) sont hétérogènes dans leurs physiopathologies et pronostics. L'émergence d'auto-anticorps spécifiques de myosites (ASM) suggère des sous-groupes plus homogènes de patients. Notre but est de trouver une nouvelle classification des MII fondée des critères phénotypiques, biologiques et immunologiques. Une étude observationnelle, rétrospective, multicentrique a été conduite à partir de la base de données du réseau français des myosites. Nous avons inclus 260 myosites, définies selon les classifications historiques pour la polymyosite (PM), la dermatomyosite (DM) et la myosite à inclusions (MI). Tous les patients ont eu au moins un dot myosite testant les anti-Jo1, anti-PL7, anti-PL12, anti-Mi-2, anti-Ku, anti-PMScl, anti-Scl70 and anti-SRP. Nous avons utilisé l'analyse des correspondances multiples suivie d'une classification hiérarchique ascendante afin d'agréger les patients dans des sous-groupes plus homogènes. Quatre clusters émergent. Le premier cluster (n=77) regroupe principalement des MI, avec des vacuoles bordées, des anomalies mitochondriales et de l'inflammation avec des fibres envahies. Le second cluster (n=91) était caractérisé par des myopathies nécrosantes auto-immunes (MNAi) en majorité, avec des anticorps anti-SRP et anti-HMGCR. Le troisième cluster (n=52) regroupe essentiellement des DM avec des anticorps anti-Mi-2, anti-MDA5, ou anti-TiF1 gamma. Le quatrième cluster (n=40) était défini par le SAS (n=36), avec notamment la présence des anti-Jo1 ou anti-PL7. Les critères histologiques sont dispensables pour la prédiction des clusters, soulignant l'importance d'une classification clinico-sérologique. / Idiopathic inflammatory myopathies (IIM or myositis) are heterogeneous in their pathophysiology and prognosis. The emergence of myositis-specific autoantibodies (MSA) suggests homogenous subgroups of patients. Our aim was to find a new classification of IIM based on phenotypic, biological and immunological criteria. An observational, retrospective, multicentre study was led from the database of the myositis French network. We included 260 adult myositis, defined according to historical classifications for polymyositis (PM), dermatomyositis (DM) and inclusion body myositis (IBM). All patients did at least a screening with a line blot assays testing anti-Jo1, anti-PL7, anti-PL12, anti-Mi-2, anti-Ku, anti-PMScl, anti-Scl70 and anti-SRP. We performed multiple correspondence analysis and hierarchical clustering analysis to aggregate patients in homogenous subgroups. Four clusters emerged. The first cluster (n=77) regrouped primarily IBM patients with vacuolated fibres, mitochondrial abnormalities and inflammation with invaded fibres. The second cluster (n=91) was characterized by immune-mediated necrotizing myopathy (IMNM) in the majority of patients, with anti-SRP and anti-HMGCR antibodies. The third cluster (n=52) regrouped mainly DM patients with anti-Mi-2, anti-MDA5, or anti-TiF1 gamma antibodies. The fourth cluster (n=40) was defined by anti-synthetase syndrome (ASS), with the notable presence of anti-Jo1 or anti-PL7 antibodies. The histological criteria are dispensable for the prediction of the clusters, underlining the importance of a clinico-serological classification. Myosites Classification Auto-Anticorps spécifiques Analyses multidimensionnelles Classification ascendante hiérarchique Arbre de décision Myositis Multidimensional analysis Classification 614.4
9	Structures Markoviennes cachées et modèles à corrélations conditionnelles dynamiques : extensions et applications aux corrélations d'actifs financiers / Hidden Markov Models and dynamic conditional correlations models : extensions et application to stock market time series Charlot, Philippe 25 November 2010 (has links) L'objectif de cette thèse est d'étudier le problème de la modélisation des changements de régime dans les modèles a corrélations conditionnelles dynamiques en nous intéressant plus particulièrement a l'approche Markov-switching. A la différence de l'approche standard basée sur le modèle à chaîne de Markov caché (HMM) de base, nous utilisons des extensions du modèle HMM provenant des modèles graphiques probabilistes. Cette discipline a en effet proposé de nombreuses dérivations du modèle de base permettant de modéliser des structures complexes. Cette thèse se situe donc a l'interface de deux disciplines: l'économétrie financière et les modèles graphiques probabilistes.Le premier essai présente un modèle construit a partir d'une structure hiérarchique cachée markovienne qui permet de définir différents niveaux de granularité pour les régimes. Il peut être vu comme un cas particulier du modèle RSDC (Regime Switching for Dynamic Correlations). Basé sur le HMM hiérarchique, notre modèle permet de capter des nuances de régimes qui sont ignorées par l'approche Markov-Switching classique.La seconde contribution propose une version Markov-switching du modèle DCC construite a partir du modèle HMM factorise. Alors que l'approche Markov-switching classique suppose que les tous les éléments de la matrice de corrélation suivent la même dynamique, notre modèle permet à tous les éléments de la matrice de corrélation d'avoir leur propre dynamique de saut. Markov-switching. A la différence de l'approche standard basée sur le modèle à chaîne de Markov caché (HMM) de base, nous utilisons des extensions du modèle HMM provenant des modèles graphiques probabilistes. Cette discipline a en effet propose de nombreuses dérivations du modèle de base permettant de modéliser des structures complexes. Cette thèse se situe donc a l'interface de deux disciplines: l'économétrie financière et les modèles graphiques probabilistes.Le premier essai présente un modèle construit a partir d'une structure hiérarchique cachée markovienne qui permet de définir différents niveaux de granularité pour les régimes. Il peut ^etre vu commeun cas particulier du modele RSDC (Regime Switching for Dynamic Correlations). Base sur le HMMhierarchique, notre modele permet de capter des nuances de regimes qui sont ignorees par l'approcheMarkov-Switching classique.La seconde contribution propose une version Markov-switching du modele DCC construite a partir dumodele HMM factorise. Alors que l'approche Markov-switching classique suppose que les tous les elementsde la matrice de correlation suivent la m^eme dynamique, notre modele permet a tous les elements de lamatrice de correlation d'avoir leur propre dynamique de saut.Dans la derniere contribution, nous proposons un modele DCC construit a partir d'un arbre dedecision. L'objectif de cet arbre est de relier le niveau des volatilites individuelles avec le niveau descorrelations. Pour cela, nous utilisons un arbre de decision Markovien cache, qui est une extension de HMM. / The objective of this thesis is to study the modelling of change in regime in the dynamic conditional correlation models. We focus particularly on the Markov-switching approach. Unlike the standard approach based on the Hidden Markov Model (HMM), we use extensions of HMM coming from probabilistic graphical models theory. This discipline has in fact proposed many derivations of the basic model to model complex structures. Thus, this thesis can be view at the interface of twodisciplines: financial econometrics and probabilistic graphical models.The first essay presents a model constructed from a hierarchical hidden Markov which allows to increase the granularity of the regimes. It can be seen as a special case of RSDC model (Regime Switching for Dynamic Correlations). Based on the hierarchical HMM, our model can capture nuances of regimes that are ignored by the classical Markov-Switching approach.The second contribution proposes a Markov-switching version of the DCC model that is built from the factorial HMM. While the classical Markov-switching approach assumes that all elements of the correlation matrix follow the same switching dynamic, our model allows all elements of the correlation matrix to have their own switching dynamic.In the final contribution, we propose a model DCC constructed based on a decision tree. The objective of this tree is to link the level of volatility with the level of individual correlations. For this, we use a hidden Markov decision tree, which is an extension of HMM. Modèle GARCH multivarié Corrélations conditionnelles dynamiques Modèle de Markov caché Arbre de décision Markovien caché Multivariate GARCH Dynamic conditional correlations Hidden Markov model Hidden Markov decision tree
10	Commande prédictive hybride et apprentissage pour la synthèse de contrôleurs logiques dans un bâtiment. / Hybrid Model Predictive Control and Machine Learning for development of logical controllers in buildings Le, Duc Minh Khang 09 February 2016 (has links) Une utilisation efficace et coordonnée des systèmes installés dans le bâtiment doit permettre d’améliorer le confort des occupants tout en consommant moins d’énergie. Ces objectifs à optimiser sont pourtant antagonistes. Le problème résultant peut être alors vu comme un problème d’optimisation multicritères. Par ailleurs, pour répondre aux enjeux industriels, il devra être résolu non seulement dans une optique d’implémentation simple et peu coûteuse, avec notamment un nombre réduit de capteurs, mais aussi dans un souci de portabilité pour que le contrôleur résultant puisse être implanté dans des bâtiments d’orientation différente et situés dans des lieux géographiques variés.L’approche choisie est de type commande prédictive (MPC, Model Predictive Control) dont l’efficacité pour le contrôle du bâtiment a déjà été illustrée dans de nombreux travaux, elle requiert cependant des efforts de calcul trop important. Cette thèse propose une méthodologie pour la synthèse des contrôleurs, qui doivent apporter une performance satisfaisante en imitant les comportements du MPC, tout en répondant à des contraintes industriels. Elle est divisée deux grandes étapes :1. La première étape consiste à développer un contrôleur MPC. De nombreux défis doivent être relevés tels que la modélisation, le réglage des paramètres et la résolution du problème d’optimisation.2. La deuxième étape applique différents algorithmes d’apprentissage automatique (l’arbre de décision, AdaBoost et SVM) sur une base de données obtenue à partir de simulations utilisant le contrôleur prédictif développé. Les grands points levés sont la construction de la base de données, le choix de l’algorithme de l’apprentissage et le développement du contrôleur logique.La méthodologie est appliquée dans un premier temps à un cas simple pour piloter un volet,puis validée dans un cas plus complexe : le contrôle coordonné du volet, de l’ouvrant et dusystème de ventilation. / An efficient and coordinated control of systems in buildings should improve occupant comfort while consuming less energy. However, these objectives are antagonistic. It can then be formulated as a multi-criteria optimization problem. Moreover, it should be solved not only in a simple and cheap implementation perspective, but also for the sake of adaptability of the controller which can be installed in buildings with different orientations and different geographic locations.The MPC (Model Predictive Control) approach is shown well suited for building control in the state of the art but it requires a big computing effort. This thesis presents a methodology to develop logical controllers for equipments in buildings. It helps to get a satisfactory performance by mimicking the MPC behaviors while dealing with industrial constraints. Two keys steps are required :1. In the first step, an optimal controller is developed with hybrid MPC technique. There are challenges in modeling, parameters tuning and solving the optimization problem.2. In the second step, different Machine Learning algorithms (Decision tree, AdaBoost, SVM) are tested on database which is obtained with the simulation with the MPC controller. The main points are the construction of the database, the choice of learning algorithm and the development of logic controller.First, our methodology is tested on a simple case study to control a blind. Then, it is validatedwith a more complex case : development of a coordinated controller for a blind, natural ventilationand mechanical ventilation. Hybrid MPC Apprentissage automatique Arbre de décision SVM Adaboost Optimisation du confort Pilotage du volet Pilotage de la ventilation Hybrid MPC Machine learning Decision tree SVM Adaboost Comfort optimisation Blind control Ventilation control

Search results