• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4
  • 1
  • Tagged with
  • 5
  • 5
  • 5
  • 3
  • 3
  • 3
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Modélisation de la prévision de défaillance des entreprises par des approches statiques et dynamiques : réseaux de neurones, réseaux bayésiens, modèles de durée et dichotomiques / Modeling of business failure prediction by statistic and dynamic approaches : neural networks, Bayesian networks, duration and dichotomous models

Abid, Ilyes 15 November 2011 (has links)
L'objectif de cette thèse est d’étudier différentes méthodes de prévision de la défaillance d'entreprises aussi bien en statique qu'en dynamique. Plus précisément, dans l'approche statique, nous avons recouru aux méthodes de sélection des variables discriminantes en utilisant les réseaux de neurones. Nous avons ainsi proposé deux nouvelles procédures relevant de ces méthodes.La première, fondée sur le critère HVS, intitulée HVS-AUC, nous a permis i) de construire un modèle plus parcimonieux par rapport à l’ADL ; ii) de dégager un ensemble de variables stables à la fois non conjoncturelles et avec un fort pouvoir explicatif. A l'inverse, la seconde technique est basée sur la procédure forward ou plus exactement sur forward-AUC. Cette méthode fait apparaître des résultats comparables à l'ADL mais avec moins de variables explicatives. Elle permet notamment de détecter les ratios jugés les plus pertinents selon ADL et HVS-AUC.Nous avons de plus utilisé des méthodes d'apprentissage de structure de réseaux bayésiens pour essayer d'améliorer la performance de classification des entreprises. Nous avons mobilisé une technique intitulée "Max-Min Hill-Climbing" ou MMHC. Nous avons analysé les performances de classification d'un algorithme combiné entre MMHC et le modèle de base d'un réseau bayésien naïf (BN). Cette nouvelle méthode a été nommée BN-MMHC (Bayes naïf augmentée par MMHC). Les résultats obtenus confirment néanmoins l'opinion dominante : pour ce qui est du pouvoir discriminant, aucune structure ne semble à même de concurrencer BN de manière significative.Dans la deuxième approche dynamique, nous avons mis plus l'accent sur les facteurs non mesurables a priori et sur des facteurs explicatifs impossibles à appréhender dans un cadre statique. Nous avons mobilisé dans un premier volet les variables macroéconomiques pour mieux estimer le risque de défaut. Dans un second volet, nous avons utilisé une modélisation alternative permettant d'appréhender correctement les chocs que peuvent subir les entreprises au cours du temps. De ce fait, nous avons évalué ainsi l'effet de la propagation de ces chocs. / The objective of this thesis is to study bankruptcy prediction models from both static and dynamic viewpoints. More precisely, in the static approach, we used the methods of selecting discriminating variables using the neural networks. We thus proposed two new procedures relating to these methods. The first one is based on the criterion HVS called HVS-AUC and allowed to 1) build a more parsimonious model compared to the LDA, 2) identify a set of variables both static and non-cyclical with a strong explanatory power. Conversely, the second technique is based on the forward procedure, more precisely on forward-AUC. This method shows results comparable to the LDA but with fewer variables. It allows the detection of ratios considered as the most relevant according to LDA and HVS-AUC. We have also used methods of structure learning of Bayesian networks to improve the performance of classification of firms. We have mobilized a technique called "Max-Min Hill-Climbing" or MMHC. Specifically, we plan to analyze the performance of classification of an algorithm that mixes both MMHC and the canonical model of a naive Bayes network (NB). This new method could be called NB-MMHC (naive Bayes augmented by MMH C). The results confirm the prevailing view: as for the discriminatory power, no structure seems to be able to significantly compete with NB. In the second dynamic approach, we put more emphasis on factors not measurable a priori and also on explanatory factors impossible to capture within a static framework. In the first phase, we used the macroeconomic variables to better estimate the risk of default. In the second part, we used an alternative model to better estimate the shocks that firms could undergo over time. We therefore evaluate the propagation effects of theses shocks
2

Reconstruction et étude des baryons multi-étranges dans les collisions d'ions lourds ultra-relativistes à $\sqrt(S_(NN))$ = GeV

Faivre, Julien 01 October 2004 (has links) (PDF)
L'étude de la production d'étrangeté est essentielle pour la compréhension du scénario des collisions d'ions lourds ultra-relativistes. Elle est donc directement nécessaire à l'étude de la phase de partons déconfinés qui résulterait de ces collisions : le plasma de quarks et de gluons. STAR, l'une des quatre expériences du collisionneur RHIC, constitue un outil idéal pour l'observation des particules multi-étranges Xi et Oméga. Nous avons créé un code de reconstruction des Xi et Oméga utilisant les traces de la chambre à projection temporelle de STAR. Nous avons ensuite mis au point une méthode multivariables de sélection du signal par rapport au fond combinatoire, l'analyse discriminante linéaire, permettant d'optimiser l'efficacité de la sélection et le rapport signal sur bruit en prenant en compte les corrélations entre variables. Nous l'avons appliquée aux données Au-Au prises à 200 GeV dans le centre de masse afin d'améliorer la précision des résultats précédents. Le taux de production de Oméga et anti-Oméga a été obtenu pour trois classes de centralité, ainsi que leur flot radial et leur température de découplage cinétique. Le gain sur l'incertitude relative est de 15 à 30 % selon les observables. Notre analyse permet en outre de distinguer la fonction modélisant le mieux le spectre en masse transverse des Oméga. La vitesse moyenne du flot radial 0,50 ± 0,02 c et la température de découplage cinétique 132 ± 20 MeV ainsi mesurées semblent notamment indiquer que les baryons multi-étranges se découplent plus tôt du milieu hadronique que les particules plus légères que sont le pion, le kaon et le proton. Les barres d'erreur restent cependant trop grandes pour tirer des conclusions fortes.
3

Le décodage des expressions faciales émotionnelles à travers différentes bandes de fréquences spatiales et ses interactions avec l’anxiété

Harel, Yann 08 1900 (has links)
Le décodage des expressions faciales émotionnelles (EFE) est une fonction clé du système visuel humain puisqu’il est à la base de la communication non-verbale sur laquelle reposent les interactions sociales. De nombreuses études suggèrent un traitement différentiel des attributs diagnostiques du visage au sein des basses et des hautes fréquences spatiales (FS), respectivement sous-tendu par les voies magno- et parvocellulaires. En outre, des conditions telles que l’anxiété sociale sont susceptibles d’affecter ce traitement et d’entrainer une modulation des potentiels reliés aux évènements (PRE). Cette étude explore la possibilité de prédire le niveau d’anxiété social des individus à partir des corrélats électrophysiologiques du décodage d’EFE dans différentes bandes de FS. À cette fin, les PRE de 26 participants (âge moyen = 23.7 ± 4.7) ont été enregistrés lors de la présentation visuelle d’expressions neutres, de joie ou de colère filtrées pour ne retenir que les basses, moyennes ou hautes FS. L’anxiété sociale a été évaluée par l’administration préalable du questionnaire LSAS. Les latences et pics d’amplitude de la P100, N170, du complexe N2b/P3a et de la P3b ont été analysés statistiquement et utilisés pour entrainer différents algorithmes de classification. L’amplitude de la P100 était reliée au contenu en FS. La N170 a montré un effet des EFE. Le complexe N2b/P3a était plus ample pour les EFE et plus précoce pour les hautes FS. La P3b était moins ample pour les visages neutres, qui étaient aussi plus souvent omis. L’analyse discriminante linéaire a montré une précision de décodage d’en moyenne 56.11% au sein des attributs significatifs. La nature de ces attributs et leur sensibilité à l’anxiété sociale sera discutée. / The decoding of emotional facial expressions (EFE) is a key function of the human visual system since it lays at the basis of non-verbal communication that allows social interactions. Numerous studies suggests that the processing of faces diagnostic features may take place differently for low and high spatial frequencies (SF), respectively in the magno- and parvocellular pathways. Moreover, conditions such as social anxiety are supposed to influence this processing and the associated event-related potentials (ERP). This study explores the feasibility of predicting social anxiety levels using electrophysiological correlates of EFE processing across various SF bands. To this end, ERP from 26 participants (mean age = 23.7 ± 4.7) years old were recorded during visual presentation of neutral, angry and happy facial expressions, filtered to retain only low, medium or high SF. Social anxiety was previously assessed using the LSAS questionnary. Peak latencies and amplitudes of the P100, N170, N2b/P3a complex and P3b components were statistically analyzed and used to feed supervised machine learning algorithms. P100 amplitude was linked to SF content. N170 was effected by EFE. N2b/P3a complex was larger for EFE and earlier for high SF. P3b was lower for neutral faces, which were also more often omitted. The linear discriminant analysis showed a decoding accuracy across significant features with a mean of 56.11%. The nature of these features and their sensitivity to social anxiety will be discussed.
4

Algorithmes basés sur la programmation DC et DCA pour l’apprentissage avec la parcimonie et l’apprentissage stochastique en grande dimension / DCA based algorithms for learning with sparsity in high dimensional setting and stochastical learning

Phan, Duy Nhat 15 December 2016 (has links)
De nos jours, avec l'abondance croissante de données de très grande taille, les problèmes de classification de grande dimension ont été mis en évidence comme un challenge dans la communauté d'apprentissage automatique et ont beaucoup attiré l'attention des chercheurs dans le domaine. Au cours des dernières années, les techniques d'apprentissage avec la parcimonie et l'optimisation stochastique se sont prouvées être efficaces pour ce type de problèmes. Dans cette thèse, nous nous concentrons sur le développement des méthodes d'optimisation pour résoudre certaines classes de problèmes concernant ces deux sujets. Nos méthodes sont basées sur la programmation DC (Difference of Convex functions) et DCA (DC Algorithm) étant reconnues comme des outils puissants d'optimisation non convexe. La thèse est composée de trois parties. La première partie aborde le problème de la sélection des variables. La deuxième partie étudie le problème de la sélection de groupes de variables. La dernière partie de la thèse liée à l'apprentissage stochastique. Dans la première partie, nous commençons par la sélection des variables dans le problème discriminant de Fisher (Chapitre 2) et le problème de scoring optimal (Chapitre 3), qui sont les deux approches différentes pour la classification supervisée dans l'espace de grande dimension, dans lequel le nombre de variables est beaucoup plus grand que le nombre d'observations. Poursuivant cette étude, nous étudions la structure du problème d'estimation de matrice de covariance parcimonieuse et fournissons les quatre algorithmes appropriés basés sur la programmation DC et DCA (Chapitre 4). Deux applications en finance et en classification sont étudiées pour illustrer l'efficacité de nos méthodes. La deuxième partie étudie la L_p,0régularisation pour la sélection de groupes de variables (Chapitre 5). En utilisant une approximation DC de la L_p,0norme, nous prouvons que le problème approché, avec des paramètres appropriés, est équivalent au problème original. Considérant deux reformulations équivalentes du problème approché, nous développons différents algorithmes basés sur la programmation DC et DCA pour les résoudre. Comme applications, nous mettons en pratique nos méthodes pour la sélection de groupes de variables dans les problèmes de scoring optimal et d'estimation de multiples matrices de covariance. Dans la troisième partie de la thèse, nous introduisons un DCA stochastique pour des problèmes d'estimation des paramètres à grande échelle (Chapitre 6) dans lesquelles la fonction objectif est la somme d'une grande famille des fonctions non convexes. Comme une étude de cas, nous proposons un schéma DCA stochastique spécial pour le modèle loglinéaire incorporant des variables latentes / These days with the increasing abundance of data with high dimensionality, high dimensional classification problems have been highlighted as a challenge in machine learning community and have attracted a great deal of attention from researchers in the field. In recent years, sparse and stochastic learning techniques have been proven to be useful for this kind of problem. In this thesis, we focus on developing optimization approaches for solving some classes of optimization problems in these two topics. Our methods are based on DC (Difference of Convex functions) programming and DCA (DC Algorithms) which are wellknown as one of the most powerful tools in optimization. The thesis is composed of three parts. The first part tackles the issue of variable selection. The second part studies the problem of group variable selection. The final part of the thesis concerns the stochastic learning. In the first part, we start with the variable selection in the Fisher's discriminant problem (Chapter 2) and the optimal scoring problem (Chapter 3), which are two different approaches for the supervised classification in the high dimensional setting, in which the number of features is much larger than the number of observations. Continuing this study, we study the structure of the sparse covariance matrix estimation problem and propose four appropriate DCA based algorithms (Chapter 4). Two applications in finance and classification are conducted to illustrate the efficiency of our methods. The second part studies the L_p,0regularization for the group variable selection (Chapter 5). Using a DC approximation of the L_p,0norm, we indicate that the approximate problem is equivalent to the original problem with suitable parameters. Considering two equivalent reformulations of the approximate problem we develop DCA based algorithms to solve them. Regarding applications, we implement the proposed algorithms for group feature selection in optimal scoring problem and estimation problem of multiple covariance matrices. In the third part of the thesis, we introduce a stochastic DCA for large scale parameter estimation problems (Chapter 6) in which the objective function is a large sum of nonconvex components. As an application, we propose a special stochastic DCA for the loglinear model incorporating latent variables
5

Utilisation d'algorithmes génétiques pour l'identification systématique de réseaux de gènes co-régulés. / Using genetic algorithms to systematically identify co-regulated genes networks

Janbain, Ali 16 July 2019 (has links)
L’objectif de ce travail est de mettre au point une nouvelle approche automatique pour identifier les réseaux de gènes concourant à une même fonction biologique. Ceci permet une meilleure compréhension des phénomènes biologiques et notamment des processus impliqués dans les maladies telles que les cancers. Différentes stratégies ont été développées pour essayer de regrouper les gènes d’un organisme selon leurs relations fonctionnelles : génétique classique et génétique moléculaire. Ici, nous utilisons une propriété connue des réseaux de gènes fonctionnellement liés à savoir que ces gènes sont généralement co-régulés et donc co-exprimés. Cette co-régulation peut être mise en évidence par des méta-analyses de données de puces à ADN (micro-arrays) telles que Gemma ou COXPRESdb. Dans un travail précédent [Al Adhami et al., 2015], la topologie d’un réseau de co-expression de gènes a été caractérisé en utilisant deux paramètres de description des réseaux qui discriminent des groupes de gènes sélectionnés aléatoirement (modules aléatoires, RM) de groupes de gènes avec des liens fonctionnels connus (modules fonctionnels, FM), c’est-à-dire des gènes appartenant au même processus biologique GO. Dans le présent travail, nous avons cherché à généraliser cette approche et à proposer une méthode, appelée TopoFunc, pour améliorer l’annotation existante de la fonction génique. Nous avons d’abord testé différents descripteurs topologiques du réseau de co-expression pour sélectionner ceux qui identifient le mieux des modules fonctionnels. Puis, nous avons constitué une base de données rassemblant des modules fonctionnels et aléatoires, pour lesquels, sur la base des descripteurs sélectionnés, nous avons construit un modèle de discrimination LDA [Friedman et al., 2001] permettant, pour un sous-ensemble de gènes donné, de prédire son type (fonctionnel ou non). Basée sur la méthode de similarité de gènes travaillée par Wang et ses collègues [Wang et al., 2007], nous avons calculé un score de similarité fonctionnelle entre les gènes d’un module. Nous avons combiné ce score avec celui du modèle LDA dans une fonction de fitness implémenté dans un algorithme génétique (GA). À partir du processus biologique d’ontologie de gènes donné (GO-BP), AG visait à éliminer les gènes faiblement co-exprimés avec la plus grande clique de GO-BP et à ajouter des gènes «améliorant» la topologie et la fonctionnalité du module. Nous avons testé TopoFunc sur 193 GO-BP murins comprenant 50-100 gènes et avons montré que TopoFunc avait agrégé un certain nombre de nouveaux gènes avec le GO-BP initial tout en améliorant la topologie des modules et la similarité fonctionnelle. Ces études peuvent être menées sur plusieurs espèces (homme, souris, rat, et possiblement poulet et poisson zèbre) afin d’identifier des modules fonctionnels conservés au cours de l’évolution. / The aim of this work is to develop a new automatic approach to identify networks of genes involved in the same biological function. This allows a better understanding of the biological phenomena and in particular of the processes involved in diseases such as cancers. Various strategies have been developed to try to cluster genes of an organism according to their functional relationships : classical genetics and molecular genetics. Here we use a well-known property of functionally related genes mainly that these genes are generally co-regulated and therefore co-expressed. This co-regulation can be detected by microarray meta-analyzes databases such as Gemma or COXPRESdb. In a previous work [Al Adhami et al., 2015], the topology of a gene coexpression network was characterized using two description parameters of networks that discriminate randomly selected groups of genes (random modules, RM) from groups of genes with known functional relationship (functional modules, FM), e.g. genes that belong to the same GO Biological Process. We first tested different topological descriptors of the co-expression network to select those that best identify functional modules. Then, we built a database of functional and random modules for which, based on the selected descriptors, we constructed a discrimination model (LDA)[Friedman et al., 2001] allowing, for a given subset of genes, predict its type (functional or not). Based on the similarity method of genes worked by Wang and co-workers [Wang et al., 2007], we calculated a functional similarity score between the genes of a module. We combined this score with that of the LDA model in a fitness function implemented in a genetic algorithm (GA). Starting from a given Gene Ontology Biological Process (GO-BP), AG aimed to eliminate genes that were weakly coexpressed with the largest clique of the GO-BP and to add genes that "improved" the topology and functionality of the module. We tested TopoFunc on the 193 murine GO-BPs comprising 50-100 genes and showed that TopoFunc aggregated a number of novel genes to the initial GO-BP while improving module topology and functional similarity. These studies can be conducted on several species (humans, mice, rats, and possibly chicken and zebrafish) to identify functional modules preserved during evolution.

Page generated in 0.1 seconds