• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 5
  • 3
  • Tagged with
  • 6
  • 6
  • 6
  • 6
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Application des arbres décisionnels en grappes pour prédire la performance des institutions microfinancières / Application of decision-trees for predicting the performance of microfinance institutions

Bou Kheir, Roy 28 June 2013 (has links)
Les performances financières et sociales sont des caractéristiques institutionnelles importantes qui permettent aux pauvres et aux ‘quasi-pauvres' d'avoir accès aux crédits dans des conditions favorables, et aboutissent en même temps à un fonctionnement durable et aux mécanismes efficaces de gouvernances dans les institutions micro financières (IMFs). Dans ce contexte, cette étude a été menée afin de déterminer les variables financières/sociales/gouvernables qui peuvent influer les indicateurs de performance financière et sociale des IMFs à l'échelle mondiale; et de développer pour la première fois des arbres logiques décisionnels (en grappes) simples et pratiques qui peuvent être considérés comme des outils précieux aidant la mise en œuvre de stratégies efficaces pour les différents types des IMFs (à but lucratif et non lucratif) à l'échelle nationale.La première partie de cette thèse expose les données financières et sociales globales qui ont été extraites au cours des cinq dernières années (2007-2011) à partir de plusieurs bases de données bien connues (ex. Microfinance Information Exchange, Mix Market, Rating fund, etc…) pour les IMFs choisies classées comme ayant 4 ou 5 diamants (soit, 263 IMFs à but non lucratif et 135 IMFs à but lucratif) distribuées à travers les continents. Parmi les 263 IMFs à but non lucratif, l'échantillon de données a été composé de 192 organisations non-gouvernementales (ONGs), 42 institutions non bancaires et 29 coopératives. Un grand nombre de variables prédictives (54) ont été recueillies reflétant les aspects de l'environnement financier de ces IMFs (par exemple l'index des dépenses administratives, l'index de solvabilité, le coût par prêt, le nombre des déposants, etc…), les caractéristiques sociales (ex. profondeur, pourcentage des emprunteurs actifs ‘femmes', marché rural/urbain, niveau de pauvreté, etc…) et les mécanismes de gouvernance (ex. la taille de l'entreprise, la taille du conseil, la régulation, l'audit, l'affiliation à un réseau, l'assurance, etc…). Cette 1ère partie compare également l'efficacité de la plupart des méthodes/modèles statistiques les plus utilisés (incluant la régression linéaire, la régression logistique, les méthodes bayésiennes, les réseaux artificiels des neurones, l'analyse en composantes principales, etc….) pour estimer les indicateurs de performance financière et sociale au sein des IMFs. Elle inclue aussi une description détaillée du processus de construction des arbres décisionnels en grappes qui peut être utilisé pour cette estimation ainsi que toutes les étapes reliées (comprenant l'évaluation des divisions, l'assignement des catégories aux nœuds, les valeurs manquantes avec des répartiteurs de substitution, les critères d'arrêt, etc….).La deuxième partie explore les relations quantitatives entre les quatre indicateurs de performance financière les plus couramment utilisés [autosuffisance opérationnelle (operational self-sufficiency OSS), marge bénéficiaire (profit margin PM), rendement des actifs (return on assets ROA), et rendement des capitaux propres (return on equity ROE)] et les principales variables prédictives pour les IMFs choisies à but non lucratif (incluses à partir de 53 pays) à travers l'application de la modélisation par arbre de régression. Pour chaque indicateur de performance financière, plusieurs arbres de régression non élagués (684) ont été développés : (i) en utilisant toutes les variables prédictives, (ii) en utilisant toutes les variables prédictives financières seulement, (iii) en utilisant toutes les variables prédictives sociales seulement, (iv) en utilisant toutes les variables prédictives de gouvernance seulement, (v) en appliquant une seule variable prédictive à la fois, (vi) en excluant chaque variable à la fois du groupe potentiel des variables prédictives, et (vi) en forçant la séparation initiale de l'arbre à travers l'utilisation de la variable prédictive préférée afin d'explorer le pouvoir prédictif ... / Financial and social performances are important institutional characteristics that allow ‘the poor and the near-poor' to have access to credit in favorable conditions, and drives sustainable efficiency and effective governance mechanisms in MFIs (microfinance institutions). In this context, this study was conducted to determine the most influencing financial/social/governance variables (with their relative importance in %) that may affect the financial and social MFI performance indicators on worldwide basis; and to develop simple and practical microfinance tree-models (for the first time) that can be considered valuable tools helping with the implementation of efficient strategies among nonprofit and profit MFIs at a national scale.The first part of this thesis exposes the global financial and social data that has been extracted over the five recent years (2007-2011) from several well-known databases (e.g., Microfinance Information Exchange, Mix Market, Rating fund, etc.) for the chosen MFIs ranked four or five diamonds (i.e., 263 nonprofit MFIs and 135 profit ones) distributed widely over the continents. Among the 263 nonprofit MFIs, the data sample was composed of 192 Non-Governmental Organizations (NGOs), 42 non-bank institutions and 29 cooperatives. A large number of predictor variables (54) have been collected capturing aspects of the financial environment of these MFIs (e.g., administrative expense ratio, ratio of solvency, cost per loan, number of depositors, write-off-ratio, etc.), the social characteristics (e.g., depth, percent of women active borrowers, rural/urban market, poverty level, etc.) and the governance mechanisms (e.g., firm size, board size, regulation, audit, network affiliation, insurance, etc.). This first part compares also the efficiencies of the most used statistical methods/models (including linear regression, logistic regression, Bayesian methods, artificial neural networks, cluster analysis, principal component analysis, decision-trees, etc.) for estimating diverse financial and social performance MFIs' indicators. It includes also a detailed description of the tree building process that has been used for such estimation and all related steps (involving evaluating splits, assigning categories to nodes, missing values with surrogate splitters, stopping criteria, etc.).The second part explores quantitative relationships between the four commonly worldwide used financial performance indicators (operational self-sufficiency OSS, profit margin PM, return on assets ROA, and return on equity ROE) and key financial/social/governance predictor variables for the chosen non-profit MFIs (included from 53 countries) through the application of regression-tree modeling. For each financial performance indicator, several un-pruned regression trees (684) were developed: (i) using all predictor variables, (ii) all financial predictor variables only, (iii) all social predictor variables only, (iv) all governance predictor variables only, (v) applying only a single variable at a time, (vi) excluding each variable one at a time from the potential pool of predictor variables, and (vii) forcing the initial split of the tree using the preferred predictor variable for exploring the predictive power of independent predictors. The obtained results demonstrate that the strongest relationships were associated with ROE and ROA, the proportion of variance explained being equal to 99.8% and 99.5% respectively, followed by PM (97%) and OSS (95%). The second part also showed that the financial predictor variables did interfere differently in building the financial performance regression trees and associated relationships where ; administrative expense ratio influenced ROE (100%) ; average loan balance per borrower affected OSS (100%); cost per borrower, number of depositors, operating expense:loan portfolio, and risk coverage had significant impacts on ROA/ROE (98.5-100%).
2

Méthodes d'analyse de la survie nette : utilisation des tables de mortalité, test de comparaison et détection d'agrégats spatiaux / Methods to analyze net survival : use of life tables, comparison test and spatial cluster detection

Graffeo, Nathalie 12 December 2014 (has links)
La survie nette, indicateur clé de l'efficacité des systèmes de soin dans la lutte contre le cancer, est un concept théorique représentant la survie que l'on observerait dans un monde hypothétique où le cancer étudié serait la seule cause de décès. En s'affranchissant de la mortalité due aux causes autres que ce cancer, elle permet des comparaisons entre populations. Dans cette thèse, après présentation du concept et des méthodes d'estimation de la survie nette quand la cause de décès est inconnue, nous étudions trois problématiques. La première porte sur les tables de mortalité utilisées pour estimer la survie nette. En France, ces tables sont stratifiées sur âge, sexe, année et département. Il serait intéressant d'utiliser des tables stratifiées sur d'autres facteurs impactant la mortalité. Nous étudions l'impact du manque de stratification sur les estimations des effets des facteurs pronostiques sur la mortalité en excès (celle due au cancer en l'absence des autres causes de décès) par des études de simulations et sur données réelles. La deuxième problématique porte sur la construction d'un test de type log-rank pour comparer des distributions de survie nette estimées par l'estimateur Pohar-Perme, estimateur non paramétrique consistant de la survie nette. Notre troisième problématique est de déterminer dans une aire géographique des zones différentes en termes de survie nette. Nous adaptons une méthode de détection de clusters à la survie nette en utilisant le test précédemment développé comme critère de découpage. Ce travail propose ainsi des développements et outils nouveaux pour étudier et améliorer la qualité de la prise en charge des patients atteints d'un cancer. / In cancer research, net survival is a key indicator of health care efficiency. This theoretical concept is the survival that would be observed in an hypothetical world where the disease under study would be the only possible cause of death. In population-based studies, where cause of death is unknown, net survival allows to compare net cancer survival between different groups by removing the effect of death from causes other than cancer. In this work, after presenting the concept and the estimation methods of net survival, we focus on three complementary issues. The first one is about the life tables used in the estimates of net survival. In France, these tables are stratified by age, sex, year and département. Other prognostic factors impact on mortality. So it would be interesting to use life tables stratified by some of these factors. We study the impact of the lack of stratification in life tables on the estimates of the effects of prognostic factors on excess mortality by simulations and real data studies. In 2012, the Pohar-Perme estimator was proposed. It is a consistent non parametric estimator of net survival. The second issue involves the building of a log-rank type test to compare distributions of net survival (estimated by the Pohar-Perme estimator) between several groups. Our third issue is to propose a method providing potential spatial clusters which could contain patients with similar net cancer survival rates. We adapt a clustering method using the test we have built as a splitting criterion. This work proposes new developments and new tools to study and improve the quality of care for cancer patients. These methods are suitable to other chronic diseases.
3

Application et développement de méthodes de cartographie numérique des propriétés des sols à l'échelle régionale : cas du Languedoc-Roussillon / Application and development of digital soil mapping methods for soil properties at the regional scale : the case of Languedoc-Roussillon

Vaysse, Kevin 16 December 2015 (has links)
La compréhension de la répartition spatiale des sols et leur cartographie est un enjeu important tant les services écosystémiques rendus par les sols ont un rôle fondamental dans les enjeux agro-environnementaux actuels. A l’échelle nationale, les données pédologiques sont fournies via des cartographies au 1 :250 000 des types de sols (Référentiel Régional Pédologique, RRP) dont la résolution est devenue insuffisante pour répondre à ces enjeux. Placés dans un contexte de cartographie numérique des propriétés des sols à l’échelle régionale (Languedoc-Roussillon) caractérisé par une grande étendue (27 236 km²) et une faible densité de données sur les sols ( 1 observation/13.5 km2), les travaux de thèse ont eu pour objectif de réaliser une nouvelle infrastructure de données pédologiques régionale satisfaisant les spécifications édictées dans le projet international GlobalSoilMap et répondant aux besoins des utilisateurs de la région.Dans un premier temps, plusieurs approches connues de cartographie numérique des sols utilisant les diverses données pédologiques issues du RRP ont été appliquées et comparées entre elles. Les meilleurs résultats ont été obtenus par des approches de régression krigeage utilisant les profils avec analyses de sol existant dans le RRP. Pour le pH, le carbone organique et les variables de texture (argile, limon, sable) les performances de prédiction se sont avérés modérées mais suffisantes pour permettre la production de cartes informatives (R2 entre 0.2 et 0.7). En revanche les propriétés de sol avec une trop faible densité de profils et/ou variant sur des distances trop courtes (Eléments grossier, Profondeur, CEC) n’ont pu être prédites .Dans un deuxième temps, des méthodologies ont été proposées et testées pour mieux estimer les incertitudes de prédictions de propriétés de sol. Concernant les incertitudes locales, des progrès par rapport à l’utilisation de la régression krigeage ont été obtenus avec l’utilisation d’arbres de régression quantile. Ces incertitudes locales ont pu d’autre part être propagées dans les calculs d’indicateurs de sol caractérisant des entités géographiques de la région (exemple : commune). Enfin une troisième étape a été consacrée à la mise en production effective de la nouvelle infrastructure de données pédologique régionale permettant une diffusion des cartes obtenues dans cette thèse vers les utilisateurs.Les résultats de la thèse permettent de démontrer la faisabilité d’une approche de cartographie numérique des propriétés de sols à l’échelle régionale qui pourra être généralisée sur le territoire français. Bien que certains verrous méthodologiques restent à lever (ex : modèles de prédiction pour données censurées, covariable « lithologie »), la faible densité des observations pédologiques stockées actuellement en bases de données représente le facteur limitant majeur qui devra être levé dans l’avenir pour obtenir des cartes numériques de propriétés de sol à des précisions acceptables et incertitudes connues. / Depicting and mapping the soil variability is an important issue since the ecosystem services provided by soils play an important role in solving the current agro-environmental challenges. At the French national scale, the pedological data are currently provided by regional soil databases (« Référentiel Régionaux Pédologiques », RRP) at 1:250,000. However they provide soil information at a spatial resolution that is too coarse for addressing these challenges. This thesis undertakes a Digital Soil Mapping approach at the regional scale in a region (Languedoc-Roussillon) characterized by a great extent (27 236 km ²) and a low density of soil observations (1 observation/13.5 km2). The goal is to produce a new regional infrastructure of pedological data that could satisfy the specifications enacted in the international project GlobalSoilMap and that meets the needs of the local end-users. In a first step, several known approaches of digital soil mapping using the various pedological data available in the RRP were applied and compared. The best results were obtained by a regression-kriging approach using the legacy measured soil profiles of the RRP. For the pH, organic carbon and the variables of texture (clay, silt, sand) the performances of prediction were of moderate quality but sufficient to allow the production of informative maps (R2 between 0.2 and 0.7). Conversely the soil properties with a too low density of profiles and/or that varied within too short distances (coarse fragment, soil Depth, CEC) could not be predicted. In a second step, methodologies were proposed and tested for better estimating uncertainties of predictions of soil properties. Concerning local uncertainties, a progress compared to the use of Regression Kriging was obtained with the use of Quantile Regression Tree. These local uncertainties could in addition be propagated in calculations of soil indicators characterizing the geographical entities of the area (example: districts). Finally a third stage was devoted to the setting in effective production of the new regional infrastructure of pedological data, which allowed the diffusion of the maps obtained in this thesis towards the users. The results of the thesis demonstrate the feasibility of a digital soil mapping approach at the regional scale that could be generalized over the French territory. Although some methodological obstacles have to be addressed (ex: models of prediction for censored data, soil covariate “lithology”), the low density of the pedological observations currently stored in regional databases represents the major limiting factor, which will have to be addressed in the future to obtain digital maps of soil properties with acceptable and known precision.
4

Pénalités minimales pour la sélection de modèle / Minimal penalties for model selection

Sorba, Olivier 09 February 2017 (has links)
Dans le cadre de la sélection de modèle par contraste pénalisé, L. Birgé and P. Massart ont prouvé que le phénomène de pénalité minimale se produit pour la sélection libre parmi des variables gaussiennes indépendantes. Nous étendons certains de leurs résultats à la partition d'un signal gaussien lorsque la famille de partitions envisagées est suffisamment riche, notamment dans le cas des arbres de régression. Nous montrons que le même phénomène se produit dans le cadre de l'estimation de densité. La richesse de la famille de modèle s'apparente à une forme d'isotropie. De ce point de vue le phénomène de pénalité minimale est intrinsèque. Pour corroborer et illustrer ce point de vue, nous montrons que le même phénomène se produit pour une famille de modèles d'orientation aléatoire uniforme. / L. Birgé and P. Massart proved that the minimum penalty phenomenon occurs in Gaussian model selection when the model family arises from complete variable selection among independent variables. We extend some of their results to discrete Gaussian signal segmentation when the model family corresponds to a sufficiently rich family of partitions of the signal's support. This is the case of regression trees. We show that the same phenomenon occurs in the context of density estimation. The richness of the model family can be related to a certain form of isotropy. In this respect the minimum penalty phenomenon is intrinsic. To corroborate this point of view, we show that the minimum penalty phenomenon occurs when the models are chosen randomly under an isotropic law.
5

Estimation robuste de courbes de consommmation électrique moyennes par sondage pour de petits domaines en présence de valeurs manquantes / Robust estimation of mean electricity consumption curves by sampling for small areas in presence of missing values

De Moliner, Anne 05 December 2017 (has links)
Dans cette thèse, nous nous intéressons à l'estimation robuste de courbes moyennes ou totales de consommation électrique par sondage en population finie, pour l'ensemble de la population ainsi que pour des petites sous-populations, en présence ou non de courbes partiellement inobservées.En effet, de nombreuses études réalisées dans le groupe EDF, que ce soit dans une optique commerciale ou de gestion du réseau de distribution par Enedis, se basent sur l'analyse de courbes de consommation électrique moyennes ou totales, pour différents groupes de clients partageant des caractéristiques communes. L'ensemble des consommations électriques de chacun des 35 millions de clients résidentiels et professionnels Français ne pouvant être mesurées pour des raisons de coût et de protection de la vie privée, ces courbes de consommation moyennes sont estimées par sondage à partir de panels. Nous prolongeons les travaux de Lardin (2012) sur l'estimation de courbes moyennes par sondage en nous intéressant à des aspects spécifiques de cette problématique, à savoir l'estimation robuste aux unités influentes, l'estimation sur des petits domaines, et l'estimation en présence de courbes partiellement ou totalement inobservées.Pour proposer des estimateurs robustes de courbes moyennes, nous adaptons au cadre fonctionnel l'approche unifiée d'estimation robuste en sondages basée sur le biais conditionnel proposée par Beaumont (2013). Pour cela, nous proposons et comparons sur des jeux de données réelles trois approches : l'application des méthodes usuelles sur les courbes discrétisées, la projection sur des bases de dimension finie (Ondelettes ou Composantes Principales de l'Analyse en Composantes Principales Sphériques Fonctionnelle en particulier) et la troncature fonctionnelle des biais conditionnels basée sur la notion de profondeur d'une courbe dans un jeu de données fonctionnelles. Des estimateurs d'erreur quadratique moyenne instantanée, explicites et par bootstrap, sont également proposés.Nous traitons ensuite la problématique de l'estimation sur de petites sous-populations. Dans ce cadre, nous proposons trois méthodes : les modèles linéaires mixtes au niveau unité appliqués sur les scores de l'Analyse en Composantes Principales ou les coefficients d'ondelettes, la régression fonctionnelle et enfin l'agrégation de prédictions de courbes individuelles réalisées à l'aide d'arbres de régression ou de forêts aléatoires pour une variable cible fonctionnelle. Des versions robustes de ces différents estimateurs sont ensuite proposées en déclinant la démarche d'estimation robuste basée sur les biais conditionnels proposée précédemment.Enfin, nous proposons quatre estimateurs de courbes moyennes en présence de courbes partiellement ou totalement inobservées. Le premier est un estimateur par repondération par lissage temporel non paramétrique adapté au contexte des sondages et de la non réponse et les suivants reposent sur des méthodes d'imputation. Les portions manquantes des courbes sont alors déterminées soit en utilisant l'estimateur par lissage précédemment cité, soit par imputation par les plus proches voisins adaptée au cadre fonctionnel ou enfin par une variante de l'interpolation linéaire permettant de prendre en compte le comportement moyen de l'ensemble des unités de l'échantillon. Des approximations de variance sont proposées dans chaque cas et l'ensemble des méthodes sont comparées sur des jeux de données réelles, pour des scénarios variés de valeurs manquantes. / In this thesis, we address the problem of robust estimation of mean or total electricity consumption curves by sampling in a finite population for the entire population and for small areas. We are also interested in estimating mean curves by sampling in presence of partially missing trajectories.Indeed, many studies carried out in the French electricity company EDF, for marketing or power grid management purposes, are based on the analysis of mean or total electricity consumption curves at a fine time scale, for different groups of clients sharing some common characteristics.Because of privacy issues and financial costs, it is not possible to measure the electricity consumption curve of each customer so these mean curves are estimated using samples. In this thesis, we extend the work of Lardin (2012) on mean curve estimation by sampling by focusing on specific aspects of this problem such as robustness to influential units, small area estimation and estimation in presence of partially or totally unobserved curves.In order to build robust estimators of mean curves we adapt the unified approach to robust estimation in finite population proposed by Beaumont et al (2013) to the context of functional data. To that purpose we propose three approaches : application of the usual method for real variables on discretised curves, projection on Functional Spherical Principal Components or on a Wavelets basis and thirdly functional truncation of conditional biases based on the notion of depth.These methods are tested and compared to each other on real datasets and Mean Squared Error estimators are also proposed.Secondly we address the problem of small area estimation for functional means or totals. We introduce three methods: unit level linear mixed model applied on the scores of functional principal components analysis or on wavelets coefficients, functional regression and aggregation of individual curves predictions by functional regression trees or functional random forests. Robust versions of these estimators are then proposed by following the approach to robust estimation based on conditional biais presented before.Finally, we suggest four estimators of mean curves by sampling in presence of partially or totally unobserved trajectories. The first estimator is a reweighting estimator where the weights are determined using a temporal non parametric kernel smoothing adapted to the context of finite population and missing data and the other ones rely on imputation of missing data. Missing parts of the curves are determined either by using the smoothing estimator presented before, or by nearest neighbours imputation adapted to functional data or by a variant of linear interpolation which takes into account the mean trajectory of the entire sample. Variance approximations are proposed for each method and all the estimators are compared to each other on real datasets for various missing data scenarios.
6

Méthodes de modélisation statistique de la durée de vie des composants en génie électrique / Statistical methods for the lifespan modeling of electrical engineering components

Salameh, Farah 07 November 2016 (has links)
La fiabilité constitue aujourd’hui un enjeu important dans le contexte du passage aux systèmes plus électriques dans des secteurs critiques tels que l’aéronautique, l’espace ou le nucléaire. Il s’agit de comprendre, de modéliser et de prédire les mécanismes de vieillissement susceptibles de conduire les composants à la défaillance et le système à la panne. L’étude des effets des contraintes opérationnelles sur la dégradation des composants est indispensable pour la prédiction de leur durée de vie. De nombreux modèles de durée de vie ont été développés dans la littérature dans le contexte du génie électrique. Cependant, ces modèles présentent des limitations car ils dépendent du matériau étudié et de ses propriétés physiques et se restreignent souvent à un ou deux facteurs de stress, sans intégrer les interactions pouvant exister entre ces facteurs. Cette thèse présente une nouvelle méthodologie pour la modélisation de la durée de vie des composants du génie électrique. Cette méthodologie est générale ; elle s’applique à différents composants sans a priori sur leurs propriétés physiques. Les modèles développés sont des modèles statistiques estimés sur la base de données expérimentales issues de tests de vieillissement accéléré où plusieurs types de stress sont considérés. Les modèles visent alors à étudier les effets des différents facteurs de stress ainsi que de leurs différentes interactions. Le nombre et la configuration des tests de vieillissement nécessaires à construire les modèles (bases d’apprentissage) sont optimisés de façon à minimiser le coût expérimental tout en maximisant la précision des modèles. Des points expérimentaux supplémentaires aléatoirement configurés sont réalisés pour valider les modèles (bases de test). Deux catégories de composants sont testées : deux types d’isolants couramment utilisés dans les machines électriques et des sources de lumière OLED. Différentes formes des modèles de durée de vie sont présentées : les modèles paramétriques, non paramétriques et les modèles hybrides. Tous les modèles développés sont évalués à l’aide de différents outils statistiques permettant, d’une part, d’étudier la pertinence des modèles et d’autre part, d’évaluer leur prédictibilité sur les points des bases de test. Les modèles paramétriques permettent de quantifier les effets des facteurs et de leurs interactions sur la durée de vie à partir d’une expression analytique prédéfinie. Un test statistique permet ensuite d’évaluer la significativité de chacun des paramètres inclus dans le modèle. Ces modèles sont caractérisés par une bonne qualité de prédiction sur leurs bases de test. La relation entre la durée de vie et les contraintes est également modélisée par les arbres de régression comme méthode alternative aux modèles paramétriques. Les arbres de régression sont des modèles non paramétriques qui permettent de classifier graphiquement les points expérimentaux en différentes zones dans lesquelles les contraintes sont hiérarchisées selon leurs effets sur la durée de vie. Ainsi, une relation simple, graphique, et directe entre la durée de vie et les contraintes est obtenue. Cependant, à la différence des modèles paramétriques continus sur le domaine expérimental étudié, les arbres de régression sont constants par morceaux, ce qui dégrade leur qualité de prédiction sur la base de test. Pour remédier à cet inconvénient, une troisième approche consiste à attribuer un modèle linéaire à chacune des zones identifiées avec les arbres de régression. Le modèle résultant, dit modèle hybride, est donc linéaire par morceaux et permet alors de raffiner les modèles paramétriques en évaluant les effets des facteurs dans chacune des zones tout en améliorant la qualité de prédiction des arbres de régression. / Reliability has become an important issue nowadays since the most critical industries such as aeronautics, space and nuclear are moving towards the design of more electrical based systems. The objective is to understand, model and predict the aging mechanisms that could lead to component and system failure. The study of the operational constraints effects on the degradation of the components is essential for the prediction of their lifetime. Numerous lifespan models have been developed in the literature in the field of electrical engineering. However, these models have some limitations: they depend on the studied material and its physical properties, they are often restricted to one or two stress factors and they do not integrate interactions that may exist between these factors. This thesis presents a new methodology for the lifespan modeling of electrical engineering components. This methodology is general; it is applicable to various components without prior information on their physical properties. The developed models are statistical models estimated on experimental data obtained from accelerated aging tests where several types of stress factors are considered. The models aim to study the effects of the different stress factors and their different interactions. The number and the configuration of the aging tests needed to construct the models (learning sets) are optimized in order to minimize the experimental cost while maximizing the accuracy of the models. Additional randomly configured experiments are carried out to validate the models (test sets). Two categories of components are tested: two types of insulation materials that are commonly used in electrical machines and OLED light sources. Different forms of lifespan models are presented: parametric, non-parametric and hybrid models. Models are evaluated using different statistical tools in order to study their relevance and to assess their predictability on the test set points. Parametric models allow to quantify the effects of stress factors and their interactions on the lifespan through a predefined analytical expression. Then a statistical test allows to assess the significance of each parameter in the model. These models show a good prediction quality on their test sets. The relationship between the lifespan and the constraints is also modeled by regression trees as an alternative method to parametric models. Regression trees are non-parametric models that graphically classify experimental points into different zones where the constraints are hierarchized according to their effects on the lifespan. Thus, a simple, graphic and direct relationship between the lifespan and the stress factors is obtained. However, unlike parametric models that are continuous in the studied experimental domain, regression trees are piecewise constant, which degrades their predictive quality with respect to parametric models. To overcome this disadvantage, a third approach consists in assigning a linear model to each of the zones identified with regression trees. The resulting model, called hybrid model, is piecewise linear. It allows to refine parametric models by evaluating the effects of the factors in each of the zones while improving the prediction quality of regression trees.

Page generated in 0.5046 seconds