Spelling suggestions: "subject:"redundantes"" "subject:"redondance""
1 |
Model-based covariable decorrelation in linear regression (CorReg) : application to missing data and to steel industry / Décorrélation de covariables à base de modèles en régression linéaire (CorReg) : application aux données manquantes et à l’industrie sidérurgiqueThéry, Clément 08 July 2015 (has links)
Les travaux effectués durant cette thèse ont pour but de pallier le problème des corrélations au sein des bases de données, particulièrement fréquentes dans le cadre industriel. Une modélisation explicite des corrélations par un système de sous-régressions entre covariables permet de pointer les sources des corrélations et d'isoler certaines variables redondantes. Il en découle une pré-sélection de variables sans perte significative d'information et avec un fort potentiel explicatif (la structure de sous-régression est explicite et simple). Un algorithme MCMC (Monte-Carlo Markov Chain) de recherche de structure de sous-régressions est proposé, basé sur un modèle génératif complet sur les données. Ce prétraitement ne dépend pas de la variable réponse et peut donc être utilisé de manière générale pour toute problématique de corrélations. Par la suite, un estimateur plug-in pour la régression linéaire est proposé pour ré-injecter l'information résiduelle de manière séquentielle sans souffrir des corrélations entre covariables. Enfin, le modèle génératif complet peut être utilisé pour gérer des valeurs manquantes dans les données. Cela permet l'imputation multiple des données manquantes, préalable à l'utilisation de méthodes classiques incompatibles avec la présence de valeurs manquantes. Le package R intitulé CorReg implémente les méthodes développées durant cette thèse. / This thesis was motivated by correlation issues in real datasets, in particular industrial datasets. The main idea stands in explicit modeling of the correlations between covariates by a structure of sub-regressions, that simply is a system of linear regressions between the covariates. It points out redundant covariates that can be deleted in a pre-selection step to improve matrix conditioning without significant loss of information and with strong explicative potential because this pre-selection is explained by the structure of sub-regressions, itself easy to interpret. An algorithm to find the sub-regressions structure inherent to the dataset is provided, based on a full generative model and using Monte-Carlo Markov Chain (MCMC) method. This pre-treatment does not depend on a response variable and thus can be used in a more general way with any correlated datasets. In a second part, a plug-in estimator is defined to get back the redundant covariates sequentially. Then all the covariates are used but the sequential approach acts as a protection against correlations. Finally, the generative model defined here allows, as a perspective, to manage missing values both during the MCMC and then for imputation. Then we are able to use classical methods that are not compatible with missing datasets. Once again, linear regression is used to illustrate the benefits of this method but it remains a pre-treatment that can be used in other contexts, like clustering and so on. The R package CorReg implements the methods created during this thesis.
|
2 |
Une approche pour optimiser les traitements des requêtes dans un environnement de bases de données répartiesPaik, In-Sup 12 February 1981 (has links) (PDF)
Cette thèse a pour objectif de proposer une démarche pour effectuer l'optimisation des requêtes dans un systeme de bases de données reparties. On énumère l'ensemble de tous les critères d'optimisation qui peuvent être pris en compte et on décide les objectifs d'optimisation. On propose une démarche progressive divisée en plusieurs étapes qui visent aux objectifs d'optimisation : la localisation, les permutations des opérations, l'allocation des données reparties par le regroupement et la distribution des opérations aux processus repartis par le partitionnement.
|
3 |
Detection and treatment of inconsistent or locally over-constrained configurations during the manipulation of 3D geometric models made of free-form surfaces / Détection et traitement de la configuration de sur-contraintes discontinues ou locale lors de la manipulation de modèle 3D géométrique réalisé par de surface à gaucheHu, Hao 23 January 2018 (has links)
Trois modules seront développés: Le module de détection a produit une analyse des problématiques figurations con, à savoir un ensemble de domaines où soit quelques nouveaux DDL ou des changements locaux dans les contraintes sont obligatoires. Le module de traitement permettra à la défi nition des mécanismes pour aider la décision sur modi cations. Le module de prédiction dire le degré de déformation en pré-analyser les caractéristiques des configurations de NURBS. / Three modules will be developed: The detection module has produced an analysis of problematic con figurations, i.e. a set of areas where either some new DOFs or some local changes in the constraints are mandatory. The treatment module will enable the defi nition of mechanisms to help the decision on modi cations. The prediction module will tell the degree of deformation by pre-analyzing the features of NURBS configurations.
|
Page generated in 0.0416 seconds