Global ETD Search

1	Estimation et sélection en classification semi-supervisée / Estimation and selection in semi-supervised classification Vandewalle, Vincent 09 December 2009 (has links) Le sujet de cette thèse est la classification semi-supervisée qui est considérée d'un point de vue décisionnel. Nous nous intéressons à la question de choix de modèles dans ce contexte où les modèles sont estimés en utilisant conjointement des données étiquetées et des données non étiquetées plus nombreuses. Nous concentrons notre recherche sur les modèles génératifs où la classification semi-supervisée s'envisage sans difficulté, contrairement au cadre prédictif qui nécessite des hypothèses supplémentaires peu naturelles. Après avoir dressé un état de l'art de la classification semi-supervisée, nous décrivons l'estimation des paramètres d'un modèle de classification à l'aide de données étiquetées et non étiquetées par l'algorithme EM. Nos contributions sur la sélection de modèles font l'objet des deux chapitres suivants. Au chapitre 3, nous présentons un test statistique où les données non étiquetées sont utilisées pour mettre à l'épreuve le modèle utilisé. Au chapitre 4 nous présentons un critère de sélection de modèles AICcond, dérivé du critère AIC d'un point de vue prédictif. Nous prouvons la convergence asymptotique de ce critère particulièrement bien adapté au contexte semi-supervisé et ses bonnes performances pratiques comparé à la validation croisée et à d'autres critères de vraisemblance pénalisée.Une deuxième partie de la thèse, sans rapport direct avec le contexte semi-supervisé, présente des modèles multinomiaux pour la classification sur variables qualitatives. Nous avons conçu ces modèles pour répondre à des limitations des modèles multinomiaux parcimonieux proposés dans le logiciel MIXMOD. À cette occasion, nous proposons un critère type BIC qui prend en compte de manière spécifique la complexité de ces modèles multinomiaux contraints. / The subject of this thesis is the semi-supervised classification which is considered in decision-making perpective. We are interested in model choice issue in when models are estimated using both labeled data and many unlabeled data. We focus our research on generative models for which the semi-supervised classification is considered without difficulty, unlike predictive framework that requires additional unnatural assumptions. Having developed a state of the art of semi-supervised classification, we describe the estimation of parameters of a classification model using labeled data and unlabeled data by the EM algorithm. Our contributions on models selection closely watched in the two following chapters. In Chapter 3, we present a statistical test where unlabeled data are used to test the model. In Chapter 4 we present a model selection criterion, AICcond, derived from the AIC criterion in a predictive point of view. We prove the asymptotic convergence of this test particularly well suited to semi-supervised setting and his good practical performance compared to the cross-validation and other penalized likelihood criteria.A second part of the thesis, not directly connected with the semi-supervised setting, the multinomial models for classification of qualitative variables are considered. We designed these models to address the limitations of parsimonious multinomial models proposed in the program MIXMOD. For this setting, we propose a BIC-type criterion which takes into account specifically the complexity of the constrained multinomial models. Classification semi-supervisée Variables qualitatives Modèles génératifs Modèles multinomiaux parcimonieux
2	Individual housing choices and aggregate housing prices : discrete choice models revisited with matching models / Des choix résidentiels individuels et des prix immobiliers agrégés : les modèles de choix discrets revisités sous l’angle des modèles d’appariements Bonnet, Odran 01 June 2018 (has links) Le premier chapitre, écrit conjointement avec Alfred Galichon, Keith O'Hara et Matthew Shum, montre l'équivalence entre les modèles de choix discrets et les modèles d'appariements. Cette équivalence permet l'estimation efficace, par des algorithmes d'appariement, de modèles qui étaient jusqu'à présent réputés comme difficile à estimer dans la littérature. Le deuxième chapitre, écrit conjointement avec Mathilde Poulhès, s'appuie sur les résultats du premier pour estimer le consentement marginal à payer des agents pour différentes caractéristiques du logement et du quartier à Paris. Il introduit une nouvelle procédure d'estimation basée sur le modèle de pures caractéristiques. Grâce à un riche jeu de données sur les achats de logements à Paris, nous montrons que le revenu moyen du voisinage et le niveau de criminalité sont de puissants déterminants du choix du quartier pour tous les types d'acheteurs, que l'accessibilité à l'emploi est également un facteur déterminant pour les ménages comptant plus d'une personne, et que la qualité de l'école du secteur joue un rôle primordial pour les ménages avec enfants. Le troisième chapitre, écrit conjointement avec Guillaume Chapelle, Alain Trannoy et Etienne Wasmer, montre que la croissance récente du ratio patrimoine sur revenu est due uniquement à l'augmentation du prix des logements, et plus précisément à l'augmentation du prix d'un facteur fixe de production: la terre. Nous montrons ensuite qu'un système de taxation du patrimoine doit taxer le facteur fixe qu'est la terre à des fins de redistribution et non le capital productif pour ne pas décourager l'investissement. / The first two of the three chapters of this thesis examine the identification and the estimation of discrete choice models. The first chapter proves the equivalence between matching models and discrete choice models, and draws the consequences in terms of identification and estimation. The second chapter builds on the results of the first, and uses matching algorithms to estimate the marginal willingness to pay of households for various housing and neighborhood characteristics in Paris (such as school performance, crime level, distance to employment areas). The third chapter deals with another topic: it first shows that the recent rise in the capital-income ratio highlighted by Thomas Piketty in his book is due to the rise in housing prices, and it then explores the consequences in terms of wealth distribution. Choix discrets Modèles multinomiaux Hédonique Logement Discrete choices Multinomial model Hedonic Housing 330

Search results

Estimation et sélection en classification semi-supervisée / Estimation and selection in semi-supervised classification

Individual housing choices and aggregate housing prices : discrete choice models revisited with matching models / Des choix résidentiels individuels et des prix immobiliers agrégés : les modèles de choix discrets revisités sous l’angle des modèles d’appariements