Global ETD Search

41	Analyse d'un grand jeu de données en épidémiologie : problématiques et perspectives méthodologiques / Analysis of a large dataset in epidemiology : issues and methodological perspectives Mansiaux, Yohann 30 October 2014 (has links) L'augmentation de la taille des jeux de données est une problématique croissante en épidémiologie. La cohorte CoPanFlu-France (1450 sujets), proposant une étude du risque d'infection par la grippe H1N1pdm comme une combinaison de facteurs très divers en est un exemple. Les méthodes statistiques usuelles (e.g. les régressions) pour explorer des associations sont limitées dans ce contexte. Nous comparons l'apport de méthodes exploratoires data-driven à celui de méthodes hypothesis-driven.Une première approche data-driven a été utilisée, évaluant la capacité à détecter des facteurs de l'infection de deux méthodes de data mining, les forêts aléatoires et les arbres de régression boostés, de la méthodologie " régressions univariées/régression multivariée" et de la régression logistique LASSO, effectuant une sélection des variables importantes. Une approche par simulation a permis d'évaluer les taux de vrais et de faux positifs de ces méthodes. Nous avons ensuite réalisé une étude causale hypothesis-driven du risque d'infection, avec un modèle d'équations structurelles (SEM) à variables latentes, pour étudier des facteurs très divers, leur impact relatif sur l'infection ainsi que leurs relations éventuelles. Cette thèse montre la nécessité de considérer de nouvelles approches statistiques pour l'analyse des grands jeux de données en épidémiologie. Le data mining et le LASSO sont des alternatives crédibles aux outils conventionnels pour la recherche d'associations. Les SEM permettent l'intégration de variables décrivant différentes dimensions et la modélisation explicite de leurs relations, et sont dès lors d'un intérêt majeur dans une étude multidisciplinaire comme CoPanFlu. / The increasing size of datasets is a growing issue in epidemiology. The CoPanFlu-France cohort(1450 subjects), intended to study H1N1 pandemic influenza infection risk as a combination of biolo-gical, environmental, socio-demographic and behavioral factors, and in which hundreds of covariatesare collected for each patient, is a good example. The statistical methods usually employed to exploreassociations have many limits in this context. We compare the contribution of data-driven exploratorymethods, assuming the absence of a priori hypotheses, to hypothesis-driven methods, requiring thedevelopment of preliminary hypotheses.Firstly a data-driven study is presented, assessing the ability to detect influenza infection determi-nants of two data mining methods, the random forests (RF) and the boosted regression trees (BRT), ofthe conventional logistic regression framework (Univariate Followed by Multivariate Logistic Regres-sion - UFMLR) and of the Least Absolute Shrinkage and Selection Operator (LASSO), with penaltyin multivariate logistic regression to achieve a sparse selection of covariates. A simulation approachwas used to estimate the True (TPR) and False (FPR) Positive Rates associated with these methods.Between three and twenty-four determinants of infection were identified, the pre-epidemic antibodytiter being the unique covariate selected with all methods. The mean TPR were the highest for RF(85%) and BRT (80%), followed by the LASSO (up to 78%), while the UFMLR methodology wasinefficient (below 50%). A slight increase of alpha risk (mean FPR up to 9%) was observed for logisticregression-based models, LASSO included, while the mean FPR was 4% for the data-mining methods.Secondly, we propose a hypothesis-driven causal analysis of the infection risk, with a structural-equation model (SEM). We exploited the SEM specificity of modeling latent variables to study verydiverse factors, their relative impact on the infection, as well as their eventual relationships. Only thelatent variables describing host susceptibility (modeled by the pre-epidemic antibody titer) and com-pliance with preventive behaviors were directly associated with infection. The behavioral factors des-cribing risk perception and preventive measures perception positively influenced compliance with pre-ventive behaviors. The intensity (number and duration) of social contacts was not associated with theinfection.This thesis shows the necessity of considering novel statistical approaches for the analysis of largedatasets in epidemiology. Data mining and LASSO are credible alternatives to the tools generally usedto explore associations with a high number of variables. SEM allows the integration of variables des-cribing diverse dimensions and the explicit modeling of their relationships ; these models are thereforeof major interest in a multidisciplinary study as CoPanFlu. Grippe H1N1 pandémique Régression logistique Régression pénalisée Équations structurelles Data mining Épidémiologie H1N1 pandemic influenza Big data 614.4
42	Family, Work and Welfare States in Europe: Women's Juggling with Multiple Roles/Famille, Emploi et Etat-providence: la jonglerie des femmes avec leurs multiples rôles O'Dorchai, Síle S. 24 January 2007 (has links) The general focus of this thesis is on how the family, work and the welfare system are intertwined. A major determinant is the way responsibilities are shared by the state, the market and civil society in different welfare state regimes. An introductory chapter will therefore be dedicated to the development of the social dimension in the process of European integration. A first chapter will then go deeper into the comparative analysis of welfare state regimes, to comment on the provision of welfare in societies with a different mix of state, market and societal welfare roles and to assess the adequacy of existing typologies as reflections of today’s changed socio-economic, political and gender reality. Although they stand strong on their own, these first two chapters also contribute to contextualising the research subject of the remainder of the thesis: the study and comparison of the differential situation of women and men and of mothers and non-mothers on the labour markets of the EU-15 countries as well as of the role of public policies with respect to the employment penalties faced by women, particularly in the presence of young children. In our analysis, employment penalties are understood in three ways: (i) the difference in full-time equivalent employment rates between mothers and non-mothers, (ii) the wage penalty associated with motherhood, and (iii) the wage gap between part-time and full-time workers, considering men and women separately. Besides from a gender point of view, employment outcomes and public policies are thus assessed comparatively for mothers and non-mothers. Because women choose to take part in paid employment, fertility rates will depend on their possibilities to combine employment and motherhood. As a result, motherhood-induced employment penalties and the role of public policies to tackle them should be given priority attention, not just by scholars, but also by politicians and policy-makers. multinomial logit/régression logistique employment/emploi gender/genre public policies/politiques publiques OLS/MCO
43	Inférence exacte et non paramétrique dans les modèles de régression et les modèles structurels en présence d'hétéroscédasticité de forme arbitraire Coudin, Élise January 2007 (has links) Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal. Inférence exacte Régression sur la médiane Régression quantile Test de signe Hétéroscédasticité Non normalité Dépendance Test de Monte Carlo Techniques de projection Distribution de confiance Endogénéité Modèle structurel Modèle non-linéaire Instrument Instrument faible Convergence
44	Estimation de mesures de risque pour des distributions elliptiques conditionnées / Estimation of risk measures for conditioned elliptical distributions Usseglio-Carleve, Antoine 26 June 2018 (has links) Cette thèse s'intéresse à l'estimation de certaines mesures de risque d'une variable aléatoire réelle Y en présence d'une covariable X. Pour cela, on va considérer que le vecteur (X,Y) suit une loi elliptique. Dans un premier temps, on va s'intéresser aux quantiles de Y sachant X=x. On va alors tester d'abord un modèle de régression quantile assez répandu dans la littérature, pour lequel on obtient des résultats théoriques que l'on discutera. Face aux limites d'un tel modèle, en particulier pour des niveaux de quantile dits extrêmes, on proposera une nouvelle approche plus adaptée. Des résultats asymptotiques sont donnés, appuyés par une étude numérique puis par un exemple sur des données réelles. Dans un second chapitre, on s'intéressera à une autre mesure de risque appelée expectile. La structure du chapitre est sensiblement la même que celle du précédent, à savoir le test d'un modèle de régression inadapté aux expectiles extrêmes, pour lesquels on propose une approche méthodologique puis statistique. De plus, en mettant en évidence le lien entre les quantiles et expectiles extrêmes, on s'aperçoit que d'autres mesures de risque extrêmes sont étroitement liées aux quantiles extrêmes. On se concentrera sur deux familles appelées Lp-quantiles et mesures d'Haezendonck-Goovaerts, pour lesquelles on propose des estimateurs extrêmes. Une étude numérique est également fournie. Enfin, le dernier chapitre propose quelques pistes pour traiter le cas où la taille de la covariable X est grande. En constatant que nos estimateurs définis précédemment étaient moins performants dans ce cas, on s'inspire alors de quelques méthodes d'estimation en grande dimension pour proposer d'autres estimateurs. Une étude numérique permet d'avoir un aperçu de leurs performances / This PhD thesis focuses on the estimation of some risk measures for a real random variable Y with a covariate vector X. For that purpose, we will consider that the random vector (X,Y) is elliptically distributed. In a first time, we will deal with the quantiles of Y given X=x. We thus firstly investigate a quantile regression model, widespread in the litterature, for which we get theoretical results that we discuss. Indeed, such a model has some limitations, especially when the quantile level is said extreme. Therefore, we propose another more adapted approach. Asymptotic results are given, illustrated by a simulation study and a real data example.In a second chapter, we focus on another risk measure called expectile. The structure of the chapter is essentially the same as that of the previous one. Indeed, we first use a regression model that is not adapted to extreme expectiles, for which a methodological and statistical approach is proposed. Furthermore, highlighting the link between extreme quantiles and expectiles, we realize that other extreme risk measures are closely related to extreme quantiles. We will focus on two families called Lp-quantiles and Haezendonck-Goovaerts risk measures, for which we propose extreme estimators. A simulation study is also provided. Finally, the last chapter is devoted to the case where the size of the covariate vector X is tall. By noticing that our previous estimators perform poorly in this case, we rely on some high dimensional estimation methods to propose other estimators. A simulation study gives a visual overview of their performances Distributions elliptiques Quantiles extrêmes Expectiles Régression quantile Régression expectile Théorie des valeurs extrêmes Elliptical distributions Extreme quantiles Expectiles Quantile regression Expectile regression Extreme value theory 510
45	Contribution à l'étude des algorithmes d'optimisation en analyse des données Boughazi, Mohamed Ali 30 April 1987 (has links) (PDF) Ce travail est compose de deux parties. La première concerne l'étude des méthodes d'optimisation convexe à la résolution numérique des problèmes d'optimisation en analyse des données (problème de régression isotone et celui de régression concave). Selon différentes approches et via la théorie de la dualité, nous avons proposé trois méthodes pour résoudre ces problèmes. 1) méthode de l'inverse partiel. 2) méthode du gradient conjugue. 3) méthode de pivotage complémentaire de Lemke. Des résultats numériques sont présentés. Dans la seconde partie, nous proposons une étude synthétique de toutes les méthode de projection dont on dispose actuellement. Nous avons établi les relations qui les lient aux méthodes du type sous-gradients régression isotone régression concave opérateur monotone maximal méthode du point proximal inverse partiel programmation linéaire complémentaire gradient conjugué programmation quadratique méthode de projection
46	CONTRIBUTION A L'ANALYSE DES DETERMINANTS DE L'OFFRE D'INFORMATION SUR LE CAPITAL INTELLECTUEL Escaffre, Lionel 28 November 2002 (has links) (PDF) Les groupes cotés français développent depuis quelques années des stratégies de communication financière destinées à présenter les éléments constitutifs de leur capital intellectuel. La problématique de cette thèse consiste à s'interroger sur les facteurs qui influencent les entreprises à diffuser ce type d'informations qui dépassent ou complètent les dispositions comptables portant sur le traitement des éléments immatériels. La première partie rappelle l'émergence du capital intellectuel tant au sein de la gestion des groupes que dans les évolutions macro-économiques. Cette partie propose une définition conceptuelle du capital intellectuel validée au moyen d'études de cas. La seconde partie est consacrée à une analyse typologique puis factorielle de l'information tant comptable qu'extra-comptable, relatif au capital intellectuel, et diffusée par un échantillon de groupes cotés au SBF 120. Ce cadre d'analyse est ensuite testé à partir d'hypothèses théoriques issues de la théorie politico-contractuelle. Les résultats montrent une certaine limite de cette théorie pour approcher les déterminants de cette information. Le secteur d'activité, la part d'incorporel dans le bilan des groupes et le type de cabinet d'audit semblent influencer de manière significative l'offre d'information sur le capital intellectuel. capital intellectuel incorporels information financière théorie politico-contractuelle analyse typologique régression linéaire
47	Description et prédiction à partir de données structurées en plusieurs tableaux : Application en épidémiologie animale. Bougeard, Stéphanie 11 December 2007 (has links) (PDF) Ce travail de recherche s'inscrit dans le cadre des méthodes factorielles qui permettent de décrire et prédire des données structurées en plusieurs tableaux. Les objectifs et la nature des données d'épidémiologie analytique dans le domaine vétérinaire ont amené à centrer le travail sur les méthodes de régression multibloc, qui orientent la description de plusieurs tableaux de variables vers l'explication d'un autre tableau. Un des principaux objectifs est de contribuer à la réflexion sur la sensibilité de ces méthodes à la multicolinéarité. Des méthodes statistiques existantes sont présentées et reliées dans un cadre unifié, relevant soit de critères à maximiser comparables, soit d'un continuum général les reliant. De nouvelles méthodes peu vulnérables à l'égard de la multicolinéarité, et s'appliquant au cas de données structurées en deux puis en (K+1) tableaux, sont proposées. L'intérêt de ces méthodes, ainsi que des continuums qui leur sont associés, est illustré sur la base d'études de cas réels en épidémiologie. Ce travail de recherche a permis d'appliquer les méthodes multiblocs au domaine de l'épidémiologie animale, dans lequel elles n'avaient pas encore été utilisées. Analyse factorielle régression multibloc multicolinéarité régression Partial Least Square Latent Root<br />Regression approche continuum
48	Vulnérabilité des ouvrages en maçonnerie à des mouvements de terrain : méthodologie d'analyse par méthodes statistiques et par plans d'expériences numériques sur les données de la ville de Joeuf / Vulnerability of masonry structures to ground movement : methodology of analysis by statistical methods and numerical experimental designs applied on Joeuf city data Abdallah, Mouhammed 06 May 2009 (has links) Le contexte de l’étude est celui des mouvements de terrain susceptibles de se produire à la suite d’un affaissement minier caractéristique de Lorraine et de leurs conséquences sur les habitations en maçonnerie traditionnelle. Quand de tels affaissements se produisent, ces habitations subissent en effet des désordres qui résultent des efforts engendrés dans la structure par les mouvements du terrain. La réponse qui caractérise alors l’état global de la structure dépend des caractéristiques géométriques, physiques et mécaniques. Or, la nature discontinue des maçonneries et la complexité des interactions entre blocs dans ces maçonneries rend complexe et difficile la détermination de cette réponse. Il en est de même de l’interaction sol-structure. L’objectif de la recherche consiste donc à étudier, par modélisation numérique avec la méthode des éléments distincts et par la technique des plans d’expérience et des surfaces de réponse, le comportement d’ouvrages en maçonnerie soumis à un affaissement minier caractéristique et à dégager de cette étude des critères permettant d’estimer, à l’échelle d’une ville entière, la vulnérabilité de tous ses bâtiments en maçonnerie. Une première analyse simplifiée expose le principe de la démarche mise en œuvre à l’échelle de la ville de Joeuf, utilisée comme site pilote. Elle repose sur l’analyse de la longueur cumulée des joints ouverts, assimilés à la formation de fissures dans la structure. Ensuite, une analyse typologique permet de distinguer 4 groupes de maisons aux caractéristiques proches. Sur chacun de ces groupes, la démarche est ensuite appliquée de manière systématique. Elle prend en considération des caractéristiques géométriques des façades et aboutit à la formulation de fonctions de vulnérabilité qui font appel à la technique de régression orthogonale / The context of our study concerns ground movements that may occur in Lorraine as a result of mining subsidence events and their impact on traditional masonry houses. When such an event occurs, houses suffer disorders resulting from efforts in the structure caused by the movement of the ground. The response that characterizes the state of the structure depends on the geometrical, physical and mechanical characteristics. However, the discontinuous nature of the masonry and the interactions complexity between masonry blocks makes it difficult to determine that response. The same is true about the soil-structure interaction. The purpose of this research is to study, by numerical modelling with the distinct element method, experimental design planning and response surfaces, the behaviour of masonry structures subjected to a typical mining subsidence event and to define from this study some criteria making possible the estimation of the vulnerability of all the buildings of a city. A first simplified analysis describes the principle of the used methodology which is then applied to the study of all houses of the city of Joeuf, used as a pilot site. This methodology is based on an analysis of the total length of the opened joints, which are considered as similar to cracks in the structure. Then, a typology analysis helps first to distinguish 4 groups (types) of houses which have similar characteristics. On each of these groups, the methodology is applied consistently, based on the geometrical characteristics of the houses facades and then leads to the formulation of vulnerability functions that use the technique of orthogonal regression Risque Régression orthogonale CAH ACP Régression multiple Plans d’expérience Maçonnerie Vulnérabilité Aléa Risk PCA HCA Orthogonal regression Hazard Vulnerability Masonry Experimental design Multiple regression
49	Conception d'une mesure automatisée de détection des changements alimentaires chez le porc Germain, Simon January 2015 (has links) Le mandat consiste à développer un outil afin de détecter les désordres alimentaires chez le porc, dans le but de prévenir des problèmes de croissance ou de maladie potentiels. L'outil proposé analyse les données récoltées sur 5 jours consécutifs (période mémoire) pour prédire la consommation de la journée suivante. Il utilise une régression polynomiale généralisée avec contraintes et lissage. L'outil calcule ensuite la différence entre la prédiction et les observations. Prédiction Séries temporelles Croissance Biologique Analyse fonctionnelle Régression polynomiale Optimisation avec contraintes
50	Utilisation de modèles à direction révélatrice unique pour les modèles de durée Bouaziz, Olivier 24 December 2010 (has links) (PDF) Dans cette thèse, nous introduisons des méthodes de réduction de la dimension en présence de censures. Plus précisément, nous utilisons des modèles à direction révélatrice unique nous permettant de palier au fléau de la dimension. En particulier, ces modèles ont l'avantage de généraliser les modèles classiques qui reposent sur des hypothèses parfois difficiles à vérifier en pratique. C'est pourquoi dans une première partie, nous présentons un modèle à direction révélatrice unique portant sur la densité conditionnelle, tandis que dans une deuxième partie nous étudions un modèle de régression portant sur le processus de comptage des évènements récurrents. Nous utilisons alors à chaque fois un modèle à direction révélatrice unique, plus général que le modèle de Cox. Par ailleurs, dans ces deux contextes, nos procédures d'estimation prennent en compte les problèmes d'estimation dans les queues de distribution dûs à l'estimateur de Kaplan-Meier. Nos méthodes d'estimation nous permettent également de choisir les paramètres introduits dans notre modèle à partir des données. [MATH] Mathematics Censure évènements récurrents modèles de régression processus empirique

Search results