Spelling suggestions: "subject:"régression,"" "subject:"régressions,""
381 |
Influence des facteurs socio-économiques et géographiques sur l'incidence, l'accès aux soins et la survie des femmes atteintes d'un cancer du seinGentil, Julie 18 December 2012 (has links) (PDF)
Le cancer du sein est actuellement dans les pays occidentaux le premier cancer chez la femme, en termes d'incidence et de mortalité (taux standardisés de 101,5 et 17.7 pour 100 000 personnes années en 2005 respectivement). De très nombreux facteurs de risque et facteurs pronostiques sont déjà connus et étudiés, plusieurs axes de recherche sont développés sur toutes les étapes de la maladie, mais l'influence des facteurs socio-économiques et géographiques, aux niveaux individuel et environnemental n'avait pas encore été étudiée en France sur le cancer du sein.L'objectif général de ce travail était d'explorer cette influence par différents moyens afin d'en tirer des connaissances et une application pratique dans la prévention du cancer du sein, qu'elle soit primaire, secondaire ou tertiaire.Dans notre première étude nous avons montré que les femmes d'un niveau socio-éducatif faible étaient moins à même d'avoir bénéficié d'au moins une mammographie dans les 6 ans ou d'au moins un suivi gynécologique dans les 3 ans précédant leur diagnostic de cancer du sein. Egalement elles ont un stade de diagnostic plus avancé que les femmes de niveau socio-éducatif plus élevé. Ces variables sont ensuite retrouvées comme facteurs pronostiques péjoratifs de la survie. Dans notre seconde étude nous avons montré que l'accès à un chirurgien spécialisé dans les interventions du cancer du sein, gage d'une meilleure survie, était influencé par le niveau socio-économique du lieu de résidence de la patiente, ainsi que par son éloignement géographique par rapport aux centres de traitement de référence du cancer, où travaillent les chirurgiens spécialisés. Dans notre troisième étude nous avons montré qu'à l'inverse de nombre de cancers, l'incidence du cancer du sein était plus élevée dans les zones socio-économiquement plus favorisées, et ce quelle que soit la classe d'âge de la patiente, phénomène pour lequel nous n'avons pas vraiment d'explication, surtout pour les femmes les plus jeunes. Enfin dans notre quatrième étude actuellement en cours, nous avons pour objectif d'étudier au niveau individuel, conjointement avec le nouvel indice de défavorisation européen adapté à la France, en quoi le degré de richesse économique et sociale et la proximité des services médicaux des patientes atteintes de cancer du sein joue sur le stade de la tumeur, l'accès et les modalités de traitement, et la survie.
|
382 |
Pénalisation et réduction de la dimension des variables auxiliaires en théorie des sondagesShehzad, Muhammad Ahmed 12 October 2012 (has links) (PDF)
Les enquêtes par sondage sont utiles pour estimer des caractéristiques d'une populationtelles que le total ou la moyenne. Cette thèse s'intéresse à l'étude detechniques permettant de prendre en compte un grand nombre de variables auxiliairespour l'estimation d'un total.Le premier chapitre rappelle quelques définitions et propriétés utiles pour lasuite du manuscrit : l'estimateur de Horvitz-Thompson, qui est présenté commeun estimateur n'utilisant pas l'information auxiliaire ainsi que les techniques decalage qui permettent de modifier les poids de sondage de facon à prendre encompte l'information auxiliaire en restituant exactement dans l'échantillon leurstotaux sur la population.Le deuxième chapitre, qui est une partie d'un article de synthèse accepté pourpublication, présente les méthodes de régression ridge comme un remède possibleau problème de colinéarité des variables auxiliaires, et donc de mauvais conditionnement.Nous étudions les points de vue "model-based" et "model-assisted" dela ridge regression. Cette technique qui fournit de meilleurs résultats en termed'erreur quadratique en comparaison avec les moindres carrés ordinaires peutégalement s'interpréter comme un calage pénalisé. Des simulations permettentd'illustrer l'intérêt de cette technique par compar[a]ison avec l'estimateur de Horvitz-Thompson.Le chapitre trois présente une autre manière de traiter les problèmes de colinéaritévia une réduction de la dimension basée sur les composantes principales. Nousétudions la régression sur composantes principales dans le contexte des sondages.Nous explorons également le calage sur les moments d'ordre deux des composantesprincipales ainsi que le calage partiel et le calage sur les composantes principalesestimées. Une illustration sur des données de l'entreprise Médiamétrie permet deconfirmer l'intérêt des ces techniques basées sur la réduction de la dimension pourl'estimation d'un total en présence d'un grand nombre de variables auxiliaires
|
383 |
Les effets de pairs à la lumière des interactions entre élèves et des dimensions subjectives du vécu scolaireRoco Fossa, Rodrigo 27 June 2011 (has links) (PDF)
Le présent travail de thèse aborde la problématique des effets de pairs en contexte scolaire. A partir de l'analyse détaillée d'une large base des données issue d'une enquête nationale au Chili (SIMCE 2004), on s'interroge sur les mécanismes qui véhiculent les influences entre élèves différemment dotés d'un point de vue de leurs capitaux culturels, humains et scolaires. Ces influences sembleraient présentes sur différents résultats à l'école, y compris ceux de type académique. Considérant la littérature produite sous différentes approches disciplinaires --sociologie, économie, psychologie sociale et sciences de l'éducation -- on s'attarde sur les manières d'identifier et de mesurer lesdits effets de pairs. En même temps, on considère la présence de dimensions subjectives capables d'exprimer, en partie, le vécu scolaire des élèves. Ces dimensions seraient, par ailleurs, reliées à la présence des pairs et aux interactions entre élèves. De manière additionnelle, on propose une révision de la littérature sur le système scolaire au Chili, notamment sur sa segmentation socio-scolaire et sa relation avec le mécanisme de vouchers. Dans ce cadre, trois interrogations principales organisent ce travail. D'une part, l'existence ou non d'un impact net sur les acquis scolaires des pratiques d'étude faisant appel aux camarades. Ensuite, la présence probable des influences sous la forme des " transferts des capitaux " entre élèves différemment dotés et déclarant pratiquer l'entraide. Enfin, les relations qui s'avèrent visibles entre ces pratiques et des dimensions telles que le bien-être à l'école ou le concept du soi académique, mais aussi, entre ces dernières et les acquis scolaires. Une séquence d'analyses est entreprise visant à donner des bases robustes aux éventuelles réponses à ces questions. Entre autres, différentes séries d'analyses de régression hiérarchique et par quantiles ont été conduites sur quatre disciplines scolaires. Les principaux résultats de recherche indiquent, d'un côté, que les interactions entre élèves sont assez répandues en milieux scolaire (entre 22% et 41% en moyenne), mais leur proportion varie d'une discipline à l'autre et selon la direction qui prend l'aide. Plus encore, ces interactions sont significativement liées aux résultats scolaires. A conditions comparables, les élèves académiquement faibles gagnent à être aidés par leurs camarades, quelque soit la discipline concernée. En même temps, les élèves qui aident leurs camarades montrent toujours un profil académique fortement associé à des gains de score assez importants. D'un autre côté, on trouve que les élèves possédant plus de capital culturel ont, toutes choses égales par ailleurs, de plus fortes chances de déclarer aider leurs camarades. Enfin, les analyses confirment que les interactions entre élèves sont, de manière importante et significative, liées aux sentiments de bien-être à l'école et au concept de soi académique. La construction d'indices pertinents pour ces derniers est, d'ailleurs, discutée. Différents résultats secondaires ont été aussi produits et discutés, notamment la confirmation, pour la première fois dans le cas chilien, des hypothèses associées au paradigme BFLPE (Marsh, 1987). Ces résultats sont discutés dans leurs probables conséquences en termes de politique éducative, notamment dans le cadre des systèmes éducatifs à forte ségrégation sociale et scolaire.
|
384 |
Optimisation combinatoire pour la sélection de variables en régression en grande dimension : Application en génétique animaleHamon, Julie 26 November 2013 (has links) (PDF)
Le développement des technologies de séquençage et de génotypage haut-débit permet de mesurer, pour un individu, une grande quantité d'information génomique. L'objectif de ce travail est, dans le cadre de la sélection génomique animale, de sélectionner un sous-ensemble de marqueurs génétiques pertinents permettant de prédire un caractère quantitatif, dans un contexte où le nombre d'animaux génotypés est largement inférieur au nombre de marqueurs étudiées. Ce manuscrit présente un état de l'art des méthodes actuelles permettant de répondre à la problématique. Nous proposons ensuite de répondre à notre problématique de sélection de variables en régression en grande dimension en combinant approches d'optimisation combinatoire et modèles statistiques. Nous commençons par paramétrer expérimentalement deux méthodes d'optimisation combinatoire, la recherche locale itérée et l'algorithme génétique, combinées avec une régression li- néaire multiple et nous évaluons leur pertinence. Dans le contexte de la génomique animale les relations familiales entre animaux sont connues et peuvent constituer une information importante. Notre approche étant flexible, nous proposons une adapta- tion permettant de prendre en considération ces relations familiales via l'utilisation d'un modèle mixte. Le problème du sur-apprentissage étant particulièrement présent sur nos données dû au déséquilibre important entre le nombre de variables étudiées et le nombre d'animaux disponibles, nous proposons également une amélioration de notre approche permettant de diminuer ce sur-apprentissage. Les différentes approches proposées sont validées sur des données de la littérature ainsi que sur des données réelles de Gènes Diffusion.
|
385 |
Imputation en présence de données contenant des zérosNambeu, Christian O. 12 1900 (has links)
L’imputation simple est très souvent utilisée dans les enquêtes pour compenser
pour la non-réponse partielle. Dans certaines situations, la variable nécessitant
l’imputation prend des valeurs nulles un très grand nombre de fois. Ceci est très
fréquent dans les enquêtes entreprises qui collectent les variables économiques.
Dans ce mémoire, nous étudions les propriétés de deux méthodes d’imputation
souvent utilisées en pratique et nous montrons qu’elles produisent des estimateurs
imputés biaisés en général. Motivé par un modèle de mélange, nous proposons
trois méthodes d’imputation et étudions leurs propriétés en termes de biais.
Pour ces méthodes d’imputation, nous considérons un estimateur jackknife de la
variance convergent vers la vraie variance, sous l’hypothèse que la fraction de
sondage est négligeable. Finalement, nous effectuons une étude par simulation
pour étudier la performance des estimateurs ponctuels et de variance en termes
de biais et d’erreur quadratique moyenne. / Single imputation is often used in surveys to compensate for item nonresponse.
In some cases, the variable requiring imputation contains a large amount
of zeroes. This is especially frequent in business surveys that collect economic
variables. In this thesis, we study the properties of two imputation procedures
frequently used in practice and show that they lead to biased estimators, in general.
Motivated by a mixture regression model, we then propose three imputation
procedures and study their properties in terms of bias. For the proposed imputation
procedures, we consider a jackknife variance estimator that is consistent
for the true variance, provided the overall sampling fraction is negligible. Finally,
we perform a simulation study to evaluate the performance of point and variance
estimators in terms of relative bias and mean square error.
|
386 |
La situation socioéconomique des résidants des collectivités des Premières Nations et des collectivités environnantes du Québec : impact des facteurs de contexte et des facteurs individuelsDeslauriers, Mélanie 04 1900 (has links)
Cette recherche se penche sur l’impact des facteurs de contexte et des facteurs individuels sur les conditions socioéconomiques des résidants des collectivités des Premières Nations du Québec et des résidants des communautés situées à proximité.
Des régressions logistiques sur les données censitaires de 2001 ont été réalisées afin de répondre aux questions d’étude. Quatre dimensions, inspirées de l’indice de bien-être (IBC), ont été étudiées : l’activité, le logement, le revenu et la scolarité.
Les résultats de recherche montrent que les deux types de facteurs contribuent à l’explication des inégalités sociales. Plus spécifiquement, les inégalités scolaires apparaissent principalement déterminées par les facteurs de contexte bien que les facteurs individuels, tel que l’âge et le genre, soient aussi déterminants. Ces dernières surviennent en amont des inégalités d’emploi et de revenu et expliquent celles-ci. De plus, les inégalités relatives au logement sont expliquées par l’emplacement spatial et le type de communauté de résidence.
Par ailleurs, l’ethnicité des répondants ne joue pas un rôle de premier plan dans l’explication des disparités observées, une fois les autres caractéristiques contrôlées, ce qui ne signifie pas qu’il n’existe pas d’inégalités entre Amérindien et non-Amérindien. En fait, des chances différenciées persistent lorsque les autres caractéristiques sont contrôlées. Ainsi, les résultats mettent en évidence l’utilité de déplacer le point focal de la recherche quantitative sur les conditions autochtones du principal fait d’être Amérindien ou non vers un éventail plus large de déterminants. / This research assesses the specific contribution of individual and contextual factors in explaining the socioeconomics discrepancies between members of First Nations communities and those of communities located nearby.
Using logistic regression on 2001 census data, four dimensions of socioeconomic conditions, largely inspired by the Community Well-Being Index (CWB), are assessed: employment, housing, income and education.
The results of the study show that social inequalities appear correlated to both types of factors. Educational inequalities are primarily due to contextual factors even if individual factors, such as age and gender, also play a role in determining the odds of living social inequalities. Educational inequalities precede employment and income inequalities and, to some extent, explain them. Moreover, housing inequalities are mainly explained by spatial location and residence in a First Nations community
Furthermore, the ethnicity of respondents does not play a major role in explaining the discrepancies, once other characteristics are taken into account. This does not mean that social inequalities do not exist between Aboriginal and non-Aboriginal Canadians. Actually, significant differences between these two social categories are observed even when other characteristics are controlled for. Thus, the results of this study point out to the fact that the focus of quantitative research on Aboriginal people’s conditions should be put on additional predictors of inequalities besides “aboriginality”. Also, the review of literature shows a lack of research on social inequalities within First Nations communities in Canada.
|
387 |
L’arbre de régression multivariable et les modèles linéaires généralisés revisités : applications à l’étude de la diversité bêta et à l’estimation de la biomasse d’arbres tropicauxOuellette, Marie-Hélène 04 1900 (has links)
En écologie, dans le cadre par exemple d’études des services fournis par les écosystèmes, les modélisations descriptive, explicative et prédictive ont toutes trois leur place distincte. Certaines situations bien précises requièrent soit l’un soit l’autre de ces types de modélisation ; le bon choix s’impose afin de pouvoir faire du modèle un usage conforme aux objectifs de l’étude.
Dans le cadre de ce travail, nous explorons dans un premier temps le pouvoir explicatif de l’arbre de régression multivariable (ARM). Cette méthode de modélisation est basée sur un algorithme récursif de bipartition et une méthode de rééchantillonage permettant l’élagage du modèle final, qui est un arbre, afin d’obtenir le modèle produisant les meilleures prédictions. Cette analyse asymétrique à deux tableaux permet l’obtention de groupes homogènes d’objets du tableau réponse, les divisions entre les groupes correspondant à des points de coupure des variables du tableau explicatif marquant les changements les plus abrupts de la réponse.
Nous démontrons qu’afin de calculer le pouvoir explicatif de l’ARM, on doit définir un coefficient de détermination ajusté dans lequel les degrés de liberté du modèle sont estimés à l’aide d’un algorithme. Cette estimation du coefficient de détermination de la population est pratiquement non biaisée. Puisque l’ARM sous-tend des prémisses de discontinuité alors que l’analyse canonique de redondance (ACR) modélise des gradients linéaires continus, la comparaison de leur pouvoir explicatif respectif permet entre autres de distinguer quel type de patron la réponse suit en fonction des variables explicatives. La comparaison du pouvoir explicatif entre l’ACR et l’ARM a été motivée par l’utilisation extensive de l’ACR afin d’étudier la diversité bêta.
Toujours dans une optique explicative, nous définissons une nouvelle procédure appelée l’arbre de régression multivariable en cascade (ARMC) qui permet de construire un modèle tout en imposant un ordre hiérarchique aux hypothèses à l’étude. Cette nouvelle procédure permet d’entreprendre l’étude de l’effet hiérarchisé de deux jeux de variables explicatives, principal et subordonné, puis de calculer leur pouvoir explicatif. L’interprétation du modèle final se fait comme dans une MANOVA hiérarchique. On peut trouver dans les résultats de cette analyse des informations supplémentaires quant aux liens qui existent entre la réponse et les variables explicatives, par exemple des interactions entres les deux jeux explicatifs qui n’étaient pas mises en évidence par l’analyse ARM usuelle.
D’autre part, on étudie le pouvoir prédictif des modèles linéaires généralisés en modélisant la biomasse de différentes espèces d’arbre tropicaux en fonction de certaines de leurs mesures allométriques. Plus particulièrement, nous examinons la capacité des structures d’erreur gaussienne et gamma à fournir les prédictions les plus précises. Nous montrons que pour une espèce en particulier, le pouvoir prédictif d’un modèle faisant usage de la structure d’erreur gamma est supérieur. Cette étude s’insère dans un cadre pratique et se veut un exemple pour les gestionnaires voulant estimer précisément la capture du carbone par des plantations d’arbres tropicaux. Nos conclusions pourraient faire partie intégrante d’un programme de réduction des émissions de carbone par les changements d’utilisation des terres. / In ecology, in ecosystem services studies for example, descriptive, explanatory and predictive modelling all have relevance in different situations. Precise circumstances may require one or the other type of modelling; it is important to choose the method properly to insure that the final model fits the study’s goal.
In this thesis, we first explore the explanatory power of the multivariate regression tree (MRT). This modelling technique is based on a recursive bipartitionning algorithm. The tree is fully grown by successive bipartitions and then it is pruned by resampling in order to reveal the tree providing the best predictions. This asymmetric analysis of two tables produces homogeneous groups in terms of the response that are constrained by splitting levels in the values of some of the most important explanatory variables.
We show that to calculate the explanatory power of an MRT, an appropriate adjusted coefficient of determination must include an estimation of the degrees of freedom of the MRT model through an algorithm. This estimation of the population coefficient of determination is practically unbiased. Since MRT is based upon discontinuity premises whereas canonical redundancy analysis (RDA) models continuous linear gradients, the comparison of their explanatory powers enables one to distinguish between those two patterns of species distributions along the explanatory variables. The extensive use of RDA for the study of beta diversity motivated the comparison between its explanatory power and that of MRT.
In an explanatory perspective again, we define a new procedure called a cascade of multivariate regression trees (CMRT). This procedure provides the possibility of computing an MRT model where an order is imposed to nested explanatory hypotheses. CMRT provides a framework to study the exclusive effect of a main and a subordinate set of explanatory variables by calculating their explanatory powers. The interpretation of the final model is done as in nested MANOVA. New information may arise from this analysis about the relationship between the response and the explanatory variables, for example interaction effects between the two explanatory data sets that were not evidenced by the usual MRT model.
On the other hand, we study the predictive power of generalized linear models (GLM) to predict individual tropical tree biomass as a function of allometric shape variables. Particularly, we examine the capacity of gaussian and gamma error structures to provide the most precise predictions. We show that for a particular species, gamma error structure is superior in terms of predictive power. This study is part of a practical framework; it is meant to be used as a tool for managers who need to precisely estimate the amount of carbon recaptured by tropical tree plantations. Our conclusions could be integrated within a program of carbon emission reduction by land use changes.
|
388 |
Analyse spatiale en écologie : développements méthodologiquesBlanchet, Guillaume January 2007 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal
|
389 |
Modèle bayésien pour les prêts investisseursBouvrette, Mathieu January 2006 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal
|
390 |
Estimation récursive pour les modèles semi-paramétriquesNguyen, Thi Mong Ngoc 26 November 2010 (has links) (PDF)
Dans cette th ese, nous nous int eressons au mod ele semi-param etrique de r egression de la forme y = f( \theta'x; \epsilon), lorsque x \in R^p et y\in R. Notre objectif est d' etudier des probl emes d'estimation des param etres \theta et f de ce mod ele avec des m ethodes r ecursives. Dans la premi ere partie, l'approche que nous d eveloppons est fond ee sur une m ethode introduite par Li (1991), appel ee Sliced Inverse Regression (SIR). Nous proposons des m ethodes SIR r ecursives pour estimer le param etre . Dans le cas particulier o u l'on consid ere le nombre de tranches egal a 2, il est possible d'obtenir une expression analytique de l'estimateur de la direction de . Nous proposons une forme r ecursive pour cet estimateur, ainsi qu'une forme r ecursive de l'estimateur de la matrice d'int er^et. Ensuite, nous proposons une nouvelle approche appell ee \SIRoneslice" (r ecursive ou non r ecursive) de la m ethode SIR bas ee sur l'utilisation de l'information contenue dans une seule tranche optimale (qu'il faudra choisir parmi un nombre quelconque de tranches). Nous proposons egalement un crit ere \bootstrap na f" pour le choix du nombre de tranches. Des r esultats asymptotiques sont donn es et une etude sur des simulations d emontre le bon comportement num erique des approches r ecursives propos ees et l'avantage principal de l'utilisation la version r ecursive de SIR et de SIRoneslice du point de vue des temps de calcul. Dans la second partie, nous travaillons sur des donn ees de valvom etrie mesur ees sur des bivalves. Sur ces donn ees, nous comparons le comportement num erique de trois estimateurs non param etrique de la fonction de r egression : celui de Nadaraya-Watson, celui de Nadaraya-Watson r ecursif et celui de R ev esz qui est lui aussi r ecursif. Dans la derni ere partie de cette th ese, nous proposons une m ethode permettant de combiner l'estimation r ecursive de la fonction de lien f par l'estimateur de Nadaraya- Watson r ecursif et l'estimation du param etre via l'estimateur SIR r ecursif. Nous etablissons une loi des grands nombres ainsi qu'un th eor eme de limite centrale. Nous illustrons ces r esultats th eoriques par des simulations montrant le bon comportement num erique de la m ethode d'estimation propos ee.
|
Page generated in 0.0775 seconds