Spelling suggestions: "subject:"modèles linéaire généralisée"" "subject:"modèles linéaire généralisé""
1 |
Analyse statistique des données issues des biopuces à ADNPeyre, Julie 20 September 2005 (has links) (PDF)
Cette thèse est consacrée à l'analyse statistique des données issues des biopuces à ADN. Nous nous intéressons ici à trois problématiques liées aux données du transcriptôme.<br /><br /> Dans un premier chapitre, nous étudions le problème de la normalisation des données dont l'objectif est d'éliminer les variations parasites entre les échantillons des populations pour ne conserver que les variations expliquées par les phénomènes biologiques. Nous présentons plusieurs méthodes existantes pour lesquelles nous proposons des améliorations. Pour guider le choix d'une méthode de normalisation, une méthode de simulation de données de biopuces est mise au point.<br /><br /> Dans un deuxième chapitre, nous abordons le problème de la détection de gènes différentiellement exprimés entre deux séries d'expériences. On se ramène ici à un problème de test d'hypothèses multiples. Plusieurs approches sont envisagées : sélection de modèles et pénalisation, méthode FDR basée sur une décomposition en ondelettes des statistiques de test ou encore seuillage bayésien.<br /> <br /> Dans le dernier chapitre, nous considérons les problèmes de classification supervisée pour les données de biopuces. Pour remédier au problème du "fléau de la dimension", nous avons développé une méthode semi-paramétrique de réduction de dimension, basée sur la maximisation d'un critère de vraisemblance locale dans les modèles linéaires généralisés en indice simple. L'étape de réduction de dimension est alors suivie d'une étape de régression par polynômes locaux pour effectuer la classification supervisée des individus considérés.
|
2 |
Réduction des temps d’intervention des équipes héliportées sur les feux de forêt au QuébecBrunet, Frédéric 05 November 2024 (has links)
La réduction du temps entre la détection d'un feu de forêt et l'arrivée de l'équipe d'attaque initiale (AI) peut avoir un impact significatif sur les probabilités de succès de l'AI, et conséquemment sur la superficie finale du feu. Le premier volet du projet visait à identifier les facteurs qui influencent ce temps de réponse à partir de données récoltées au Québec entre 2002 et 2022. À l'aide de trois modèles linéaires généralisés mixtes et de sélections de modèles, nous avons analysé l'impact de multiples facteurs ainsi que leurs poids sur trois intervalles de temps distincts : le temps entre la réception de l'alerte et le départ des équipes le jour même, le temps entre la réception de l'alerte et le départ des équipes le lendemain, ainsi que le temps de transport des équipes vers le feu. Nos résultats indiquent que la distance entre la base de départ et le feu, le nombre de segments de vols nécessaires pour atteindre un feu, l'heure d'assignation de l'alerte, l'emplacement de la base de départ, le taux de propagation du feu, la date du feu ainsi que le nombre d'incendies actifs dans la province au moment de l'intervention sont des facteurs ayant un effet significatif. Dans l'ensemble, la distance et le nombre d'étapes de vols étaient les facteurs qui avaient le plus de poids sur le temps de transport, alors que l'heure d'assignation était la variable qui avait le plus de poids pour les temps de départ des feux attaqués le jour même et le lendemain. La deuxième étape du projet a consisté à développer un outil d'optimisation visant à modifier le déploiement des équipes héliportées en tenant compte des prévisions de propagation et d'intensité des incendies, afin de réduire le temps de déplacement et conséquemment le temps de réponse global. Cette analyse a permis de montrer que l'utilisation d'un plus grand nombre de sites potentiels de déploiements serait bénéfique pour améliorer la performance du système. / Reducing the time between the detection of a fire and the arrival of the initial attack (IA) crew can have a significant impact on the likelihood of the IA success. The first part of the project was to identify the factors that influenced response time, based on historical data in Quebec, between 2002 and 2022. Using three generalized linear mixed models and model selection, multiple factors were analyzed as well as their weights on three distinct time intervals: the time between the dispatch of a fire and the departure of the IA team for fires attacked on the same day or the next day, and the travel time of the team until it's arrival on the fire. Results show that the distance between the departure base and the fire, the number of flight legs necessary to get to the fire, the departure base location, the fire's rate of spread, the fire's date, and the number of active fires in the province at the moment of fire start all have a significant impact but have different degrees of influence. The distance and the number of flight legs were identified as the factors having the highest influence on travel time. The second part of the project was to develop an optimization tool that sought to modify the deployment of helitack teams, while considering predicted head fire intensity, to further reduce travel time and consequentially overall response time. This analysis demonstrated that the use of a higher number of potential deployment sites could be beneficial to the overall improvement of the system's performance.
|
3 |
Modèles avancés en régression appliqués à la tarification IARDBérubé, Valérie 13 April 2018 (has links)
En statistique, les modèles linéaires généralisés (GLM) sont utilisés pour développer des modèles pouvants s'adapter à plusieurs types de données. Cependant, leur présence en actuariat et dans les compagnies d'assurance est plus récente. Dans'ce mémoire, on présente d'abord brièvement des méthodes traditionnelles de tarification et de crédibilité. Par la suite, on décrit de façon exhaustive les modèles linéaires généralisés, auxquels on ajoute des effets aléatoires pour qu'ils soient applicables aux contextes de données longitudinales qui sont répendus en actuariat. On termine en démontrant certains liens existant entre la théorie statistique et la pratique actuarielle et un exemple avec les données de la Société d'Assurance Automobile du Québec (SAAQ) est présenté.
|
4 |
Vers une approche dynamique du processus de la notation souveraine. / Towards a dynamic approach to the sovereign rating processRekik, Donia 27 June 2018 (has links)
L’objet de cette thèse consiste à élaborer un cadre conceptuel et statistique destiné à une meilleure compréhension du processus de la notation souveraine. La thèse propose une démarche à plusieurs niveaux dans la perspective (i) de dévoiler les limites de l’expertise des agences de rating à travers les divergences et les erreurs de notation (ii) de conduire une reconstitution classique des notations souveraines et (iii) de revisiter le processus de notation à travers une reconstitution dynamique des notes. Les résultats de la reconstitution classique révèlent que les notations des PED reflètent leurs conjonctures socioéconomiques et financières, alors que celles des PD sont considérablement influencées par l’intervention subjective des analystes. Les études menées dans une perspective dynamique reposent sur la construction et la modélisation des parcours de notation. Une première étude conduite par la méthode MDS, a permis de dégager la typologie des parcours de notation, en distinguant les pays les plus stables des pays les plus vulnérables face aux récentes crises. Une deuxième étude consiste à modéliser les parcours de notation dans le cadre des processus de points marqués (modèle ACD et Probit ordonné). Les résultats mettent en avant une accélération des épisodes d’abaissement des notes en période de crises. L’introduction du facteur de l’hétérogénéité non observable dans le modèle a permis de rendre compte des contextes socioéconomiques de notation et de confectionner un indice composite avancé. Les parcours de notation reflètent l’évolution à long terme des pays, ils transmettent ainsi un contenu informationnel plus large et plus important que celui d’une notation. / The object of this study is to propose a conceptual and statistical framework to better understand the sovereign rating process. This thesis suggests a multi-levels-approach in the perspective (i) of unveiling the limits of expertise of the credit rating agencies due to the noticed differences and to the rating errors. It will also (ii) conduct a classic reconstitution of the sovereign ratings and (iii) will revisit the rating process according to a dynamic reconstitution of the scores. The results of the classic reconstitution revealed that the ratings of the developing countries showed their economic and financial situation whereas it showed the subjective intervention of the experts when it came to developed countries. Studies conducted in a dynamic perspective are based on the construction and the modeling of the rating migration. A first study driven by the MDS method, has allowed to discover the type of ratings used. The four types of identified systems allow distinguishing the most stable countries from the most vulnerable. A second study has consisted on modeling the rating systems in a context of the scores made through ACD model and an ordered Probit model. The results highlight an acceleration of the lowering score for the episodes especially in times of crisis. The lack of heterogeneity in the model raised awareness regarding the ratings of socioeconomic situations and created an advanced composite index. The rating migration reflect the long-term evolution of a country, they also transmit a more important and a larger informational content than a simple rating.
|
5 |
Modèles linéaires généralisés à effets aléatoires : contributions au choix de modèle et au modèle de mélangeMartinez, Marie-José 29 September 2006 (has links) (PDF)
Ce travail est consacré à l'étude des modèles linéaires généralisés à effets aléatoires (GL2M). Dans ces modèles, sous une hypothèse de distribution normale des effets aléatoires, la vraisemblance basée sur la distribution marginale du vecteur à expliquer n'est pas, en général, calculable de façon formelle. Dans la première partie de notre travail, nous revisitons différentes méthodes d'estimation non exactes par le biais d'approximations réalisées à différents niveaux selon les raisonnements. La deuxième partie est consacrée à la mise en place de critères de sélection de modèles au sein des GL2M. Nous revenons sur deux méthodes d'estimation nécessitant la construction de modèles linéarisés et nous proposons des critères basés sur la vraisemblance marginale calculée dans le modèle linéarisé obtenu à la convergence de la procédure d'estimation. La troisième et dernière partie s'inscrit dans le cadre des modèles de mélanges de GL2M. Les composants du mélange sont définis par des GL2M et traduisent différents états possibles des individus. Dans le cadre de la loi exponentielle, nous proposons une méthode d'estimation des paramètres du mélange basée sur une linéarisation spécifique à cette loi. Nous proposons ensuite une méthode plus générale puisque s'appliquant à un mélange de GL2M quelconques. Cette méthode s'appuie sur une étape de Metropolis-Hastings pour construire un algorithme de type MCEM. Les différentes méthodes développées sont testées par simulations.
|
6 |
Estimation dans les modèles linéaires généralisés à effets aléatoiresTrottier, Catherine 02 July 1998 (has links) (PDF)
Ce travail est consacré à l'étude et à la mise en place de méthodes d'estimation de paramètres dans les modèles linéaires généralisés à effets aléatoires (GL2M). Dans ces modèles, sous une hypothèse gaussienne de distribution des effets aléatoires $\xi$, la vraisemblance basée sur la distribution marginale du vecteur à expliquer $Y$ n'est pas en général explicitement calculable. Diverses approximations peuvent être appliquées. Nous distinguons pour cela deux approches : l'une conditionnelle et l'autre marginale. En suivant la première, nous proposons une méthode qui consiste en une maximisation de la distribution jointe de ($Y,\xi$) avant de procéder à l'estimation des paramètres. Ceci équivaut à une linéarisation conditionnelle du modèle. Dans la seconde approche, nous étudions une démarche marginale qui repose sur l'approximation des deux premiers moments marginaux de $Y$ puis sur l'utilisation de la quasi-vraisemblance. Nous étendons à d'autres lois et fonctions de lien la méthode développée par Gilmour et al. dans le cas d'un modèle binomial-lien probit. Nous comparons les différentes méthodes selon une échelle de déconditionnement. Dans un deuxième temps, nous introduisons une notion d'hétérogénéité dans les GL2M. Cette hétérogénéité traduit des comportements des effets aléatoires distincts selon les environnements. Elle est modélisée en attribuant à chaque environnement un paramètre de variance différent pour ces effets. Nous proposons alors une méthode d'estimation combinant à la fois la technique de linéarisation de la démarche conditionnelle précédente et l'utilisation de l'algorithme EM, bien adapté à cette situation d'hétérogénéité dans le cas linéaire.
|
7 |
Modélisation de la trajectoire criminelle de jeunes contrevenants à l'aide de modèles linéaires généralisés mixtesVeilleux, Lucie 11 April 2018 (has links)
La régression linéaire est souvent utilisée en pratique afin de trouver une relation entre une variable réponse et une ou plusieurs variable(s) explicative(s). Une lacune de cette méthode est qu'elle est inappropriée si la variable réponse en est une de dénombrement. Dans un tel cas, la régression de Poisson doit être utilisée. Ce mémoire décrira de façon détaillée la régression de Poisson. Les propriétés de la loi de Poisson seront énoncées dans le but d'expliquer la régression de Poisson. Les équations d'estimation généralisées (GEE) seront ensuite introduites dans un éventuel but d'élargir la régression de Poisson dans les situations où les données sont corrélées (par exemple, les données longitudinales). Les modèles linéaires généralisés mixtes seront aussi considérés. Les modèles additifs généralisés seront ensuite brièvement expliqués et nous présenterons finalement une étude détaillée d'une base de données sur les trajectoires criminelles de jeunes contrevenants.
|
8 |
Suivi de la gestion des zones humides camarguaises par télédétection en référence à leur intérêt avifaunistiqueDavranche, Aurélie 25 April 2008 (has links) (PDF)
Au rang des milieux naturels les plus menacés, les zones humides remplissent pourtant un grand nombre de fonctions utiles à l'homme. Les milieux naturels de Camargue n'échappent pas aux impacts des changements globaux et subissent une artificialisation croissante de leur gestion, motivée par l'intensification des pratiques agricoles et des usages socio-économiques. La télédétection a été présentée comme un outil complémentaire prometteur pour le monitoring des zones humides. Nous montrons dans cette étude qu'elle permet, aujourd'hui, grâce au mode multitemporel et multispectral des satellites de dernière génération, de s'affranchir d'un ré-échantillonnage jusque là nécessaire à la reproductibilité des méthodes traditionnelles. Pour deux habitats naturels dominants de Camargue abritant des populations d'oiseaux vulnérables ou à fort intérêt cynégétique, nous avons élaboré des formules fiables et reproductibles permettant de caractériser l'évolution de communautés végétales et d'obtenir une vision mensuelle des zones inondées sur l'ensemble du delta. La méthodologie employée se base sur deux types de méthodes statistiques. La première, qualitative, détermine la présence de groupements végétaux, puis de l'eau à travers une végétation plus ou moins dense. La seconde, quantitative, permet de suivre des paramètres déterminant la qualité et l'intérêt avifaunistique des roselières de Camargue. Les modèles élaborés dans cette étude seront d'une grande valeur pour proposer des modes de gestion adaptés aux objectifs de préservation et de développement durable des zones humides méditerranéennes.
|
9 |
Des poissons sous influence ? : une analyse à large échelle des relations entre les gradients abiotiques et l’ichtyofaune des estuaires tidaux européens / Fish under influence? : a large-scale analysis of relations between abiotic gradients and fish assemblages of European tidal estuariesNicolas, Delphine 02 July 2010 (has links)
Cette thèse cherche à déterminer l’influence de l’environnement abiotique sur la structure des assemblages de poissons dans les estuaires européens tidaux à partir d’une approche macroécologique. L’environnement abiotique de 135 estuaires, du Portugal à l’Ecosse, est caractérisé par une quinzaine de descripteurs en utilisant une approche écohydrologique. Les assemblages de poissons d’une centaine d’estuaires sont caractérisés par les données de pêche acquises au cours de campagnes scientifiques conduites dans le cadre de la Directive-Cadre européenne sur l’Eau (DCE). Néanmoins, ces données sont souvent hétérogènes du fait des différences entre les protocoles d’échantillonnage utilisés. Afin de limiter cette hétérogénéité, une sélection rigoureuse et une procédure de standardisation des données ont été effectuées. Les assemblages de poissons sont décrits à l’aide d’indices globaux ou fonctionnels relatifs à la richesse spécifique et à l’abondance. A l’aide de modèles linéaires généralisés, des relations sont établies entre des attributs de l’ichtyofaune et des gradients abiotiques à large échelle et au sein de l’estuaire. La richesse spécifique totale, et en particulier celle des espèces marines et migratrices amphihalines, augmente avec la taille de l’estuaire. De plus, elle apparaît plus élevée dans les estuaires associés à un large plateau continental. Les plus fortes densités totales et, en particulier, celles des espèces résidentes et marines, sont associées aux estuaires présentant une grande proportion en zones intertidales. Les assemblages de poissons estuariens apparaissent fortement structurés par le gradient de salinité à la fois en termes de richesse spécifique et de densité. En parallèle, cette thèse apporte des éléments témoignant d’un décalage vers le Nord de plusieurs espèces de poissons estuariens dans le contexte du réchauffement climatique global. Les résultats de cette thèse contribueront à l’amélioration des indicateurs biotiques basés sur l’ichtyofaune qui sont actuellement développés dans le contexte de la DCE. / Based on a macroecological approach, this thesis aims at determining the influence of the abiotic environment on the structure of fish assemblages among European tidal estuaries. The abiotic environment of 135 North-Eastern Atlantic estuaries from Portugal to Scotland was characterised by fifteen descriptors using an ecohydrological approach. The fish assemblages of about a hundred estuaries were characterised by fish data collected during scientific surveys conducted in the context of the European Water Framework Directive (WFD). Nonetheless, differences among sampling protocols resulted in highly heterogeneous datasets. To limit this heterogeneity, a rigorous selections and standardisation processes were carried out. Fish assemblages were described by total or functional indices related to species richness or abundance. Relationships were identified between large-scale and intra-estuarine abiotic gradients and fish attributes by fitting generalised linear models. Results showed that the total number of species, and more especially of marine and diadromous species, increased with the estuary size. Moreover, the total species richness appeared higher in estuaries associated to a wide continental shelf. The greatest total densities, and more particularly total densities of resident and marine species, were associated to estuaries with a great proportion of intertidal areas. Fish assemblages appeared also strongly structured by the salinity gradient in terms of both species richness and density. Furthermore, this thesis brought some evidence of northward migration of estuarine fish species in the context of the global warming. The results of this thesis will contribute to improve the fish indicators that are currently developed in the context of the European WFD.
|
10 |
Modèle de mélange et modèles linéaires généralisés, application aux données de co-infection (arbovirus & paludisme) / Mixture model and generalized linear models, application to co-infection data (arbovirus & malaria)Loum, Mor Absa 28 August 2018 (has links)
Nous nous intéressons, dans cette thèse, à l'étude des modèles de mélange et des modèles linéaires généralisés, avec une application aux données de co-infection entre les arbovirus et les parasites du paludisme. Après une première partie consacrée à l'étude de la co-infection par un modèle logistique multinomial, nous proposons dans une deuxième partie l'étude des mélanges de modèles linéaires généralisés. La méthode proposée pour estimer les paramètres du mélange est une combinaison d'une méthode des moments et d'une méthode spectrale. Nous proposons à la fin une dernière partie consacrée aux mélanges de valeurs extrêmes en présence de censure. La méthode d'estimation proposée dans cette partie se fait en deux étapes basées sur la maximisation d'une vraisemblance. / We are interested, in this thesis, to the study of mixture models and generalized linear models, with an application to co-infection data between arboviruses and malaria parasites. After a first part dedicated to the study of co-infection using a multinomial logistic model, we propose in a second part to study the mixtures of generalized linear models. The proposed method to estimate the parameters of the mixture is a combination of a moment method and a spectral method. Finally, we propose a final section for studing extreme value mixtures under random censoring. The estimation method proposed in this section is done in two steps based on the maximization of a likelihood.
|
Page generated in 0.099 seconds