Global ETD Search

1	Modélisation de la variance dans l'analyse stochastique du passif des polices Davidov, Danaïl January 2009 (has links) (PDF) Ce mémoire fait une étude détaillée des méthodes utilisées pour modéliser les réserves actuarielles en assurance de dommages. Les méthodes stochastiques utilisent des modèles linéaires généralisés qui permettent d'associer une courbe de probabilités aux pertes futures. Une analyse approfondie de la classe de modèles de Tweedie est présentée, ce qui permet d'obtenir les formules d'un large spectre de modèles. Ensuite, l'ouvrage met en évidence une différence dans la nature du risque entre la fréquence et la sévérité qui suscite la nécessité d'utiliser un modèle qui accorde plus de liberté aux facteurs de surdispersion. Deux solutions sont abordées: les modèles de dispersion, basés sur le principe du maximum de vraisemblance, et les modèles linéaires généralisés doubles, axés sur le principe de la déviance. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Réserves actuarielles, Chain Ladder, Modèles linéaires généralisés, Loi de Tweedie, Déviance, Paramètre de surdispersion, Modèles de dispersion, Modèles linéaires généralisés doubles. Analyse de variance Modèle linéaire généralisé Modèle stochastique Évaluation actuarielle Dispersion (Mathématiques)
2	Encodage d'un signal audio dans un électroencéphalogramme Moinnereau, Marc-Antoine January 2017 (has links) Les interfaces cerveau-machine visent à établir un lien de communication entre le cerveau et un système externe à ce dernier. Les électroencéphalogrammes (EEG), dans ce contexte, ont l’avantage d’être non invasifs. Par contre, l’information sensorielle qui se retrouve dans un signal EEG est beaucoup moins ciblée que dans un signal neuronal acquis par une méthode invasive. De plus, étant donné que le cortex auditif est situé dans des repliements du tissu cortical, les neurones qui déchargent, suite à un stimulus auditif, sont parallèles à la surface corticale sur laquelle les EEG sont enregistrés. Par conséquent, l’information auditive qui se retrouve dans le canal EEG situé vis-à-vis du cortex auditif est faible. L’objectif principal de ce projet de recherche consiste donc à étudier la répartition de l’information auditive dans l’ensemble des canaux EEG. Pour ce faire, nous utilisons deux approches. Dans la première, nous tenterons d’estimer l’activité corticale sous-jacente à partir des signaux EEG en utilisant un modèle de couplage bande fréquence. En effet, certaines bandes de fréquences sont des bons prédicteurs des décharges neuronales. Cependant, cette approche n’a pas été validée pour le système auditif, nous confronterons donc l’estimation obtenue à une autre estimation en ayant recours à un modèle spécialisé pour l’encodage du signal de parole faisant appel aux processus ponctuels. Ce modèle prend en compte les dynamiques intrasèques des neurones et également des propriétés spectrotemporelles du stimulus d’entrée. Dans la seconde approche, nous étudierons la possibilité de classifier 3 voyelles (a, i et u) en fonction du nombre de canaux EEG utilisés ainsi que leur répartition sur le cuir chevelu. Nous aurons recours, pour cela, à un réservoir de neurone à décharge récurrent activé en entrée par les données EEG. Les résultats démontrent que l’information auditive se retrouve en fait dans l’ensemble des canaux EEG et qu’elle n’est pas confinée à un nombre restreint d’électrodes. Il est également montré que lorsque l’on utilise les 64 électrodes que comporte l’EEG pour classifier les 3 voyelles, on obtient une classification de l’ordre de 80%, mais aussi qu’un nombre limité de 10 électrodes suffit pour obtenir une classification satisfaisante et, qu’en plus, la position de ces électrodes sur le cuir chevelu est peu importante. Électroencéphalogramme (EEG) Encodage neuronal Modèle linéaire généralisé Données spatio- et spectro-temporelles Réservoir Réseaux de neurones récurrents Apprentissage machine Cortex auditif
3	Stabilité de la sélection de variables pour la régression et la classification de données corrélées en grande dimension / Stability of variable selection in regression and classification issues for correlated data in high dimension Perthame, Emeline 16 October 2015 (has links) Les données à haut-débit, par leur grande dimension et leur hétérogénéité, ont motivé le développement de méthodes statistiques pour la sélection de variables. En effet, le signal est souvent observé simultanément à plusieurs facteurs de confusion. Les approches de sélection habituelles, construites sous l'hypothèse d'indépendance des variables, sont alors remises en question car elles peuvent conduire à des décisions erronées. L'objectif de cette thèse est de contribuer à l'amélioration des méthodes de sélection de variables pour la régression et la classification supervisée, par une meilleure prise en compte de la dépendance entre les statistiques de sélection. L'ensemble des méthodes proposées s'appuie sur la description de la dépendance entre covariables par un petit nombre de variables latentes. Ce modèle à facteurs suppose que les covariables sont indépendantes conditionnellement à un vecteur de facteurs latents. Une partie de ce travail de thèse porte sur l'analyse de données de potentiels évoqués (ERP). Les ERP sont utilisés pour décrire par électro-encéphalographie l'évolution temporelle de l'activité cérébrale. Sur les courts intervalles de temps durant lesquels les variations d'ERPs peuvent être liées à des conditions expérimentales, le signal psychologique est faible, au regard de la forte variabilité inter-individuelle des courbes ERP. En effet, ces données sont caractérisées par une structure de dépendance temporelle forte et complexe. L'analyse statistique de ces données revient à tester pour chaque instant un lien entre l'activité cérébrale et des conditions expérimentales. Une méthode de décorrélation des statistiques de test est proposée, basée sur la modélisation jointe du signal et de la dépendance à partir d'une connaissance préalable d'instants où le signal est nul. Ensuite, l'apport du modèle à facteurs dans le cadre général de l'Analyse Discriminante Linéaire est étudié. On démontre que la règle linéaire de classification optimale conditionnelle aux facteurs latents est plus performante que la règle non-conditionnelle. Un algorithme de type EM pour l'estimation des paramètres du modèle est proposé. La méthode de décorrélation des données ainsi définie est compatible avec un objectif de prédiction. Enfin, on aborde de manière plus formelle les problématiques de détection et d'identification de signal en situation de dépendance. On s'intéresse plus particulièrement au Higher Criticism (HC), défini sous l'hypothèse d'un signal rare de faible amplitude et sous l'indépendance. Il est montré dans la littérature que cette méthode atteint des bornes théoriques de détection. Les propriétés du HC en situation de dépendance sont étudiées et les bornes de détectabilité et d'estimabilité sont étendues à des situations arbitrairement complexes de dépendance. Dans le cadre de l'identification de signal, une adaptation de la méthode Higher Criticism Thresholding par décorrélation par les innovations est proposée. / The analysis of high throughput data has renewed the statistical methodology for feature selection. Such data are both characterized by their high dimension and their heterogeneity, as the true signal and several confusing factors are often observed at the same time. In such a framework, the usual statistical approaches are questioned and can lead to misleading decisions as they are initially designed under independence assumption among variables. The goal of this thesis is to contribute to the improvement of variable selection methods in regression and supervised classification issues, by accounting for the dependence between selection statistics. All the methods proposed in this thesis are based on a factor model of covariates, which assumes that variables are conditionally independent given a vector of latent variables. A part of this thesis focuses on the analysis of event-related potentials data (ERP). ERPs are now widely collected in psychological research to determine the time courses of mental events. In the significant analysis of the relationships between event-related potentials and experimental covariates, the psychological signal is often both rare, since it only occurs on short intervals and weak, regarding the huge between-subject variability of ERP curves. Indeed, this data is characterized by a temporal dependence pattern both strong and complex. Moreover, studying the effect of experimental condition on brain activity for each instant is a multiple testing issue. We propose to decorrelate the test statistics by a joint modeling of the signal and time-dependence among test statistics from a prior knowledge of time points during which the signal is null. Second, an extension of decorrelation methods is proposed in order to handle a variable selection issue in the linear supervised classification models framework. The contribution of factor model assumption in the general framework of Linear Discriminant Analysis is studied. It is shown that the optimal linear classification rule conditionally to these factors is more efficient than the non-conditional rule. Next, an Expectation-Maximization algorithm for the estimation of the model parameters is proposed. This method of data decorrelation is compatible with a prediction purpose. At last, the issues of detection and identification of a signal when features are dependent are addressed more analytically. We focus on the Higher Criticism (HC) procedure, defined under the assumptions of a sparse signal of low amplitude and independence among tests. It is shown in the literature that this method reaches theoretical bounds of detection. Properties of HC under dependence are studied and the bounds of detectability and estimability are extended to arbitrarily complex situations of dependence. Finally, in the context of signal identification, an extension of Higher Criticism Thresholding based on innovations is proposed. Statistique Grande dimension Sélection de variables Dépendance Régression Modèle linéaire généralisé Statistics High dimension Variable selection Dependence Regression Generalized linear model
4	Tests pour la dépendance entre les sections dans un modèle de Poisson Roussel, Arnaud 05 1900 (has links) Les simulations et figures ont été réalisées avec le logiciel R. / Pour des données de panel, les mesures répétées dans le temps peuvent remettre en cause l’hypothèse d’indépendance entre les individus. Des tests ont été développés pour pouvoir vérifier s’il reste de la dépendance entre les résidus d’un modèle. Les trois tests que nous présentons dans ce mémoire sont ceux de Pesaran (2004), Friedman (1937) et Frees (1995). Ces trois tests se basent sur les résidus (et leurs corrélations) et ont été construits pour des modèles linéaires. Nous voulons étudier dans ce mémoire les performances de ces trois tests dans le cadre d’un modèle linéaire généralisé de Poisson. Dans ce but, on compare tout d’abord leurs performances (niveaux et puissances) pour deux modèles linéaires, l’un ayant un terme autorégressif et l’autre non. Par la suite, nous nous intéressons à leurs performances pour un modèle linéaire généralisé de Poisson en s’inspirant de Hsiao, Pesaran et Pick (2007) qui adaptent le test de Pesaran (2004) pour un modèle linéaire généralisé. Toutes nos comparaisons de performances se feront à l’aide de simulations dans lesquelles nous ferons varier un certain nombre de paramètres (nombre d’observations, force de la dépendance, etc.). Nous verrons que lorsque les corrélations sont toutes du même signe, le test de Pesaran donne en général de meilleurs résultats, à la fois dans les cas linéaires et pour le modèle linéaire généralisé. Le test de Frees présentera de bonnes propriétés dans le cas où le signe des corrélations entre les résidus alterne. / For panel data, repeated measures over time can challenge the hypothesis of dependence between subjects. Tests were developped in order to assess if some dependence remains among residuals. The three tests we present in this master thesis are from Pesaran (2004), Friedman (1937) and Frees (1995). These three tests, constructed specifically for linear models, are based on the residuals generated from models (and their correlations). We wish to study in this master thesis the performances of these three tests in the case of generalized linear Poisson models. For that goal, we compare them between each other (level, power, etc.) using two linear models, one with an autoregressive term and the other without. Next, inspired by Hsiao, Pesaran and Pick (2007) who adapt the test from Pesaran (2004), we will study their performances in a generalized Poisson model. All of our comparisons are done with simulations by modifying some variables (number of observations, strength of the dependence). We will observe that when the correlation is always of the same sign, Pesaran’s test is the best in most cases, for the linear models and the generalized linear model. Frees’ test will show good performances when the sign of the correlations alternates. Poisson Résidus Régression Modèle linéaire Modèle linéaire généralisé Données de panel Dépendance Test Residuals Regression Linear model Generalized linear model Panel data Dependence
5	Dynamiques spatio-temporelles d'espèces démersales clés du golfe du Lion : bénéfices potentiels d’aires marines protégées / Spatio-temporal dynamics of demersal exploited species in the Gulf of Lions : potential usefulness of Marine Protected Areas Morfin, Marie 18 October 2013 (has links) Les espèces démersales représentent 50% des captures des pêcheries françaises du golfe du Lion, dont la plupart sont pleinement exploitées, voir surexploitées depuis plusieurs décennies. Cette thèse évalue la pertinence d'aires marines protégées (AMPs) comme outil de gestion et de conservation de ces populations. Jusqu'à présent de telles zones ont été uniquement mises en place le long des côtes pour protéger des espèces très peu mobiles. Le problème est plus complexe pour les espèces vivant en haute mer car leur habitat est plus large et plus diffus. Pour ce faire, la distribution spatiale de 12 espèces démersales exploitées clés ont été étudiées de 1994 à 2010, à l'aide d'observations scientifiques et d'outils statistiques ad hoc. Une approche géostatistique a permis de détecter des structures d'auto-corrélation spatiale pour l'ensemble des espèces, et de produire des cartes de distributions annuelles de chaque espèce. Ces distributions sont apparues très stables sur les dix-sept années, mis à part un phénomène d'expansion/ rétraction avec le niveau d'abondance totale sur la région. Par ailleurs une approche par modèle linéaire généralisé a révélé des associations importantes de ces espèces à un habitat stable dans le temps. Ces résultats sont en accord avec la théorie du bassin de MacCall selon laquelle l'association d'une espèce à un habitat est densité-dépendant, et l'augmentation de la densité d'individus dans une zone serait à l'origine de la colonisation d'habitats sub-optimaux. Protéger l'habitat optimal d'une espèce permettrait alors de constituer un habitat «source», si la zone est judicieusement choisie ; en effet le report de l'effort de pêche à l'extérieur de l'AMP peut au contraire rendre cette mesure inefficace voir délétère. Par ailleurs les populations adultes occupaient généralement des zones plus concentrées et incluses dans l'aire de répartition des juvéniles. Ces zones communes d'habitats essentiels (reproduction et nourriceries) peuvent être potentiellement intéressantes à protéger dans un cadre monospécifique. L'hétérogénéité observée des répartitions d'une espèce à l'autre implique l'instauration de zones très clairsemées, et rend la gestion difficile dans une cadre pluri-spécifique. Une zone de taille raisonnable a tout de même été identifiée, représentant 20% de la population de chaque espèce et représentative de la diversité des habitats de cette région. / Demersal species represent 50% of French fisheries catches in theGulf of Lions, most of which are fully exploited, or overfished for decades. This thesis evaluates the relevance of marine protected areas (MPAs) as a tool for conservation and management of these populations. So far these areas have been implemented only along the coast to protect the very few mobile species. The problem is more complex for deep sea species because their habitat is broader and more diffuse. To do this, the spatial distribution of 12 key demersal species exploited were studied from 1994 to 2010, with scientific observations and ad hoc statistical tools. A geostatistical approach allowed to detect spatial autocorrelation structures for all species, and produce maps of annual distributions of each species. These distributions appeared very stable over 17 years, apart from a phenomenon of expansion/ contraction with the level of total abundance in the region. In addition, a generalized linear model approach revealed significant associations of these species to a temporally stable habitat. These results are consistent with MacCall basin theory, according which habitat suitability is a density-dependent thus the increase of individuals in an area make them colonize sub-optimal habitats. An optimal habitat under protection could thus be "source" habitat, if the area is carefully chosen. Indeed reporting the fishing effort outside the MPA can instead make this measure ineffective or deleterious. The adult population were generally in more concentrated areas and included in the spatial range of juveniles. These common areas of essential habitat (breeding and nursery) may be potentially interesting to protect a single species . However, the heterogeneity of distributions of a species to another involves the introduction of very sparse areas, making the management difficult. However an area of reasonable size has been identified, covering 20% of the population of each species and representative of the diversity of bottom habitats in the region. Espèces démersales exploitées Statistiques spatiales Habitat Modèle Linéaire Généralisé Golfe du Lion Aires Marines Protégées Exploited demersal species Spatial statistics Habitat Generalized Linear Models Gulf of Lions Marine Protected Areas
6	Combinaisons markoviennes et semi-markoviennes de modèles de régression. Application à la croissance d'arbres forestiers. Chaubert-Pereira, Florence 05 November 2008 (has links) (PDF) Ce travail est consacré à l'étude des combinaisons markoviennes et semi-markoviennes de modèles de régression, i.e. des mélanges finis de modèles de régression avec dépendances (semi-)markoviennes. Cette famille de modèles statistiques permet l'analyse de données structurées en phases successives synchrones entre individus, influencées par des covariables pouvant varier dans le temps et présentant une hétérogénéité inter-individuelle. L'algorithme d'inférence proposé pour les combinaisons (semi-)markoviennes de modèles linéaires généralisés est un algorithme du gradient EM. Pour les combinaisons (semi-)markoviennes de modèles linéaires mixtes, nous proposons des algorithmes de type MCEM où l'étape E se décompose en deux étapes de restauration conditionnelle: une pour les séquences d'états sachant les effets aléatoires (et les données observées) et une pour les effets aléatoires sachant les séquences d'états (et les données observées). Différentes méthodes de restauration conditionnelle sont présentées. Nous étudions deux types d'effets aléatoires: des effets aléatoires individuels et des effets aléatoires temporels. L'intérêt de cette famille de modèles est illustré par l'analyse de la croissance d'arbres forestiers en fonctions de facteurs climatiques. Ces modèles nous permettent d'identifier et de caractériser les trois principales composantes de la croissance (la composante ontogénique, la composante environnementale et la composante individuelle). Nous montrons que le poids de chaque composante varie en fonction de l'espèce et des interventions sylvicoles. [SDV] Life Sciences Chaîne de Markov cachée semi-chaîne de Markov cachée modèle linéaire généralisé modèle linéaire mixte algorithme MCEM composantes de la croissance d'arbres
7	L’arbre de régression multivariable et les modèles linéaires généralisés revisités : applications à l’étude de la diversité bêta et à l’estimation de la biomasse d’arbres tropicaux Ouellette, Marie-Hélène 04 1900 (has links) En écologie, dans le cadre par exemple d’études des services fournis par les écosystèmes, les modélisations descriptive, explicative et prédictive ont toutes trois leur place distincte. Certaines situations bien précises requièrent soit l’un soit l’autre de ces types de modélisation ; le bon choix s’impose afin de pouvoir faire du modèle un usage conforme aux objectifs de l’étude. Dans le cadre de ce travail, nous explorons dans un premier temps le pouvoir explicatif de l’arbre de régression multivariable (ARM). Cette méthode de modélisation est basée sur un algorithme récursif de bipartition et une méthode de rééchantillonage permettant l’élagage du modèle final, qui est un arbre, afin d’obtenir le modèle produisant les meilleures prédictions. Cette analyse asymétrique à deux tableaux permet l’obtention de groupes homogènes d’objets du tableau réponse, les divisions entre les groupes correspondant à des points de coupure des variables du tableau explicatif marquant les changements les plus abrupts de la réponse. Nous démontrons qu’afin de calculer le pouvoir explicatif de l’ARM, on doit définir un coefficient de détermination ajusté dans lequel les degrés de liberté du modèle sont estimés à l’aide d’un algorithme. Cette estimation du coefficient de détermination de la population est pratiquement non biaisée. Puisque l’ARM sous-tend des prémisses de discontinuité alors que l’analyse canonique de redondance (ACR) modélise des gradients linéaires continus, la comparaison de leur pouvoir explicatif respectif permet entre autres de distinguer quel type de patron la réponse suit en fonction des variables explicatives. La comparaison du pouvoir explicatif entre l’ACR et l’ARM a été motivée par l’utilisation extensive de l’ACR afin d’étudier la diversité bêta. Toujours dans une optique explicative, nous définissons une nouvelle procédure appelée l’arbre de régression multivariable en cascade (ARMC) qui permet de construire un modèle tout en imposant un ordre hiérarchique aux hypothèses à l’étude. Cette nouvelle procédure permet d’entreprendre l’étude de l’effet hiérarchisé de deux jeux de variables explicatives, principal et subordonné, puis de calculer leur pouvoir explicatif. L’interprétation du modèle final se fait comme dans une MANOVA hiérarchique. On peut trouver dans les résultats de cette analyse des informations supplémentaires quant aux liens qui existent entre la réponse et les variables explicatives, par exemple des interactions entres les deux jeux explicatifs qui n’étaient pas mises en évidence par l’analyse ARM usuelle. D’autre part, on étudie le pouvoir prédictif des modèles linéaires généralisés en modélisant la biomasse de différentes espèces d’arbre tropicaux en fonction de certaines de leurs mesures allométriques. Plus particulièrement, nous examinons la capacité des structures d’erreur gaussienne et gamma à fournir les prédictions les plus précises. Nous montrons que pour une espèce en particulier, le pouvoir prédictif d’un modèle faisant usage de la structure d’erreur gamma est supérieur. Cette étude s’insère dans un cadre pratique et se veut un exemple pour les gestionnaires voulant estimer précisément la capture du carbone par des plantations d’arbres tropicaux. Nos conclusions pourraient faire partie intégrante d’un programme de réduction des émissions de carbone par les changements d’utilisation des terres. / In ecology, in ecosystem services studies for example, descriptive, explanatory and predictive modelling all have relevance in different situations. Precise circumstances may require one or the other type of modelling; it is important to choose the method properly to insure that the final model fits the study’s goal. In this thesis, we first explore the explanatory power of the multivariate regression tree (MRT). This modelling technique is based on a recursive bipartitionning algorithm. The tree is fully grown by successive bipartitions and then it is pruned by resampling in order to reveal the tree providing the best predictions. This asymmetric analysis of two tables produces homogeneous groups in terms of the response that are constrained by splitting levels in the values of some of the most important explanatory variables. We show that to calculate the explanatory power of an MRT, an appropriate adjusted coefficient of determination must include an estimation of the degrees of freedom of the MRT model through an algorithm. This estimation of the population coefficient of determination is practically unbiased. Since MRT is based upon discontinuity premises whereas canonical redundancy analysis (RDA) models continuous linear gradients, the comparison of their explanatory powers enables one to distinguish between those two patterns of species distributions along the explanatory variables. The extensive use of RDA for the study of beta diversity motivated the comparison between its explanatory power and that of MRT. In an explanatory perspective again, we define a new procedure called a cascade of multivariate regression trees (CMRT). This procedure provides the possibility of computing an MRT model where an order is imposed to nested explanatory hypotheses. CMRT provides a framework to study the exclusive effect of a main and a subordinate set of explanatory variables by calculating their explanatory powers. The interpretation of the final model is done as in nested MANOVA. New information may arise from this analysis about the relationship between the response and the explanatory variables, for example interaction effects between the two explanatory data sets that were not evidenced by the usual MRT model. On the other hand, we study the predictive power of generalized linear models (GLM) to predict individual tropical tree biomass as a function of allometric shape variables. Particularly, we examine the capacity of gaussian and gamma error structures to provide the most precise predictions. We show that for a particular species, gamma error structure is superior in terms of predictive power. This study is part of a practical framework; it is meant to be used as a tool for managers who need to precisely estimate the amount of carbon recaptured by tropical tree plantations. Our conclusions could be integrated within a program of carbon emission reduction by land use changes. Arbre de régression multivariable diversité bêta modèle linéaire généralisé recapture du carbone Beta diversity carbon recapture generalized linear models multivariate regression tree tropical tree biomass estimation
8	Modélisation de la dynamique saisonnière des éclosions d' Aedes (ochlerotatus) caspius (Pallas, 1771) (culicidae) dans un contexte de changement climatique Roumieux, Camille 11 July 2012 (has links) Ce travail de thèse étudie l'évolution des éclosions d'Aedes (Ochlerotatus) caspius (Pallas, 1771) (Culicidae) sur le littoral méditerranéen français dans un contexte de changement climatique. Aedes caspius est un moustique nuisant se développant dans les milieux naturels salés à submersions temporaires dont le cycle de vie est réglé par un nombre de paramètres environnementaux relativement limités. Nous avons tenté de mieux cerner les déterminants des dynamiques temporelles actuelle et future des éclosions d'Aedes caspius. L'étude de l'aire de répartition d'Aedes caspius à l'échelle du bassin méditerranéen a conduit à définir une enveloppe bioclimatique actuelle et future. L'ensemble des anomalies climatiques telles que envisagées par les scenarii A2 et B2 du GIEC (horizons 2020, 2050 et 2080) entraîne un élargissement de l'enveloppe bioclimatique vers le nord et l'ouest de la France, et potentiellement une extension de la zone d'intervention de l'Entente Interdépartementale pour la Démoustication Méditerranée (EID), sans toutefois exclure les zones humides actuellement démoustiquées. La dynamique temporelle a donc pu être étudiée à partir de la base de données des interventions quotidiennes de l'EID, sur la période 2004-2009. A cette échelle locale (3 105 ha) et tenant compte de la variabilité météorologique inter- et intra-annuelle sur la période, un modèle logistique binaire d'occurrences d'éclosion a été développé. / This thesis studies the evolution of hatching of Aedes (Ochlerotatus) caspius (Pallas, 1771) (Culicidae) on the French Mediterranean coast in the context of climate change. Aedes caspius is a nuisance mosquito in natural salt to temporary submersion wetlands whose life cycle is regulated by a number of environmental parameters relatively limited. We tried to understand the determinants of temporal dynamics of current and future hatching of Aedes caspius. The study of the distribution area of Aedes caspius across the Mediterranean basin has led to the definition of present and future bioclimatic envelopes. The set of climatic anomalies such as envisaged by the scenarios A2 and B2 of the Intergovernmental Panel on Climate Change (IPCC) (period 2020, 2050 and 2080) leads to an enlargement of the bioclimatic envelope to the north and west of France, and the potential extension of the present day intervention area of the Entente Interdépartementale pour la Démoustication Méditerranée (Interdepartmental Agreement for Mosquito Control Mediterranean (EID)). The temporal dynamics has been studied from the database of daily interventions of EID, over the period 2004-2009. At this local scale (3105 ha) and taking into account inter-and intra-annual meteorological variability, a binary logistic model of occurrences of daily outbreaks has been developed. The resulting model reports that the type of land use, minimum temperature, photoperiod, temperature amplitude and to a lesser extent precipitation and their variability are the main factors explaining the presence of Aedes caspius outbreaks. Aedes caspius Bioclimatologie Changement climatique Cycle de vie Littoral méditerranéen français Mares temporaires halomorphes Modèle linéaire généralisé Usage du sol Aedes caspius Bioclimatology Climate change Life cycle The French Mediterranean coast Temporary halomorphic pools Generalized linear model Land use
9	From group to patient-specific analysis of brain function in arterial spin labelling and BOLD functional MRI / Des études de groupe aux analyses individuelles dans l'exploration de la fonction cérébrale en imagerie de perfusion par marquage de spins et en IRM fonctionnelle BOLD Maumet, Camille 29 May 2013 (has links) Cette thèse aborde l'étude de la fonction cérébrale en Imagerie par Résonance Magnétique (IRM) à l'aide de deux séquences : l'IRM fonctionnelle (IRMf) BOLD et l'imagerie de perfusion par marquage de spins (ASL). Dans ce contexte, les analyses de groupe jouent un rôle important dans l'identification des dysfonctionnements globaux associés à une pathologie. D'autre part, les études individuelles, qui fournissent des conclusions au niveau d'un sujet unique, présentent un intérêt croissant. Dans ce travail, nous abordons à la fois les études de groupe et les analyses individuelles. Dans un premier temps, nous réalisons une analyse de groupe en IRMf BOLD en vue d'étudier la dysphasie chez l'enfant, une pathologie peu explorée en neuroimagerie. Nous mettons ainsi en évidence un fonctionnement et une latéralisation atypiques des aires langagières. Ensuite, nous nous concentrons sur les analyses individuelles. Nous proposons l'utilisation d'estimateurs robustes pour calculer les cartographies de débit sanguin cérébral en ASL. Ensuite, nous étudions la validité des hypothèses qui sous-tendent les analyses statistiques standard dans le contexte de l'ASL. Finalement, nous proposons une nouvelle méthode localement multivariée basée sur une approche a contrario. La validation de cette nouvelle approche est réalisée dans deux contextes applicatifs : la détection d'anomalies de perfusion en ASL et la détection de zones d'activation en IRMf BOLD. / This thesis deals with the analysis of brain function in Magnetic Resonance Imaging (MRI) using two sequences: BOLD functional MRI (fMRI) and Arterial Spin Labelling (ASL). In this context, group statistical analyses are of great importance in order to understand the general mechanisms underlying a pathology, but there is also an increasing interest towards patient-specific analyses that draw conclusions at the patient level. Both group and patient-specific analyses are studied in this thesis. We first introduce a group analysis in BOLD fMRI for the study of specific language impairment, a pathology that was very little investigated in neuroimaging. We outline atypical patterns of functional activity and lateralisation in language regions. Then, we move forward to patient-specific analysis. We propose the use of robust estimators to compute cerebral blood flow maps in ASL. Then, we analyse the validity of the assumptions underlying standard statistical analyses in the context of ASL. Finally, we propose a new locally multivariate statistical method based on an a contrario approach and apply it to the detection of atypical patterns of perfusion in ASL and to activation detection in BOLD functional MRI. IRM fonctionnelle BOLD Analyses individuelles Hétéroscédasticité Modèle linéaire généralisé Approches localement multivariées Approche a contrario Arterial Spin Labelling BOLD functional MRI Patient-specific analysis Heteroscedasticity General Linear Model Locally multivariate procedure A contrario approach
10	L’arbre de régression multivariable et les modèles linéaires généralisés revisités : applications à l’étude de la diversité bêta et à l’estimation de la biomasse d’arbres tropicaux Ouellette, Marie-Hélène 04 1900 (has links) En écologie, dans le cadre par exemple d’études des services fournis par les écosystèmes, les modélisations descriptive, explicative et prédictive ont toutes trois leur place distincte. Certaines situations bien précises requièrent soit l’un soit l’autre de ces types de modélisation ; le bon choix s’impose afin de pouvoir faire du modèle un usage conforme aux objectifs de l’étude. Dans le cadre de ce travail, nous explorons dans un premier temps le pouvoir explicatif de l’arbre de régression multivariable (ARM). Cette méthode de modélisation est basée sur un algorithme récursif de bipartition et une méthode de rééchantillonage permettant l’élagage du modèle final, qui est un arbre, afin d’obtenir le modèle produisant les meilleures prédictions. Cette analyse asymétrique à deux tableaux permet l’obtention de groupes homogènes d’objets du tableau réponse, les divisions entre les groupes correspondant à des points de coupure des variables du tableau explicatif marquant les changements les plus abrupts de la réponse. Nous démontrons qu’afin de calculer le pouvoir explicatif de l’ARM, on doit définir un coefficient de détermination ajusté dans lequel les degrés de liberté du modèle sont estimés à l’aide d’un algorithme. Cette estimation du coefficient de détermination de la population est pratiquement non biaisée. Puisque l’ARM sous-tend des prémisses de discontinuité alors que l’analyse canonique de redondance (ACR) modélise des gradients linéaires continus, la comparaison de leur pouvoir explicatif respectif permet entre autres de distinguer quel type de patron la réponse suit en fonction des variables explicatives. La comparaison du pouvoir explicatif entre l’ACR et l’ARM a été motivée par l’utilisation extensive de l’ACR afin d’étudier la diversité bêta. Toujours dans une optique explicative, nous définissons une nouvelle procédure appelée l’arbre de régression multivariable en cascade (ARMC) qui permet de construire un modèle tout en imposant un ordre hiérarchique aux hypothèses à l’étude. Cette nouvelle procédure permet d’entreprendre l’étude de l’effet hiérarchisé de deux jeux de variables explicatives, principal et subordonné, puis de calculer leur pouvoir explicatif. L’interprétation du modèle final se fait comme dans une MANOVA hiérarchique. On peut trouver dans les résultats de cette analyse des informations supplémentaires quant aux liens qui existent entre la réponse et les variables explicatives, par exemple des interactions entres les deux jeux explicatifs qui n’étaient pas mises en évidence par l’analyse ARM usuelle. D’autre part, on étudie le pouvoir prédictif des modèles linéaires généralisés en modélisant la biomasse de différentes espèces d’arbre tropicaux en fonction de certaines de leurs mesures allométriques. Plus particulièrement, nous examinons la capacité des structures d’erreur gaussienne et gamma à fournir les prédictions les plus précises. Nous montrons que pour une espèce en particulier, le pouvoir prédictif d’un modèle faisant usage de la structure d’erreur gamma est supérieur. Cette étude s’insère dans un cadre pratique et se veut un exemple pour les gestionnaires voulant estimer précisément la capture du carbone par des plantations d’arbres tropicaux. Nos conclusions pourraient faire partie intégrante d’un programme de réduction des émissions de carbone par les changements d’utilisation des terres. / In ecology, in ecosystem services studies for example, descriptive, explanatory and predictive modelling all have relevance in different situations. Precise circumstances may require one or the other type of modelling; it is important to choose the method properly to insure that the final model fits the study’s goal. In this thesis, we first explore the explanatory power of the multivariate regression tree (MRT). This modelling technique is based on a recursive bipartitionning algorithm. The tree is fully grown by successive bipartitions and then it is pruned by resampling in order to reveal the tree providing the best predictions. This asymmetric analysis of two tables produces homogeneous groups in terms of the response that are constrained by splitting levels in the values of some of the most important explanatory variables. We show that to calculate the explanatory power of an MRT, an appropriate adjusted coefficient of determination must include an estimation of the degrees of freedom of the MRT model through an algorithm. This estimation of the population coefficient of determination is practically unbiased. Since MRT is based upon discontinuity premises whereas canonical redundancy analysis (RDA) models continuous linear gradients, the comparison of their explanatory powers enables one to distinguish between those two patterns of species distributions along the explanatory variables. The extensive use of RDA for the study of beta diversity motivated the comparison between its explanatory power and that of MRT. In an explanatory perspective again, we define a new procedure called a cascade of multivariate regression trees (CMRT). This procedure provides the possibility of computing an MRT model where an order is imposed to nested explanatory hypotheses. CMRT provides a framework to study the exclusive effect of a main and a subordinate set of explanatory variables by calculating their explanatory powers. The interpretation of the final model is done as in nested MANOVA. New information may arise from this analysis about the relationship between the response and the explanatory variables, for example interaction effects between the two explanatory data sets that were not evidenced by the usual MRT model. On the other hand, we study the predictive power of generalized linear models (GLM) to predict individual tropical tree biomass as a function of allometric shape variables. Particularly, we examine the capacity of gaussian and gamma error structures to provide the most precise predictions. We show that for a particular species, gamma error structure is superior in terms of predictive power. This study is part of a practical framework; it is meant to be used as a tool for managers who need to precisely estimate the amount of carbon recaptured by tropical tree plantations. Our conclusions could be integrated within a program of carbon emission reduction by land use changes. Arbre de régression multivariable diversité bêta modèle linéaire généralisé recapture du carbone Beta diversity carbon recapture generalized linear models multivariate regression tree tropical tree biomass estimation

Search results