Global ETD Search

11	Gestion de l'eau dans la culture de la sphaigne : nouvel indice de stress hydrique et modélisation du mouvement de l'eau dans les bassins de culture Gutierrez Pacheco, Sebastian 23 February 2024 (has links) Thèse ou mémoire avec insertion d'articles / La paludiculture sous forme de culture de sphaigne est définie comme la production durable de biomasse de sphaignes sur une base renouvelable et cyclique, souvent dans des tourbières ombrotrophes réaménagées. Il a été établi qu'un meilleur contrôle des paramètres hydrologiques, tels que la tension de l'eau dans la tourbe et la profondeur de la nappe phréatique, était l'un des facteurs clés pour obtenir un taux optimal de croissance des sphaignes. L'objectif du contrôle de ces paramètres hydrologiques est d'assurer un flux d'eau suffisant vers le capitule de la sphaigne pour soutenir sa croissance et son activité photosynthétique, qui est principalement produite dans cette partie de la plante. Cette thèse étudie la gestion de l'eau dans les bassins de production de sphaignes de manière à optimiser l'hydrologie du système de de culture, et en conséquence la croissance des sphaignes. Cette optimisation est notamment obtenue à travers la quantification du stress hydrique lié à la productivité des espèces de sphaigne et la modélisation du mouvement de l'eau dans les bassins de culture. Une première étape a été d'établir la relation entre la durée et la fréquence des stress hydriques et la croissance de la sphaigne. La compilation de cinq années de culture de sphaigne avec suivi de la croissance des mousses, à la fois dans des systèmes en tourbières réaménagées et dans des mésocosmes en serre, a été utilisée pour construire un ensemble de données couvrant une large variation de profondeurs de la nappe phréatique. Il convient préciser que dans les cultures de sphaigne sur des tourbières restaurées, le terme restauration fait référence à la gestion pour atteindre la ressemblance d'une condition antérieure. Cette étude appuie le constat que plus le stress hydrique est élevé, plus la productivité des espèces de sphaigne est faible. Dans le cadre de cette étude, le terme stress hydrique ou stress osmotique désigne le stress abiotique subi par une plante de sorte que le taux d'humidité des tissus végétaux est réduit à des niveaux sous-optimaux pour la photosynthèse. Avant de quantifier le stress hydrique, il faut connaître les profondeurs seuils de la nappe phréatique provoquant ces stress. Ces seuils changent entre les sous-genres d'espèces de sphaigne, étant plus élevé pour des espèces du sous-genre Acutifolia (Sphagnum flavicomans, Sphagnum fuscum et Sphagnum rubellum), suivi par le sous-genre Sphagnum (Sphagnum medium et Sphagnum papillosum) et ensuite par le sous-genre Cuspidata (Sphagnum fallax). Pour les systèmes de culture de sphaigne analysés, les profondeurs seuils de la nappe phréatique fluctuent entre 7 et 20 cm. Ces valeurs correspondent à des nappes plus élevées que celle rapportée dans la littérature pour la recolonisation des tourbières de sphaigne lors de projets de restauration, qui est de 40 cm, et ceci parce que dans la culture de sphaigne l'objectif est de maximiser la productivité, et pas seulement la survie des mousses à travers le temps. Une deuxième étude de ce projet de doctorat a été de quantifier le stress hydrique. Les indicateurs identifiés pour la quantification sont la somme des nappes journalières sous la profondeur de la nappe seuil identifiée (SEW) et nombre de jours où la nappe phréatique est sous la profondeur de la nappe seuil (NDW). Le SEW considère l'amplitude de la variation de la nappe phréatique et le NDW contemple la fréquence à laquelle la nappe phréatique se trouvait sous des profondeurs critiques pour la productivité des sphaignes. Toutefois, chacun de ces indicateurs nécessite des relevés quotidiens de la profondeur de la nappe phréatique. Cela étant dit, il est essentiel de disposer de relevés quotidiens de la nappe phréatique, ce qui n'est généralement pas le cas. Malgré cela, deux sources d'information sont utiles pour estimer la profondeur journalière : les relevés journaliers des puits de référence situés sur le même site, et les relevés manuelles disponibles qui sont collectées de façon hebdomadaire ou bimensuel pour tous les puits répartis sur le système de culture de sphaigne. Afin d'obtenir les valeurs quotidiennes de la nappe phréatique à partir de ces informations disponibles, des méthodes d'apprentissage automatique ont été identifiées et elles sont couramment utilisées dans ce type d'application. Ces méthodes permettent d'obtenir une erreur d'estimation allant jusqu'à 4.6 cm, ce qui, pour cette application, est une erreur majeure. Pour cette raison, il a également été décidé de développer une nouvelle méthode basée sur la décomposition des séries temporelles, et elle est la plus performante parmi toutes les méthodes utilisées avec une erreur d'estimation de moins de 3 cm et un coefficient de détermination de 0,95. L'un des grands avantages de cette méthode de décomposition des séries temporelles est qu'elle ne nécessite ni entraînement ni estimation des paramètres de calibration, ce qui permet une application facile non seulement dans la culture de sphaignes mais aussi dans les projets de tourbières remouillées. Cette étude a également permis d'évaluer la fréquence des mesures dans les puits manuels et son influence sur l'erreur d'estimation. La réduction de la fréquence des mesures d'une fréquence bimensuelle à une fréquence hebdomadaire entraîne une diminution de l'erreur de 16 % et l'augmentation à une fréquence mensuelle augmente l'erreur de 13 %. Autrement dit, par rapport aux mesures hebdomadaires, la fréquence mensuelle augmente l'erreur de 29 %. Le troisième focus de cette étude a été d'analyser les fluctuations de la nappe phréatique en fonction des caractéristiques physiques et hydrauliques du système et de l'écoulement souterrain estimé. À cette fin, un modèle a été développé sur la base de l'équation de Boussinesq et qui considère la stratification du milieu, tel que le profil de tourbe où la culture de la sphaigne est aménagée. La performance du modèle, qui prédit 91 % de la variation observée du niveau de la nappe phréatique, est le résultat de la combinaison de la mesure continue du niveau d'eau dans les canaux d'irrigation, les mesures sur place des précipitations, l'approximation de l'évapotranspiration par un modèle utilisant des mesures de la température et de la radiation extraterrestre, ainsi que les mesures in-situ de la conductivité hydraulique saturée par la méthode de la tarière manuelle en milieu stratifié. Un résultat important de ce chapitre est l'exploration de micro-canaux d'irrigation creusés dans un bassin déjà établie afin d'améliorer son hydrologie. Ces canaux de section rectangulaire de 20 cm x 20 cm, espacés de 10 m et reliés au canal périphérique principal, ont permis une amélioration du réseau hydraulique des canaux d'irrigation en réduisant l'espacement entre les canaux, qui était initialement de 20 m entre canaux périphériques. En somme, en plus de répondre spécifiquement à trois défis de la gestion de l'eau en culture de sphaigne, cette thèse fournit une compréhension améliorée du stress hydrique saisonnier chez les espèces de sphaigne, et une vision plus claire du mouvement des eaux souterraines dans les tourbières ombrotrophes réaménagées. Plusieurs des résultats illustrés dans cette thèse sont déjà appliqués dans les systèmes de culture de sphaigne de l'est du Canada. / Sphagnum farming or Sphagnum cultivation is defined as the sustainable production of Sphagnum biomass on a renewable and cyclical basis, often in restored ombrotrophic peatlands. Improved control of hydrological parameters, such as peat water tension and water table depth, has been identified as key factors in achieving optimal Sphagnum growth rates. The objective of controlling those hydrological parameters is to ensure sufficient water flow to the Sphagnum capitula to support its growth and photosynthetic activity, which is primarily occurring in this part of the plant. This thesis studies water management in Sphagnum production systems to optimize the hydrology of the cultivation basins, and consequently of Sphagnum growth. This optimization is achieved through the quantification of water stress related to the productivity of Sphagnum species and the modeling of the water movement in the cultivation basins. A first part of this study addresses the relationship between duration and frequency of water stress and Sphagnum growth. The data compilation of five years of Sphagnum farming monitoring the growth of the mosses, both in managed peatland systems and in greenhouses mesocosms, was used to construct a data set covering a wide variation in water table depths. It is worth pointing out that in the context of Sphagnum cultivation on restored peatlands, the term restored refers the practices to achieve the resemblance of a previous condition. This study reinforces the idea that the higher the water stress, the lower the productivity of Sphagnum species. In this study, the term water stress or osmotic stress refers to abiotic stress experienced by a plant and its tissue moisture content is reduced to suboptimal levels for photosynthesis. Before quantifying water stress, it is necessary to know the water table depth thresholds causing water stress. These thresholds depths of water table vary between subgenera of Sphagnum species, being highest for species tested within subgenus Acutifolia (Sphagnum flavicomans, Sphagnum fuscum et Sphagnum rubellum), followed by subgenus Sphagnum (Sphagnum medium and Sphagnum papillosum) and then by subgenus Cuspidata (Sphagnum fallax). For the Sphagnum farming systems analyzed, the thresholds depths of water table fluctuate between 7 and 20 cm. These values correspond to higher water tables than the ones reported in the literature for allowing good recovery of restored of bogs, which is 40 cm, and this is because in Sphagnum farming the objective is to maximize productivity, not just the survival of the mosses through time. A second area of study in this doctoral thesis was to quantify water stress. The indicators identified for quantification are the sum of daily water tables below the identified threshold depth of water table (SDW), and the number of days the water table is below the threshold depth (NDW). The SWE considers the magnitude of water table variation and the NDW contemplates frequency of water table being below the critical depths for Sphagnum productivity. However, each of these indicators requires daily water table depth records. Hence, the prerequisite of daily water table depths, which is generally not available. Despite of this, tow sources of information are useful for estimating daily depth: daily readings from reference wells located on the same site, and available manual readings that are collected on a weekly or bi-weekly basis for all wells distributed over the sphagnum growing system. To obtain daily water table depths from this available information, machine learning methods have been identified. These methods allow to obtain an estimation error up to 4.6 cm, which for this application we consider to be a major error. For this reason, it was also decided to develop a new method based on time series decomposition. This last method was the one that shown the best performance among the methods used with an estimation error of less than 3 cm and a coefficient of determination of 0.95. A major advantage of the new method is that it does not require training or estimation of calibration parameters, which allows easy application not only in Sphagnum farming but also in rewetted peatland initiatives. This study also evaluated the influence of the frequency of measuring the water table depth in the wells to be estimated on the estimation error. Reducing the measurement frequency from bimonthly to weekly results in a 16% decrease in error and increasing to monthly increases the error by 13%. In other words, compared to weekly measurements, monthly frequency increases the error by 29%. The third focus of this study was to analyze the fluctuations of the water table depth as a function of the physical and hydraulic characteristics of the system and the estimated groundwater flow. For this purpose, a model was developed based on the Boussinesq equation and which considers the stratification of the media, such as the peat profile where Sphagnum moss is grown. The performance of the model, which predicts 91% of the observed variation of the water table, is the result of the combination of continuous measurement of the water level in the irrigation canals, on-site measurements of precipitation, approximation of evapotranspiration by a model using field measurements of temperature and extraterrestrial radiation, and in-situ measurements of saturated hydraulic conductivity by using the auger hole method in stratified media. An important outcome of this chapter is the implementation of micro irrigation channels dug in an already established Sphagnum farming basin to improve its hydrology. These micro shallow channels, with a rectangular cross-section of 20 cm x 20 cm were spaced 10 m apart and connected to the main peripheral channel. These have allowed and improvement of the hydraulic network of irrigation channels by reducing the spacing between channels, which was initially 20 m apart. In short, in addition to specifically addressing three water management challenges in Sphagnum culture, this thesis provides an improved understanding of seasonal water stress in Sphagnum species, and a clearer understanding of groundwater movement in rehabilitated ombrotrophic peatlands. Many of the results illustrated in this thesis are already being applied in Sphagnum farming systems in eastern Canada. Tourbières ombrotrophes Sphaignes -- Croissance. Biomasse végétale. Sphaignes -- Besoins en eau. Tourbières -- Réhabilitation. Niveau hydrostatique -- Mesure. Série chronologique.
12	Characterising non-stand replacing disturbances and predicting growth rates of Canadian forests using satellite imagery Morin-Bernard, Alexandre 11 January 2024 (has links) Titre de l'écran-titre (visionné le 10 janvier 2024) / La composition en espèces et la structure des écosystèmes forestiers sont le résultat d'interactions complexes entre les processus de recrutement, de croissance et de mortalité, influencés par les conditions environnementales. Les changements actuels du climat, combinés à l'augmentation de la fréquence et de l'intensité des perturbations, engendrent de l'incertitude quant à la productivité des forêts canadiennes dans le futur. Face à cette incertitude, il devient impératif d'adopter des pratiques d'aménagement forestier axées sur l'atténuation des risques, afin d'assurer le maintien des services écologiques offerts par ses écosystèmes, tout en répondant aux besoins en ressources de la société. Dans ce contexte, une prise de décision éclairée nécessite des informations précises et à jour sur l'état des forêts canadiennes. Historiquement, notre connaissance de l'état des forêts reposait sur les inventaires forestiers réalisés dans les provinces et territoires canadiens, qui fournissent des informations sur la disponibilité de la ressource, sa qualité et le rendement attendu. Les perturbations plus fréquentes et la réaction variable des forêts aux changements dans les conditions de croissance rendent toutefois difficile une évaluation complète et précise de la situation des forêts par l'intermédiaire des données issues des réseaux de placettes-échantillon. Les informations contenues dans les cernes de croissance des arbres permettent de mieux comprendre l'influence du climat et des perturbations sur la croissance. Toutefois, les limites imposées par la disponibilité de ces données et l'impossibilité de les collecter en continu sur l'ensemble du territoire forestier rendent leur utilisation peu pratique pour un suivi en temps réel de l'état des forêts. Ces défis peuvent toutefois être relevés par un recours accru aux technologies de télédétection. Les séries temporelles d'imagerie satellitaire, en particulier, fournissent une information en continu sur l'état des forêts, permettant la détection des perturbations ainsi que des changements graduels causés par l'action de stress climatiques. Alors que la plupart des études précédentes sur le sujet se sont principalement concentrées sur la détection et la cartographie de ces changements, peu d'attention a été accordée à la compréhension des causes sous-jacentes et à la quantification de leur impact sur la croissance forestière. Pourtant, ces informations sont cruciales pour mieux prévoir les conséquences des perturbations et des stress induits par le climat, puisque des réductions de croissance prononcées peuvent indiquer une mortalité imminente. Des données précises sur la croissance des forêts sont également essentielles pour une prise de décision éclairée en ce qui concerne les calendriers de récolte et les interventions sylvicoles. L'objectif général de ce projet de recherche était de caractériser l'impact des perturbations partielles et de fournir des informations spatialement explicites sur la croissance des forêts canadiennes en intégrant les données de séries temporelles Landsat et des données collectées sur le terrain. Les deux premiers chapitres de cette thèse ont exploré l'influence des perturbations partielles sur l'état de la canopée forestière et sur la croissance des peuplements affectés, en utilisant des données de placettes-échantillon permanentes et des carottes d'accroissement récoltées dans divers écosystèmes forestiers. Le troisième chapitre a intégré des mesures répétées de placettes-échantillon permanentes et des séries temporelles Landsat pour estimer le taux de croissance annuel net d'une forêt boréale en l'absence de perturbation. Les résultats présentés dans les trois chapitres de cette thèse montrent que des modèles statistiques basés sur des séries temporelles Landsat et calibrés à l'aide de mesures de placettes-échantillon permanentes ou de données de cernes annuels permettent de mesurer la croissance des forêts ainsi que les changements provoqués par des perturbations partielles. L'intégration d'autres sources de données de télédétection telles que le LiDAR facilite l'application des méthodes utilisant l'imagerie satellitaire dans un contexte d'aménagement forestier et permet de prendre en compte de l'influence de facteurs biophysiques et écologiques qui ne peut être captée par l'imagerie satellitaire. Les méthodes et approches proposées dans cette thèse ont le potentiel d'être étendues à un plus large éventail de biomes forestiers en tirant parti de bases de données existantes, améliorant ainsi notre capacité à suivre l'état des forêts canadiennes dans un contexte de changements climatiques. / The species composition and structure of forest ecosystems are shaped by complex interactions between biotic and abiotic drivers that influence recruitment, growth, and mortality processes. Current climate changes, along with the increasing frequency and intensity of disturbances, introduce uncertainty about the future productivity and vigour of Canadian forests. In the face of such uncertainty, adopting forest management practices centred on stewardship and risk mitigation becomes imperative to preserve ecosystem functions while addressing society's resource demands. In this context, informed decision-making requires up to date and accurate information about the condition of Canadian forests. Historically, our knowledge on forest condition relied on field inventories conducted across all provinces and territories, providing information on resource availability, quality, and expected yield. However, intensified disturbances and the variable growth response of forests to climate change make it challenging to comprehensively assess forest situations through sample plot networks. While tree ring data is highly valuable, collecting such data consistently across Canadian forests is impractical. Addressing the challenges of assessing temporal and spatial changes in forest condition can be achieved through remote sensing technologies. Satellite imagery time series, in particular, offer continuous information on forest conditions for detecting disturbances and gradual ecosystem changes. While previous studies primarily focused on detecting and mapping disturbances and related changes in forest condition, less emphasis was given to understanding the underlying causes and quantifying their impact on forest growth. This information is yet critical to forecast the impacts of disturbances and climate-induced physiological stress, as growth declines can indicate imminent mortality. Accurate forest growth data is also crucial for making informed decisions regarding harvest schedules and silvicultural interventions. The general objective of this research project was to characterise the impact of non-stand replacing disturbances and provide spatially explicit information on forest growth across Canadian forests by integrating Landsat time series and field data. The first two chapters of this thesis explored the influence of non-stand replacing disturbances on forest canopy condition and growth rates, using data from permanent sample plots and increment cores collected in diverse forest ecosystems. The third chapter incorporated repeated measurements from permanent sample plots and Landsat time series to estimate the annual net forest growth rate in boreal forests in the absence of disturbance. The results presented in the three thesis chapters demonstrate that statistical models involving Landsat time series and calibrated using permanent sample plot measurements or tree-ring data can effectively assess canopy and forest structure changes caused by non-stand replacing disturbances and measure forest growth under both disturbance and undisturbed conditions. Integrating other remote sensing data sources like LiDAR enhances the applicability of these methods in forest management contexts and allows accounting for the effect of biophysical and ecological factors not captured solely by satellite imagery. The approaches proposed in this thesis have potential for expansion to cover a broader range of forest biomes by leveraging existing datasets, enhancing our ability to monitor Canadian forests response to climate change. Arbres -- Croissance. Perturbations écologiques. LANDSAT (Satellites de télédétection) Inventaires forestiers. Forêts -- Dynamique. Forêts Série chronologique.
13	An approach to set bounds on AEP forecasts : development evaluation and application to inventory control Lefrançois, Pierre, Lefrançois, Pierre 27 March 2024 (has links) Comprend un sommaire et un résumé en français. / « La thèse présente le développement, la validation et l'application en gestion des inventaires d'une approche à la génération de bornes pour des prévisions obtenues à l'aide du filtre AEP de Carbone et Longini. L'approche s'appuie sur un algorithme d'estimation des paramètres d'un modèle de prévision AEP qui pénalise les sur-prévisions ou les sous-prévisions. La pénalité imposée est déterminée par une heuristique non-paramétrique. L'approche est validée à l'aide d'une expérience de Monte-Carlo et d'une expérimentation sur des séries réelles. L'intégration de règles de gestion des inventaires dans l'approche est par la suite analysée lorsque divers critères de gestion sont utilisés. La thèse se termine sur un aperçu des extensions envisagées de l'approche à d'autres méthodes et modèles de prévision. »--Page xiv HF91.5 UL 1982 L495 Processus stochastiques. Série chronologique.
14	Le prix du risque idiosyncrasique : une analyse en séries temporelles et coupe transversale Desrosiers, Maxime 02 February 2024 (has links) Le CAPM est une représentation stylisée de la rentabilité attendue des titres sur les marchés boursiers, mais comme plusieurs des hypothèses centrales du modèle ne tiennent pas lors d’analyses empiriques, sa pertinence en ce qui a trait aux paramètres prisés sur les marchés est limitée. L’objectif de ce mémoire est d’analyser s’il y a présence d’une prime de risque idiosyncrasique, de mesurer celle-ci et de voir si elle a un pouvoir explicatif significatif. Nous trouvons que les titres ayant les plus hauts risques idiosyncrasiques obtiennent des rendements le mois suivant de 1,18 à 1,98 point de pourcentage inférieur aux titres les moins risqués. En contrôlant pour la capitalisation boursière, l’effet persiste et le risque idiosyncrasique semble être un meilleur prédicteur du rendement d’une firme que la taille de celle-ci. Aversion pour le risque. Série chronologique.
15	Modélisation et prévision de la consommation horaire d'électricité au Québec : comparaison de méthodes de séries temporelles Tatsa, Sylvestre 20 April 2018 (has links) Ce travail explore la dynamique de consommation résidentielle d’électricité au Québec à l’aide de données horaires fournies par Hydro-Québec pour la période de janvier 2006 à décembre 2010. Nous considérons trois modèles autorégressifs standards en analyse des séries temporelles : le lissage exponentiel Holt-Winters, le modèle ARIMA saisonnier (SARIMA) et le modèle ARIMA saisonnier avec variables exogènes (SARIMAX). Pour ce dernier modèle, nous nous concentrons sur l’effet des variables climatiques (la température, l’humidité relative et le point de rosé et la nébulosité). Les facteurs climatiques ont un impact important sur la consommation d’électricité à très court terme. La performance prédictive intra et hors échantillon de chaque modèle est évaluée avec différents indicateurs d’ajustement. Trois horizons temporels hors-échantillon sont testés : 24 heures (un jour), 72 heures (trois jours) et 168 heures (1 semaine). Le modèle SARIMA offre la meilleure performance prédictive hors-échantillon sur 24 heures. Le modèle SARIMAX se révèle le plus performant hors-échantillon sur les horizons temporels de 72 et 168 heures. Des recherches supplémentaires seraient nécessaires pour obtenir des modèles de prévision pleinement satisfaisant du point de vue méthodologique. Mots clés : modèles de séries temporelles, électricité, lissage exponentiel, SARIMA, SARIMAX. Mots clés : modèles de séries temporelles, électricité, lissage exponentiel, SARIMA, SARIMAX / This work explores the dynamics of residential electricity consumption in Quebec using hourly data from January 2006 to December 2010. We estimate three standard autoregressive models in time series analysis: the Holt-Winters exponential smoothing, the seasonal ARIMA model (SARIMA) and the seasonal ARIMA model with exogenous variables (SARIMAX). For the latter model, we focus on the effect of climate variables (temperature, relative humidity and dew point and cloud cover). Climatic factors have a significant impact on the short-term electricity consumption. The intra-sample and out-of-sample predictive performance of each model is evaluated with various adjustment indicators. Three out-of-sample time horizons are tested: 24 hours (one day), 72 hours (three days) and 168 hours (1 week). The SARIMA model provides the best out-of-sample predictive performance of 24 hours. The SARIMAX model reveals the most powerful out-of-sample time horizons of 72 and 168 hours. Additional research is needed to obtain predictive models fully satisfactory from a methodological point of view. Keywords: modeling, electricity, Holt-Winters, SARIMA, SARIMAX. HB 31.5 UL 2014 Autorégression (Statistique) Série chronologique Lissage (Analyse numérique)
16	Essays on Social Networks and Time Series with Structural Breaks Houndetoungan, Elysée Aristide 27 January 2024 (has links) Cette thèse, structurée en trois (03) essais, développe de nouveaux modèles économétriques pour l'analyse des interactions sociales et des séries temporelles. Le premier chapitre (coécrit avec le Professeur Vincent Boucher) étudie une méthode d'estimation des effets de pairs à travers les réseaux sociaux lorsque la structure du réseau n'est pas observée. Nous supposons que nous connaissons (avons une estimation convergente de) la distribution du réseau. Nous montrons que cette hypothèse est suffisante pour l'estimation des effets de pairs en utilisant un modèle linéaire en moyennes. Nous proposons un estimateur de variables instrumentales et un estimateur bayésien. Nous présentons et discutons des exemples importants où notre méthodologie peut être appliquée. Nous présentons également une application avec la base de données Add Health largement utilisée et qui comporte de nombreux liens non observés. Nous estimons un modèle des effets de pairs sur la réussite scolaire des élèves. Nous montrons que notre estimateur bayésien reconstruit les liens manquants et permet d'obtenir une estimation valide des effets de pairs. En particulier, nous montrons qu'ignorer les liens manquants sous-estime l'effet endogène des pairs sur la réussite scolaire. Dans le deuxième chapitre, je présente un modèle structurel des effets de pairs dans lequel la variable dépendante est de type comptage (nombre de cigarettes fumées, fréquence des visites au restaurant, fréquence de participation aux activités). Le modèle est basé sur un jeu statique à information incomplète dans lequel, les individus interagissent à travers un réseau dirigé et sont influencés par leur croyance sur la décision de leurs pairs. Je présente des conditions suffisantes sous lesquelles l'équilibre du jeu est unique. Je montre que l'utilisation du modèle spatial autorégressif (SAR) linéaire-en-moyennes ou du modèle Tobit SAR pour estimer les effets de pairs sur des variables de comptage générées à partir du jeu sous-estime asymptotiquement les effets de pairs. Le biais d'estimation diminue lorsque la dispersion de la variable de comptage augmente. Je propose également une application empirique. J'estime les effets de pairs sur le nombre d'activités parascolaires auxquelles les étudiants sont inscrits. En contrôlant l'endogénéité du réseau, je trouve que l'augmentation du nombre d'activités dans lesquelles les amis d'un étudiant sont inscrits d'une unité implique une augmentation du nombre d'activités dans lesquelles l'étudiant est inscrit de 0,295. Je montre également que les effets de pairs sont sous-estimés à 0,150 lorsqu'on ignore la nature de comptage de la variable dépendante. Le troisième chapitre (coécrit avec le Professeur Arnaud Dufays et le Professeur Alain Coen) présente une approche de modélisation de séries temporelles. Les processus avec changements structurels sont une approche flexible pour modéliser des longues séries chronologiques. En considérant un modèle linéaire en moyennes, nous proposons une méthode qui relâche l'hypothèse selon laquelle une cassure structurelle dans une série temporelle implique un changement de tous les paramètres du modèle. Pour ce faire, nous estimons d'abord les dates de cassures potentielles présentées par la série, puis nous utilisons une régression pénalisée pour détecter les paramètres du modèle qui changent à chaque date de cassure. Étant donné que certains segments de la régression peuvent être courts, nous optons pour une fonction de pénalité(presque) non biaisée, appelée fonction de pénalité seamless-L0(SELO). Nous montrons que l'estimateur SELO détecte de manière convergente les paramètres qui varient à chaque cassure et nous proposons d'utiliser un algorithme de maximisation d'espérance de recuit déterministe (DAEM) pour traiter la multimodalité de la fonction objectif. Étant donné que la fonction de pénalité SELO dépend de deux paramètres, nous utilisons un critère pour choisir les meilleurs paramètres et par conséquent le meilleur modèle. Ce nouveau critère présente une interprétation bayésienne qui permet d'évaluer l'incertitude des paramètres ainsi que l'incertitude du modèle. Les simulations de Monte Carlo montrent que la méthode fonctionne bien pour de nombreux modèles de séries temporelles, y compris des processus hétéroscédastiques. Pour un échantillon de 14 stratégies de hedge funds (HF), utilisant un modèle de tarification basé sur l'actif, nous mettons en exergue la capacité prometteuse de notre méthode à détecter la dynamique temporelle des expositions au risque ainsi qu'à prévoir les rendements HF. / This dissertation, composed of three (03) separate chapters, develops new econometric models for peer effects analysis and time series modelling. The first chapter (a joint work with Professor Vicent Boucher) studies a method for estimating peer effects through social networks when researchers do not observe the network structure. We assume that researchers know (a consistent estimate of) the distribution of the network. We show that this assumption is sufficient for the estimation of peer effects using a linear-in-means model. We propose an instrumental variables estimator and a Bayesian estimator. We present and discuss important examples where our methodology can be applied. We also present an application with the widely used Add Health database which presents many missing links. We estimate a model of peer effects on students' academic achievement. We show that our Bayesian estimator reconstructs these missing links and leads to a valid estimate of peer effects. In particular, we show that disregarding missing links underestimates the endogenous peer effect on academic achievement. In the second chapter, I present a structural model of peer effects in which the dependent variable is counting (Number of cigarettes smoked, frequency of restaurant visits, frequency of participation in activities). The model is based on a static game with incomplete information in which individuals interact through a directed network and are influenced by their belief over the choice of their peers. I provide sufficient conditions under which the equilibrium of the game is unique. I show that using the standard linear-in-means spatial autoregressive (SAR) model or the SAR Tobit model to estimate peer effects on counting variables generated from the game asymptotically underestimates the peer effects. The estimation bias decreases when the range of the dependent counting variable increases. I estimate peer effects on the number of extracurricular activities in which students are enrolled. I find that increasing the number of activities in which a student's friends are enrolled by one implies an increase in the number of activities in which the student is enrolled by 0.295, controlling for the endogeneity of the network. I also show that the peer effects are underestimated at 0.150 when ignoring the counting nature of the dependent variable. The third chapter (a joint work with Professor Arnaud Dufays and Professor Alain Coen) presents an approach for time series modelling. Change-point (CP) processes are one flexible approach to model long time series. Considering a linear-in-means models, we propose a method to relax the assumption that a break triggers a change in all the model parameters. To do so, we first estimate the potential break dates exhibited by the series and then we use a penalized likelihood approach to detect which parameters change. Because some segments in the CP regression can be small, we opt for a (nearly) unbiased penalty function, called the seamless-L0 (SELO) penalty function. We prove the consistency of the SELO estimator in detecting which parameters indeed vary over time and we suggest using a deterministic annealing expectation-maximisation (DAEM) algorithm to deal with the multimodality of the objective function. Since the SELO penalty function depends on two tuning parameters, we use a criterion to choose the best tuning parameters and as a result the best model. This new criterion exhibits a Bayesian interpretation which makes possible to assess the parameters' uncertainty as well as the model's uncertainty. Monte Carlo simulations highlight that the method works well for many time series models including heteroskedastic processes. For a sample of 14 Hedge funds (HF) strategies, using an asset based style pricing model, we shed light on the promising ability of our method to detect the time-varying dynamics of risk exposures as well as to forecast HF returns. Biais cognitifs.
17	Prévision adaptative et désaisonnalisation par le filtre AEP de Carbone-Longini Bilongo, Robert, Bilongo, Robert 27 March 2024 (has links) « Nous avons présenté dans cette étude une nouvelle méthodologie pour l'étude des phénomènes saisonniers, basée sur l'approche AEP de Carbone-Longini. On retrouve en général dans la littérature deux réponses aux problèmes posés par la saisonnalité des séries chronologiques: un effort de modélisation en vue de la prévision, et la désaisonnalisation pour fin d'interprétation. Nous avons présenté une nouvelle modélisation, GUNIAEP pour les séries chronologiques, dans laquelle la variation systématique est expliquée par une évaluation associée au long terme, au court terme et à la saisonnalité respectivement. Le modèle est estimé par le filtre adaptatif AEP, et les paramètres en vigueur au dernier point, origine de prévision, servent à calculer les valeurs extrapolées. L'observation de ce modèle sur plusieurs exemples nous a permis de voir qu'il permet de reconnaître l'existence et l'ampleur des variations saisonnières à l'aide des coefficients saisonniers. Cette propriété permet de simplifier la phase d'identification qui peut facilement être programmée, tout en fournissant une performance satisfaisante. C'est dans ces conditions que nous avons appliqué le modèle, pour comparer sa précision à celle des méthodes reconnues les plus précises. Cette comparaison s'est faite sur un échantillon de 111 séries, et a révélé que cette méthode était très compétitive, si non la meilleure. Cette nouvelle formulation est donc meilleure que le modèle auto-régressif simple qui avait initialement exploité le filtre AEP. La robustesse des coefficients saisonniers nous a ensuite encouragés à utiliser ce modèle pour dériver une nouvelle méthode de désaisonnalisation: DESAEP. Une interprétation appropriée des composantes a permis de développer une heuristique pour décomposer une série chronologique en composantes saisonnière, irrégulière et tendance-cycle, puis fournir une série désaisonnalisée. Une étude empirique sur 33 séries réelles impliquant les méthodes Xll-ARIMA et SIGEX a permis de voir que dans le long terme les séries désaisonnalisées produites par DESAEP ne seront pas très différentes de celles des autres méthodes, cependant les différences sont plus fortes pour les valeurs les plus récentes. On a vu que généralement, l'ampleur des révisions augmente avec le niveau de bruit existant dans la série, mais qu'en utilisant DESAEP, ces révisions sont d'une ampleur nettement inférieure à celles produites par les deux autres méthodes. »--Pages i-ii HF91.5 UL 1983 B599 Carbone, Robert. Longini, Richard L. Série chronologique. Analyse multivariée.
18	Forecasting air passenger traffic flows in Canada : an evaluation of time series models and combination methods Bougas, Constantinos 19 April 2018 (has links) Ces quinze dernières années, le transport aérien a connu une expansion sans précédent au Canada. Cette étude fournit des prévisions de court et moyen terme du nombre de passagers embarqués\débarqués au Canada en utilisant divers modèles de séries chronologiques : la régression harmonique, le lissage exponentiel de Holt-Winters et les approches dynamiques ARIMA et SARIMA. De plus, elle examine si la combinaison des prévisions issues de ces modèles permet d’obtenir une meilleure performance prévisionnelle. Cette dernière partie de l’étude se fait à l’aide de deux techniques de combinaison : la moyenne simple et la méthode de variance-covariance. Nos résultats indiquent que les modèles étudiés offrent tous une bonne performance prévisionnelle, avec des indicateurs MAPE et RMSPE inférieurs à 10% en général. De plus, ils capturent adéquatement les principales caractéristiques statistiques des séries de passagers. Les prévisions issues de la combinaison des prévisions des modèles particuliers sont toujours plus précises que celles du modèle individuel le moins performant. Les prévisions combinées se révèlent parfois plus précises que les meilleures prévisions obtenues à partir d’un seul modèle. Ces résultats devraient inciter le gouvernement canadien, les autorités aéroportuaires et les compagnies aériennes opérant au Canada à utiliser des combinaisons de prévisions pour mieux anticiper l’évolution du traffic de passager à court et moyen terme. Mots-Clés : Passsagers aériens, Combinaisons de prévisions, Séries temporelles, ARIMA, SARIMA, Canada. / This master’s thesis studies the Canadian air transportation sector, which has experienced significant growth over the past fifteen years. It provides short and medium term forecasts of the number of enplaned/ deplaned air passengers in Canada for three geographical subdivisions of the market: domestic, transborder (US) and international flights. It uses various time series forecasting models: harmonic regression, Holt-Winters exponential smoothing, autoregressive-integrated-moving average (ARIMA) and seasonal autoregressive-integrated-moving average (SARIMA) regressions. In addition, it examines whether or not combining forecasts from each single model helps to improve forecasting accuracy. This last part of the study is done by applying two forecasting combination techniques: simple averaging and a variety of variance-covariance methods. Our results indicate that all models provide accurate forecasts, with MAPE and RMSPE scores below 10% on average. All adequately capture the main statistical characteristics of the Canadian air passenger series. Furthermore, combined forecasts from the single models always outperform those obtained from the single worst model. In some instances, they even dominate the forecasts from the single best model. Finally, these results should encourage the Canadian government, air transport authorities, and the airlines operating in Canada to use combination techniques to improve their short and medium term forecasts of passenger flows. Key Words: Air passengers, Forecast combinations, Time Series, ARIMA, SARIMA, Canada. HB 31.5 UL 2013 Série chronologique
19	Spectral factor model for time series learning Alexander Miranda, Abhilash 24 November 2011 (has links) Today's computerized processes generate<p>massive amounts of streaming data.<p>In many applications, data is collected for modeling the processes. The process model is hoped to drive objectives such as decision support, data visualization, business intelligence, automation and control, pattern recognition and classification, etc. However, we face significant challenges in data-driven modeling of processes. Apart from the errors, outliers and noise in the data measurements, the main challenge is due to a large dimensionality, which is the number of variables each data sample measures. The samples often form a long temporal sequence called a multivariate time series where any one sample is influenced by the others.<p>We wish to build a model that will ensure robust generation, reviewing, and representation of new multivariate time series that are consistent with the underlying process.<p><p>In this thesis, we adopt a modeling framework to extract characteristics from multivariate time series that correspond to dynamic variation-covariation common to the measured variables across all the samples. Those characteristics of a multivariate time series are named its 'commonalities' and a suitable measure for them is defined. What makes the multivariate time series model versatile is the assumption regarding the existence of a latent time series of known or presumed characteristics and much lower dimensionality than the measured time series; the result is the well-known 'dynamic factor model'.<p>Original variants of existing methods for estimating the dynamic factor model are developed: The estimation is performed using the frequency-domain equivalent of the dynamic factor model named the 'spectral factor model'. To estimate the spectral factor model, ideas are sought from the asymptotic theory of spectral estimates. This theory is used to attain a probabilistic formulation, which provides maximum likelihood estimates for the spectral factor model parameters. Then, maximum likelihood parameters are developed with all the analysis entirely in the spectral-domain such that the dynamically transformed latent time series inherits the commonalities maximally.<p><p>The main contribution of this thesis is a learning framework using the spectral factor model. We term learning as the ability of a computational model of a process to robustly characterize the data the process generates for purposes of pattern matching, classification and prediction. Hence, the spectral factor model could be claimed to have learned a multivariate time series if the latent time series when dynamically transformed extracts the commonalities reliably and maximally. The spectral factor model will be used for mainly two multivariate time series learning applications: First, real-world streaming datasets obtained from various processes are to be classified; in this exercise, human brain magnetoencephalography signals obtained during various cognitive and physical tasks are classified. Second, the commonalities are put to test by asking for reliable prediction of a multivariate time series given its past evolution; share prices in a portfolio are forecasted as part of this challenge.<p><p>For both spectral factor modeling and learning, an analytical solution as well as an iterative solution are developed. While the analytical solution is based on low-rank approximation of the spectral density function, the iterative solution is based on the expectation-maximization algorithm. For the human brain signal classification exercise, a strategy for comparing similarities between the commonalities for various classes of multivariate time series processes is developed. For the share price prediction problem, a vector autoregressive model whose parameters are enriched with the maximum likelihood commonalities is designed. In both these learning problems, the spectral factor model gives commendable performance with respect to competing approaches.<p><p>Les processus informatisés actuels génèrent des quantités massives de flux de données. Dans nombre d'applications, ces flux de données sont collectées en vue de modéliser les processus. Les modèles de processus obtenus ont pour but la réalisation d'objectifs tels que l'aide à la décision, la visualisation de données, l'informatique décisionnelle, l'automatisation et le contrôle, la reconnaissance de formes et la classification, etc. La modélisation de processus sur la base de données implique cependant de faire face à d’importants défis. Outre les erreurs, les données aberrantes et le bruit, le principal défi provient de la large dimensionnalité, i.e. du nombre de variables dans chaque échantillon de données mesurées. Les échantillons forment souvent une longue séquence temporelle appelée série temporelle multivariée, où chaque échantillon est influencé par les autres. Notre objectif est de construire un modèle robuste qui garantisse la génération, la révision et la représentation de nouvelles séries temporelles multivariées cohérentes avec le processus sous-jacent.<p><p>Dans cette thèse, nous adoptons un cadre de modélisation capable d’extraire, à partir de séries temporelles multivariées, des caractéristiques correspondant à des variations - covariations dynamiques communes aux variables mesurées dans tous les échantillons. Ces caractéristiques sont appelées «points communs» et une mesure qui leur est appropriée est définie. Ce qui rend le modèle de séries temporelles multivariées polyvalent est l'hypothèse relative à l'existence de séries temporelles latentes de caractéristiques connues ou présumées et de dimensionnalité beaucoup plus faible que les séries temporelles mesurées; le résultat est le bien connu «modèle factoriel dynamique». Des variantes originales de méthodes existantes pour estimer le modèle factoriel dynamique sont développées :l'estimation est réalisée en utilisant l'équivalent du modèle factoriel dynamique au niveau du domaine de fréquence, désigné comme le «modèle factoriel spectral». Pour estimer le modèle factoriel spectral, nous nous basons sur des idées relatives à la théorie des estimations spectrales. Cette théorie est utilisée pour aboutir à une formulation probabiliste, qui fournit des estimations de probabilité maximale pour les paramètres du modèle factoriel spectral. Des paramètres de probabilité maximale sont alors développés, en plaçant notre analyse entièrement dans le domaine spectral, de façon à ce que les séries temporelles latentes transformées dynamiquement héritent au maximum des points communs.<p><p>La principale contribution de cette thèse consiste en un cadre d'apprentissage utilisant le modèle factoriel spectral. Nous désignons par apprentissage la capacité d'un modèle de processus à caractériser de façon robuste les données générées par le processus à des fins de filtrage par motif, classification et prédiction. Dans ce contexte, le modèle factoriel spectral est considéré comme ayant appris une série temporelle multivariée si la série temporelle latente, une fois dynamiquement transformée, permet d'extraire les points communs de façon fiable et maximale. Le modèle factoriel spectral sera utilisé principalement pour deux applications d'apprentissage de séries multivariées :en premier lieu, des ensembles de données sous forme de flux venant de différents processus du monde réel doivent être classifiés; lors de cet exercice, la classification porte sur des signaux magnétoencéphalographiques obtenus chez l'homme au cours de différentes tâches physiques et cognitives; en second lieu, les points communs obtenus sont testés en demandant une prédiction fiable d'une série temporelle multivariée étant donnée l'évolution passée; les prix d'un portefeuille d'actions sont prédits dans le cadre de ce défi.<p><p>À la fois pour la modélisation et pour l'apprentissage factoriel spectral, une solution analytique aussi bien qu'une solution itérative sont développées. Tandis que la solution analytique est basée sur une approximation de rang inférieur de la fonction de densité spectrale, la solution itérative est basée, quant à elle, sur l'algorithme de maximisation des attentes. Pour l'exercice de classification des signaux magnétoencéphalographiques humains, une stratégie de comparaison des similitudes entre les points communs des différentes classes de processus de séries temporelles multivariées est développée. Pour le problème de prédiction des prix des actions, un modèle vectoriel autorégressif dont les paramètres sont enrichis avec les points communs de probabilité maximale est conçu. Dans ces deux problèmes d’apprentissage, le modèle factoriel spectral atteint des performances louables en regard d’approches concurrentes. / Doctorat en Sciences / info:eu-repo/semantics/nonPublished Informatique générale Sciences exactes et naturelles Time-series analysis -- Data processing Multivariate analysis -- Data processing Série chronologique -- Informatique Analyse multivariée -- Informatique Time Series Analysis Machine Learning Spectral Factor Model
20	Essays on time series forecasting with neural-network or long-dependence autoregressive models and macroeconomic news effects on bond yields Nongni Donfack, Morvan 13 December 2023 (has links) Cette thèse, organisée en trois chapitres, porte sur la modélisation et la prévision des séries chronologiques économiques et financières. Les deux premiers chapitres proposent de nouveaux modèles économétriques pour l'analyse des données économiques et financières en relaxant certaines hypothèses irréalistes habituellement faites dans la littérature. Le chapitre 1 développe un nouveau modèle de volatilité appelé TVP[indice ANN]-GARCH. Ce modèle offre une dynamique riche pour modéliser les données financières en considérant une structure GARCH (Generalized autoregressive conditional heteroscedasticity) dans laquelle les paramètres varient dans le temps selon un réseau de neurones artificiels (ANN). L'utilisation des ANNs permet de résoudre le problème de l'évaluation de la vraisemblance (présent dans les modèles à paramètres variables dans le temps (TVP)) et permet également l'utilisation de variables explicatives supplémentaires. Le chapitre développe également un algorithme Monte Carlo séquentiel (SMC) original et efficace pour estimer le modèle. Une application empirique montre que le modèle se compare favorablement aux processus de volatilité populaires en termes de prévisions de court et de long terme. L'approche peut facilement être étendue à tout modèle à paramètres fixes. Le chapitre 2 développe trois polynômes de retard autorégressifs (AR) parcimonieux qui génèrent des fonctions d'autocorrélation à décroissance lente, comme on l'observe généralement dans les séries chronologiques financières et économiques. La dynamique des polynômes de retard est similaire à celle de deux processus très performants, à savoir le modèle MSM (Multifractal Markov-Switching) et le modèle FHMV (Factorial Hidden Markov Volatility). Ils sont très flexibles car ils peuvent être appliqués à de nombreux modèles populaires tels que les processus ARMA, GARCH et de volatilité stochastique. Une analyse empirique met en évidence l'utilité des polynômes de retard pour la prévision de la moyenne conditionnelle et de la volatilité. Ils devraient être considérés comme des modèles de prévision alternatifs pour les séries chronologiques économiques et financières. Le dernier chapitre s'appuie sur une approche de régression prédictive en deux étapes pour identifier l'impact des nouvelles macroéconomiques américaines sur les rendements obligataires de trois petites économies ouvertes (Canada, Royaume-Uni et Suède). Nos résultats suggèrent que les nouvelles macroéconomiques américaines sont significativement plus importantes pour expliquer la dynamique de la courbe des taux dans les petites économies ouvertes (PEO) que les nouvelles nationales elles-mêmes. Les nouvelles relatives à la politique monétaire américaine ne sont pas les seuls facteurs importants des variations des rendements obligataires des PEO, mais les nouvelles relatives au cycle économique jouent également un rôle significatif. / This thesis, organized in three chapters, focuses on modelling and forecasting economic and financial time series. The first two chapters propose new econometric models for analysing economic and financial data by relaxing unrealistic assumptions usually made in the literature. Chapter 1 develops a new volatility model named TVP[subscript ANN]-GARCH. The model offers rich dynamics to model financial data by allowing for a generalized autoregressive conditional heteroscedasticity (GARCH) structure in which parameters vary over time according to an artificial neural network (ANN). The use of ANNs for parameters dynamics is a valuable contribution as it helps to deal with the problem of likelihood evaluation (exhibited in time-varying parameters (TVP) models). It also allows for the use of additional explanatory variables. The chapter develops an original and efficient Sequential Monte Carlo sampler (SMC) to estimate the model. An empirical application shows that the model favourably compares to popular volatility processes in terms of out-of sample fit. The approach can easily be extended to any fixed-parameters model. Chapter 2 develops three parsimonious autoregressive (AR) lag polynomials that generate slowly decaying autocorrelation functions as generally observed financial and economic time series. The dynamics of the lag polynomials are similar to that of two well performing processes, namely the Markov-Switching Multifractal (MSM) and the Factorial Hidden Markov Volatility (FHMV) models. They are very flexible as they can be applied in many popular models such as ARMA, GARCH, and stochastic volatility processes. An empirical analysis highlights the usefulness of the lag polynomials for conditional mean and volatility forecasting. They could be considered as forecasting alternatives for economic and financial time series. The last chapter relies on a two steps predictive regression approach to identify the impact of US macroeconomic releases on three small open economies (Canada, United Kingdom, and Sweden) bond yields at high and low frequencies. Our findings suggest that US macro news are significantly more important in explaining yield curve dynamics in small open economies (SOEs) than domestic news itself. Not only US monetary policy news are important drivers of SOEs bond yield changes, but business cycle news also play a significant role. Volatilité stochastique. Réseaux neuronaux (Informatique) Série chronologique. Analyse de régression. États-Unis -- Conditions économiques

Search results