81 |
Inférence spatio-temporelle en présence de valeurs extrêmesCompaore, Kiswendsida Julien 26 March 2024 (has links)
Titre de l'écran-titre (visionné le 10 octobre 2023) / Ce mémoire étudie les impacts qu'a une mauvaise spécification de la loi du champ aléatoire latent dans un modèle spatio-temporel. Précisement les impacts sur les estimations et l'inférence d'une mauvaise spécification dans un modèle Poisson log-normal spatio-temporel ont été investigués. La mauvaise spécification correspond à la présence de valeurs très extrêmes pour une distribution Poisson log-normale. Un modèle pour tenir compte de ces valeurs extrêmes a été proposé. L'amélioration des estimations avec ce modèle alternatif est mise en évidence par une étude de simulation Monte Carlo. L'ajustement des modèles impliqués dans cette étude fait intervenir des intégrations en grandes dimensions pour évaluer la vraisemblance. Le package R TMB met en oeuvre une solution, en l'occurence l'approximation de Laplace, à ce problème. / This thesis studies the impact of a misspecification of the latent random field distribution in a spatio-temporal model. Specifically, the impact on estimates and inference of misspecification in a space-time log-normal Poisson model has been investigated. The misspecification corresponds to the presence of very extreme values for a log-normal Poisson distribution. A model to account for these extreme values was proposed. The improvement in estimates with this alternative model is demonstrated by a Monte Carlo simulation study. The fitting of the models involved in this study involves high-dimensional integrations to evaluate the likelihood. The R package TMB implements a solution to this problem: the Laplace approximation.
|
82 |
Caractérisation statistique des propriétés du roc intact obtenues à partir d'essais de laboratoire pour deux projets miniers canadiensBoudreau, Catherine 21 June 2024 (has links)
La conception des ouvrages miniers souterrains repose sur une caractérisation géotechnique du massif rocheux. Lors des essais en laboratoire sur le roc intact, les données géotechniques sont amassées suivant les recommandations prescrites par la Société internationale de mécanique des roches (SIMR) (Brown, 1981). Bien que les essais en laboratoire sur le roc intact soient effectués selon les recommandations de la SIMR, ils ne sont pas réalisés d’une manière optimale quant au nombre de spécimens testés, à la localisation des essais, à la temporalité des essais, aux critères de rejet de certains spécimens testés et à l’utilisation des résultats dans la définition du critère de Hoek-Brown. Avec le coût élevé des essais en laboratoire, il est primordial d’optimiser les campagnes d’essais en laboratoire et de s’assurer d’utiliser et de maximiser l’information provenant des résultats tout en s’assurant de leur représentativité. À l’aide de deux études de cas réalisées sur des sites miniers québécois, ce mémoire a pour objectif global d’effectuer la caractérisation statistique de paramètres géomécaniques dans le but d’optimiser les campagnes d’essais et de de maximiser l’information obtenue par l’entremise d’essais en laboratoire sur le roc intact. Les analyses statistiques permettront de mieux quantifier la connaissance des propriétés du roc intact dans le cadre d’un projet minier. Elles permettront également d’optimiser le nombre d’essais à réaliser tout en s’assurant de la représentativité des résultats. Finalement, elles permettront d’identifier plus efficacement de nouvelles cibles de caractérisation.
|
83 |
Méthode d'analyse de l'association de sites de variants rares avec plusieurs traitsRochette, Mélissa 26 March 2024 (has links)
Titre de l'écran-titre (visionné le 23 octobre 2023) / Les études d'association pangénomique (genome-wide association studies (GWAS)) ont permis de trouver des associations entre des variants et des maladies. Certains sites de variants ont été observés comme associés avec plusieurs maladies simultanément. Ce phénomène se nomme la pléiotropie. Ce phénomène est d'importance pour les problèmes psychiatriques (P. H. Lee et al., 2020). Également, les associations spécifiques à un sexe entre une maladie et un variant sont un sujet d'importance dans les études récentes. Plusieurs méthodes ont été proposées pour identifier les effets pléiotropiques de sites de variants communs. Pour les sites de variants rares, la méthode MTAR de Luo et al. (2020) s'est montré plus efficace que les méthodes existantes. MTAR teste l'effet pléiotropique de gènes sur un ensemble de traits. Cette méthode permet de savoir si un site de variants rares, tel qu'un gène, est associé à plusieurs traits simultanément. Toutefois, MTAR ne permet pas de déterminer quel sous-ensemble de traits est associé avec ce variant. MTAR ne permet également pas de découvrir des effets spécifiques à un sexe. Nous proposons donc une nouvelle méthode statistique permettant de répondre à ces deux failles, soit 1) déterminer le sous-ensemble de traits ou maladies associées à un site de variants rares et 2) déterminer les effets spécifiques à un sexe pour un site de variants rares. Une analyse de simulation a été réalisée pour évaluer la sensibilité et la spécificité. Les résultats sont acceptables. Une étude avec des données réelles a été réalisée. Il s'agit de données cas-témoins génétiques avec des personnes atteintes de la schizophrénie, des personnes atteintes de la bipolarité et des personnes n'étant pas atteinte de l'une ou l'autre de ces maladies. Pour chacune des deux maladies, nous étudions les effets spécifiques selon le sexe des gènes composés de variants rares sur la probabilité d'avoir la maladie. Pour la schizophrénie, 113 gènes composés de SNPs rares sont significativement associés à cette maladie. Aucune association spécifique au sexe n'a été détecté. Pour la bipolarité, 171 gènes composés de SNPs rares sont associés significativement à cette maladie. Des associations spécifiques selon le sexe ont été détectées. 21 gènes sont associés à la bipolarité spécifiquement chez les individus de sexe féminin et 24 gènes, spécifiquement chez ceux de sexe masculin. / Genome-wide association studies (GWAS) have discovered associations between variants and diseases. Some variant sites have been observed to be associated with multiple diseases. This phenomenon is called pleiotropy. This phenomenon is of importance for psychiatric problems (P. H. Lee et al., 2020). Also, associations between a disease and a variant for a particular sex are a subject of importance in recent studies. Several statistical methods have been proposed to identify pleiotropic effects of common sites. For rare variant sites, the MTAR method of Luo et al. (2020) has been shown to be more efficient than existing methods. MTAR tests the pleiotropic effect of genes on multiple traits. MTAR allows us to know if a rare variant site, such as a gene, is associated with multiple trait simultaneously. However, MTAR does not allow us to determine which subset of traits is associated with this variant. MTAR also does not reveal gender specific effects. We therefore propose a new statistical method making it possible to respond to these two flaws, either 1) determining the subset of traits or diseases associated with a rare variant sites and 2) determining the sex-specific effect for rare variant sites on a disease or a trait. A simulation analysis was performed to assess sensitivity and specificity. The results are reasonable. A study with real data have been realised. These are case-control data with people with schizophrenia, people with bipolar disorder, and people without either of these conditions. For each of the two diseases, we studied the specific effects by sex of genes with rare SNPs on the probability to have the disease. For schizophrenia, 113 genes with rare SNPs are significantly associated with this disease. No gender specific association was detected. For bipolarity, 171 genes with rare SNPs are significantly associated with this disease. Specific associations by sex have been detected. 21 genes are associated with bipolarity specifically for female genders and 24 genes specifically for male genders.
|
84 |
La surveillance et les facteurs de risque associés au VIH au RwandaKayibanda, Jeanne Françoise 18 April 2018 (has links)
Les trois études présentées dans cette thèse portent sur 1) la comparaison de la prévalence du VIH mesurée par le programme de surveillance du VIH chez les femmes enceintes (surveillance sentinelle) et celle mesurée chez les femmes de la population générale en 2005, 2) l'analyse de l'utilité des données du programme de prévention de la transmission du VIH de la mère à l'enfant (PTME) pour la surveillance du VIH chez les femmes enceintes (données de 2007) et 3) l'analyse des liens entre les déterminants liés au genre et la séropositivité au VIH dans la population générale en 2005. Les trois études ont été conduites au Rwanda. En premier lieu, la prévalence mesurée par la surveillance sentinelle sous-estime significativement celle mesurée dans la population générale féminine dans les villes urbaines autres que la capitale (5% contre 7,7 %, p=0,008). La distribution différente des facteurs sociodémographiques dans les deux populations est la principale cause de la différence des prévalences du VIH constatée. En deuxième lieu, la prévalence du VIH mesurée par le programme de PTME sous-estime celle mesurée par la surveillance sentinelle (3,27 % contre 4,35 % p=0,03). La faible qualité des données du programme de PTME a été associée à la différence constatée. En troisième lieu, 29,2%; 22,2% et 12,4% des femmes en union ont respectivement rapporté avoir subi la violence physique, psychologique et sexuelle. Après ajustement pour les variables socio-démographiques et les facteurs de risque sexuels chez les femmes, le rapport de cote (RCajUsté) de l'infection à VIH était de 3,23 [Intervalle de confiance (IC) à 95% : 1,30-8,03] chez les femmes qui avaient un score allant de 3 à 4 sur l'échelle de la violence psychologique perpétrée par le partenaire. Le RCajUsté chez les femmes qui ont rapporté avoir été exposée à la violence interparentale était de 1,95 (IC à 95% : 1,11-3,43). La correction du biais de classement des femmes enceintes recrutées par la surveillance sentinelle dans les villes urbaines autres que la Capitale est nécessaire pour améliorer les estimations de prévalence du VIH réalisées par ce programme. La gestion et la qualité des données du programme de PTME doivent être améliorées avant de confier à ce programme l'activité de surveillance du VIH. Les interventions ciblant la réduction de la violence basée sur le genre devraient être intégrées dans les politiques de lutte contre le VIH/SIDA.
|
85 |
Schéma stepped wedge : modélisation et analyse de donnéesMessaoudi, Ghizlane 27 January 2024 (has links)
Ce mémoire a pour objectif principal de présenter des méthodes pour analyser les données provenant d'un essai clinique stepped wedge. On introduit des méthodes qui traitent les données individuelles ainsi que les données agrégées. Chaque méthode est illustrée avec des données provenant d'un essai clinique qui porte sur l'implantation d'un programme de formation à la prise de décision partagée dans une équipe interprofessionnelle. L'objectif secondaire de ce mémoire est d'évaluer la performance des tests de comparaison des deux traitements étudiés dans un stepped wedge à l'aide des méthodes de Monte Carlo. À cette n, des simulations ont été réalisées sous le logiciel R. Les résultats indiquent qu'il n'y a pas une méthode qui est supérieure à l'autre. Le choix de la méthode dépend du contexte de l'étude. / This research paper aims initially to present methods to analyse data from a stepped wedged clinical trial. We introduce methods that process both individual and aggregated data. Each method is exposed using data taken from a clinical trial based on the implementation of shared decision-making training program within an interprofessional team. As its secondary objective, this research paper provides a performance assessment on the comparison tests of two treatments studied within a stepped wedge using the Monte Carlo methods. On this note, simulations were executed using the R software. The results indicate that there is no method that is universally superior to the other. The choice of method depends on the context of the study
|
86 |
Stratégie d'échantillonnage des mesures LIBS in situ de la teneur en or dans des échantillons miniers : optimisation par analyse statistiqueNguegang Kamwa, Blandine 27 January 2024 (has links)
Au Québec, 19 mines d'or produisent plus de 1.8 milliard dollars canadiens d'or annuellement. Dans ces mines, des centaines d'échantillons de roches sont collectées quotidiennement, et envoyées au laboratoire afin de déterminer leurs concentrations en or. Étant donné que les résultats du laboratoire ne sont disponibles qu'après 24 à 48 heures, il s'en suit un impact direct négatif sur les activités minières. Les avancées technologiques des dernières années laissent croire que la spectroscopie sur plasma induite par laser (LIBS) pourrait constituer une technologie prometteuse pour mesurer en temps réel et in-situ, la teneur en or de la roche. Considérant la taille de chaque tir produit par le laser sur un échantillon de roche, à savoir 500 µm, de très nombreux tirs seront requis afin d'obtenir un résultat représentatif de l'échantillon analysé. À titre d'exemple, pour un échantillon de carotte de 50 cm de long, et une surface analysée comprise entre 70 et 80%, 10000 tirs lasers ont été effectués afin de s'assurer d'obtenir un résultat représentatif de l'échantillon, avec un temps d'acquisition d'une demi-journée en laboratoire, soit une durée trop longue pour une application pratique dans les mines. Pour cette raison, l'objectif de ce projet est de développer une stratégie afin de minimiser le nombre de tirs LIBS requis sur un échantillon à analyser, tout en demeurant représentatif de ce dernier, et ainsi obtenir une mesure fiable et précise de la teneur en or. Pour ce faire, une analyse statistique descriptive combinée à plusieurs motifs élaborés à partir des 10000 points de mesure est appliquée sur les données LIBS. En se fixant un compromis entre le nombre de tirs à réaliser sur un échantillon (roche) et le temps d'analyse, le motif défini « Boucle » minimise le mieux le nombre de tirs avec un temps d'analyse acceptable par une opération minière. À partir de ce dernier, un protocole d'échantillonnage a été élaboré, où pour être représentatif des échantillons de carottes, 1500 tirs sont nécessaires tandis que pour les échantillons de roches, seuls 100 tirs suffisent. Cependant, il serait important de pouvoir tester ce protocole d'échantillonnage sur plusieurs échantillons miniers afin de pouvoir valider ce dernier. / In Quebec, 19 gold mines produce more than C (dollar) 1.8 billion of gold annually. In these mines, hundreds of rock samples are collected daily and sent to the laboratory to determine their gold concentrations. Since laboratory results are only available after 24 to 48 hours, there is a direct negative impact on mining activities. Technological advances in recent years suggest that Laser Induced Breakdown Spectroscopy (LIBS) may be a promising technology for real-time and in-situ measurement of the gold content of rock samples. Considering the size of each shot produced by the laser on a rock sample, namely 500 µm, many shots will be required in order to obtain a representative result of the sample analyzed. For example, for a 50 cm long core sample, and a surface analyzed between 70 and 80%, 10,000 laser shots were fired to ensure to obtain a result representative of the sample, with an acquisition time of half a day in the laboratory, which is a too long period of time for a practical application in mines. For this reason, the objective of this project is to minimize the number of LIBS shots required on a sample to be analyzed, while remaining representative of the latter, and thus obtain a reliable and accurate measurement of the gold content. For this, a descriptive statistical analysis combined with several elaborate patterns is applied to the 10,000 LIBS data obtained. By setting a compromise between the number of shots to be made on a sample and the analysis time, the Loop pattern minimizes the number of shots with an acceptable analysis time. From the latter, a sampling protocol has been developed, where to be representative of core samples, 1500 shots are needed whereas for rock samples, only 100 shots are needed. However, it would be important to be
|
87 |
Consumptive Use of Water by Crops in ArizonaErie, L. J., French, Orrin F., Harris, Karl 09 1900 (has links)
Reprinted August 1968
|
88 |
Méthodes statistiques pour la mise en correspondance de descripteursCollier, Olivier 02 October 2013 (has links) (PDF)
De nombreuses applications, en vision par ordinateur ou en médecine notamment,ont pour but d'identifier des similarités entre plusieurs images ou signaux. On peut alors détecter des objets, les suivre, ou recouper des prises de vue. Dans tous les cas, les procédures algorithmiques qui traitent les images utilisent une sélection de points-clefs qu'elles essayent ensuite de mettre en correspondance par paire. Elles calculent pour chaque point un descripteur qui le caractérise, le discrimine des autres. Parmi toutes les procédures possibles,la plus utilisée aujourd'hui est SIFT, qui sélectionne les points-clefs, calcule des descripteurs et propose un critère de mise en correspondance globale. Dans une première partie, nous tentons d'améliorer cet algorithme en changeant le descripteur original qui nécessite de trouver l'argument du maximum d'un histogramme : en effet, son calcul est statistiquement instable. Nous devons alors également changer le critère de mise en correspondance de deux descripteurs. Il en résulte un problème de test non paramétrique dans lequel à la fois l'hypothèse nulle et alternative sont composites, et même non paramétriques. Nous utilisons le test du rapport de vraisemblance généralisé afin d'exhiber des procédures de test consistantes, et proposons une étude minimax du problème. Dans une seconde partie, nous nous intéressons à l'optimalité d'une procédure globale de mise en correspondance. Nous énonçons un modèle statistique dans lequel des descripteurs sont présents dans un certain ordre dans une première image, et dans un autre dans une seconde image. La mise en correspondance revient alors à l'estimation d'une permutation. Nous donnons un critère d'optimalité au sens minimax pour les estimateurs. Nous utilisons en particulier la vraisemblance afin de trouver plusieurs estimateurs consistants, et même optimaux sous certaines conditions. Enfin, nous nous sommes intéressés à des aspects pratiques en montrant que nos estimateurs étaient calculables en temps raisonnable, ce qui nous a permis ensuite d'illustrer la hiérarchie de nos estimateurs par des simulations
|
89 |
Développements récents sur l'estimation fonctionnelle par méthodes d'ondelettesChesneau, Christophe 03 April 2014 (has links) (PDF)
A ce jour, l'essentiel de mes travaux s'articule autour de l'estimation de fonctions inconnues émanant de phénomènes aléatoires. La richesse de ces phénomènes combinée avec l'amélioration constante des méthodes d'estimation nourrissent mon intérêt pour le sujet. J'ai toutefois choisi de me spécialiser dans les méthodes d'ondelettes. La principale raison est qu'elles bénéficient d'une grande faculté d'adaptation à la complexité du problème posé, tout en ayant des performances d'estimation remarquables. Cela est présenté dans la première partie de ce rapport. Les trois autres parties concernent trois de mes résultats les plus significatifs. En outre, ils sont applicables à une multitude de modèles statistiques, ouvrant ainsi un large champ d'applications, et améliorent certains aspects de résultats existants.
|
90 |
Méthode des réseaux en analyse de données, application à l'analyse de concordanceTricot, Jean-Marie 29 June 1990 (has links) (PDF)
Dans les différents domaines de la statistique descriptive, les données se présentent sous forme de nuages de points; sur ceux-ci, on est souvent amené à faire des études de proximité ou, plus généralement, de similarité, permettant de faire des analyses de structure. Il en est ainsi en analyse de concordance où il s'agit d'apprécier le degré d'accord entre d observateurs évaluant le même ensemble de n sujets au moyen d'une échelle de valeurs possibles prises par une variable (on peut généraliser le problème à plusieurs variables).
|
Page generated in 0.0164 seconds