Return to search

Sur les estimateurs doublement robustes avec sélection de modèles et de variables pour les données administratives

Les essais cliniques randomisés (ECRs) constituent la meilleure solution pour obtenir des effets causaux et évaluer l’efficacité des médicaments. Toutefois, vu qu’ils ne sont pas toujours réalisables, les bases de données administratives servent de solution de remplacement. Le sujet principal de cette thèse peut être divisée en deux parties, le tout, repartie en trois articles. La première partie de cette thèse traite de l’utilisation des estimateurs doublement robustes en inférence causale sur des bases de données administratives avec intégration des méthodes d’apprentissage automatique. Nous pouvons citer, par exemple, l’estimateur par maximum de vraisemblance ciblé (TMLE) et l’estimateur par augmentation de l’inverse de la probabilité de traitement (AIPTW). Ces méthodes sont de plus en plus utilisées en pharmaco-épidémiologie pour l’estimation des paramètres causaux, comme l’effet moyen du traitement. Dans la deuxième partie de cette thèse, nous développons un estimateur doublement robuste pour les données administratives et nous étendons une méthode existante pour l’ajustement du biais de sélection utilisant un échantillon probabiliste de référence. Le premier manuscrit de cette thèse présente un outil de diagnostic pour les analystes lors de l’utilisation des méthodes doublement robustes. Ce manuscrit démontre à l’aide d’une étude de simulation l’impact de l’estimation du score de propension par des méthodes flexibles sur l’effet moyen du traitement, et ce, en absence de positivité pratique. L’article propose un outil capable de diagnostiquer l’instabilité de l’estimateur en absence de positivité pratique et présente une application sur les médicaments contre l’asthme durant la grossesse. Le deuxième manuscrit présente une procédure de sélection de modificateurs d’effet et d’estimation de l’effet conditionnel. En effet, cet article utilise une procédure de régularisation en deux étapes et peut être appliqué sur plusieurs logiciels standards. Finalement, il présente une application sur les médicaments contre l’asthme durant la grossesse. Le dernier manuscrit développe une méthodologie pour ajuster un biais de sélection dans une base de données administratives dans le but d’estimer une moyenne d’une population, et ce, en présence d’un échantillon probabiliste provenant de la même population avec des co-variables communes. En utilisant une méthode de régularisation, il montre qu’il est possible de sélectionner statistiquement les bonnes variables à ajuster dans le but de réduire l’erreur quadratique moyenne et la variance. Cet article décrit ensuite une application sur l’impact de la COVID-19 sur les Canadiens. / Randomized clinical trials (RCTs) are the gold standard for establishing causal effects and
evaluating drug efficacy. However, RCTs are not always feasible and the usage of administrative
data for the estimation of a causal parameter is an alternative solution. The main
subject of this thesis can be divided into two parts, the whole comprised of three articles.
The first part studies the usage of doubly robust estimators in causal inference using
administrative data and machine learning. Examples of doubly robust estimators are Targeted
Maximum Likelihood Estimation (TMLE; [73]) and Augmented Inverse Probability of
Treatment Weighting (AIPTW; [51]). These methods are more and more present in pharmacoepidemiology
[65, 102, 86, 7, 37]. In the second part of this thesis, we develop a
doubly robust estimator and extend an existing one [121] for the setting of administrative
data with a supplemental probability sample. The first paper of this thesis proposes a diagnostic
tool that uses re-sampling methods to identify instability in doubly robust estimators
when using data-adaptive methods in the presence of near practical positivity violations. It
demonstrates the impact of machine learning methods for propensity score estimation when
near practical positivity violations are induced. It then describes an analysis of asthma medication
during pregnancy. The second manuscript develops a methodology to statistically
select effect modifying variables using a two stage procedure in the context of a single time
point exposure. It then describes an analysis of asthma medication during pregnancy. The
third manuscript describes the development of a variable selection procedure using penalization
for combining a nonprobability and probability sample in order to adjust for selection
bias. It shows that we can statistically select the right subset of the variables when the true propensity score model is sparse. It demonstrates the benefit in terms of mean squared error
and presents an application of the impact of COVID-19 on Canadians.

Identiferoai:union.ndltd.org:umontreal.ca/oai:papyrus.bib.umontreal.ca:1866/26977
Date10 1900
CreatorsBahamyirou, Asma
ContributorsSchnitzer, Mireille
Source SetsUniversité de Montréal
Languagefra
Detected LanguageFrench
Typethesis, thèse
Formatapplication/pdf

Page generated in 0.0019 seconds