Return to search

Population prevalence of diabetes: validation of a case definition from health administrative data using a population-based survey and home blood glucose sampling

Background: Previous validation studies of diabetes case definitions from health administrative data are scarce and have not systematically assessed undiagnosed diabetes. We aimed to determine the accuracy of a diabetes case definition (two physician claims or one hospitalization for diabetes, within a two-year period; Canadian National Diabetes Surveillance System, NDSS) using a systematic review of the published literature and by comparing cases identified from the Quebec health services administrative databases to those obtained from self-report, respectively. We also estimated the prevalence of physician-diagnosed diabetes by self-report in a health survey, and undiagnosed diabetes by measuring glucose levels on mailed-in capillary blood samples.Methods: For the systematic review, we searched Medline (from 1950) and Embase (from 1980) databases for relevant validation studies published through August 2012 (keywords: "diabetes mellitus", "administrative databases" and "validation studies"). Reviewers abstracted study data and assessed quality using standardized forms. As there was heterogeneity, a random-effects bivariate regression model was used to pool sensitivity and specificity estimates. To determine the accuracy of the NDSS case definition from the Quebec health services administrative databases, we obtained administrative data on a stratified random sample of 6,247 Quebec individuals (2009) whom we surveyed by telephone to query diabetes status and asked them to mail-in fasting capillary blood samples to a central laboratory for glucose testing. The NDSS case definition was compared with self-reported diabetes alone and with self-reported diabetes and/or elevated glucose level (≥7 mmol/l) for sensitivity, specificity, positive and negative predictive values, and statistical agreement. Population-level prevalence was estimated using the NDSS definition, corrected based on sensitivity and specificity estimates and sampling weights. In addition, we added the Quebec validation study to the meta-analysis and reported the final test properties of the NDSS case definition.Results: The search strategy identified 1423 abstracts among which 11 studies were deemed relevant and reviewed; 6 of these reported sensitivity and specificity allowing pooling in a meta-analysis. Compared to surveys or medical records, sensitivity was 82.3% (95%CI 75.8, 87.4) and specificity was 97.9% (95%CI 96.5, 98.8). NDSS-based diabetes cases obtained from the Quebec health administrative databases compared to self-report revealed a sensitivity of the NDSS case definition of 84.3% (95%CI 79.3, 88.5) and specificity of 97.9% (95%CI 97.4, 98.4). Compared to self-report combined with glucose testing, sensitivity was 58.2% (95%CI 52.2, 64.6) and specificity was 98.7% (95%CI 98.0, 99.3). Adjusted for sampling weights, physician-diagnosed diabetes prevalence in Quebec was 7.2% (95%CI 6.3, 8.0) and total diagnosed and undiagnosed diabetes prevalence was 13.4% (95%CI 11.7, 15.0).Conclusion: Including the Quebec study in an updated meta-analysis of 7 studies, the pooled sensitivity of the NDSS case definition was 82.6% (95%CI 77.1, 87.0) and specificity was 97.9% (95%CI 96.8, 98.6) for physician-diagnosed diabetes. The NDSS case definition is sufficiently accurate for surveillance purposes, in particular monitoring trends over time. The definition however misses approximately one fifth of physician-diagnosed cases and approximately 40% of those diagnosed and undiagnosed; it wrongly identifies diabetes in around 2% of the general population. Individuals with undiagnosed diabetes are likely to have a delay in diabetes treatment which implies a higher risk for diabetes-related complications. Diabetes prevalence estimated from health services administrative databases should be adjusted for the sensitivity and specificity of the case definition to better quantify yearly prevalence changes and account for undiagnosed diabetes. / Contexte: Les études qui valident les cas de diabète identifiés à partir des données administratives sont limitées et n'évaluent pas systématiquement le diabète non diagnostiqué. Nous avons mené une revue systématique pour déterminer la validité d'un algorithme utilisé pour identifier les cas de diabète (deux facturations de médecins ou une hospitalisation pour le diabète, pendant une période de deux ans; Système National de Surveillance du Diabète du Canada, SNSD). Nous avons aussi validé cet algorithme dans les bases de données du Québec en comparaison avec des données obtenues à partir d'une enquête publique. En plus, nous avons estimé la prévalence du diabète diagnostiqué à partir des données d'une enquête publique ainsi que la prévalence du diabète non diagnostiqué à partir du taux de la glycémie mesurée en utilisant des échantillons sanguins envoyés par la poste.Méthodes: Pour la revue systématique, nous avons effectué une recherche dans les bases de données de Medline (de 1950) et Embase (de 1980) pour les études de validation publiées jusqu'en Août 2012 (mots-clés: «diabetes mellitus», «administrative databases» et «validation studies»). Un modèle de régression bi-variée aux effets aléatoires a été utilisé pour regrouper des estimations de sensibilité et de spécificité. Pour la validation de l'algorithme dans les bases de données du Québec, nous avons obtenu des données administratives relatives à un échantillon aléatoire stratifié de 6247 résidents du Québec (2009). Ces individus ont été aussi interrogés au téléphone et ont été invités à envoyer à un laboratoire central des échantillons de sang prélevés à jeun. Les cas de diabète du SNSD ont été comparés avec ceux du diabète auto-déclaré par le patient et avec l'auto-déclaration en conjonction avec une glycémie élevée (≥ 7 mmol/l), respectivement. La sensibilité, spécificité, les valeurs prédictives positives et négatives, et la concordance statistique ont été calculées. La prévalence du diabète dans la population a été estimée en utilisant la définition ajustée en fonction des estimations de la sensibilité et de la spécificité.Résultats: Dans la revue systématique, la stratégie de recherche a identifié 1,423 résumés desquels 11 études de validation ont été choisies pour la revue. Six études ont été regroupées dans une méta-analyse. En comparaison aux données des enquêtes et/ou des dossiers médicaux, la sensibilité était de 82,3% (IC 95%, 75,8, 87,4%) et la spécificité était de 97,9% (IC 95%: 96,5, 98,8%). Pour la validation de la définition dans les banques de données du Québec, la comparaison avec les données obtenues à partir de l'enquête a montré une sensibilité de 84,3% (IC 95%: 79,3, 88,5) et une spécificité de 97,9% (IC 95%: 97,4, 98,4). La comparaison avec les données de l'enquête combinées aux taux de glycémie, a montré une sensibilité beaucoup plus faible de 58,2% (IC 95% 52,2, 64,6) et une spécificité de 98,7% (IC 95%: 98,0, 99,3). Après ajustement pour le poids d'échantillonnage, la prévalence du diabète diagnostiqué était de 7,2% (IC 95% 6,3, 8,0) et la prévalence du diabète diagnostiqué et non-diagnostiqué était de 13,4% (IC 95% 11.7, 15.0).Conclusion: Incluant l'étude du Québec dans une méta-analyse actualisée des 7 études, la sensibilité de la définition de cas de diabète diagnostiqué était de 82,6% (IC 95%, 77.1, 87.0) et la spécificité était de 97,9% (IC 95%: 96,8, 98,6). La définition semble être suffisamment précise pour une surveillance en santé publique, en particulier pour les analyses de tendance. Les personnes non-diagnostiqués sont susceptibles de subir un retard dans le traitement et d'encourir un risque plus élevé pour les complications liées au diabète. La prévalence du diabète estimée à partir des banques de données administrative doit être corrigée pour la sensibilité et la spécificité de la définition afin de mieux quantifier les changements annuels de prévalence et de tenir compte des cas de diabète non diagnostiqués.

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.116891
Date January 2013
CreatorsLeong, Aaron
ContributorsElham Rahme (Internal/Supervisor), Kaberi Dasgupta (Internal/Cosupervisor2)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageMaster of Science (Department of Epidemiology and Biostatistics)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.0031 seconds