Return to search

Predicting transmission of tuberculosis from patient attributes

Background: A newly diagnosed tuberculosis (TB) case can be classified as: 1) a source case for transmission leading to other, secondary active TB cases; 2) a secondary case, resulting from recent transmission; or 3) an isolated case, uninvolved in recent transmission (i.e. neither source nor recipient). Accurate classification of newly diagnosed patients should help public health personnel to direct TB control activities. Objective: To aid prevention of TB transmission through effective management of newly diagnosed TB cases, a multinomial logistic regression model was developed to estimate the probability of a new case being one of three classes (i.e., source, secondary, isolated) based on the case's clinical and socio-demographic data, such as age, HIV status, and chest X-ray result. Methods: Attributes of TB cases reported on the island of Montreal between 1996 and 2007 were multiply imputed and used to fit the model. DNA fingerprint analysis was used as the reference standard to define the dependent variable of the model. Variable selection was performed by Bayesian Model Averaging, and 10 repeats of 10-fold cross-validation were performed on each of the imputed datasets to measure the predictive performance of the model using the Area Under the Receiver Operating Curve (AUC). Results: A total of 1552 cases, comprised of 107(6.9%) source cases, 207(13.4%) secondary cases, and 1238 (79.8%) isolated cases, were available to develop the model. AUC of the model to discriminate source, secondary, and isolated case was 0.59 (95% CI: 0.54, 0.65), 0.64 (95% CI: 0.62, 0.67), and 0.65 (95% CI: 0.63, 0.67), respectively. Conclusion: The performance of the prediction model was significantly better than random prediction. Further study is needed to assess its ability to improve TB control in public health practice. / Contexte : Un cas de tuberculose nouvellement diagnostiqué peut être classifié en tant que 1) cas source menant à la transmission à d'autres cas actifs, secondaires; 2) cas secondaire, résultant d'une récente transmission; ou 3) cas isolé, non impliqué dans une récente transmission (c.-à.-d. ni source ni destinataire). Objectif : Afin de faciliter la gestion de la transmission de la tuberculose, un modèle basé sur une régression logistique multinomiale a été développé pour estimer la probabilité qu'un nouveau cas appartienne à l'une des trois classes, en fonction de sescaractéristiques cliniques et socio-démographiques tels que l'âge, la condition HIV et les résultats d'une radiographie pulmonaire. Méthodes : Les caractéristiques des cas de tuberculose rapportés sur l'Ile de Montréal entre 1996 et 2007 ont été utilisées pour l'ajustement du modèle, après avoir subi une imputation multiple. L'analyse des empreintes génétiques a été utilisée en tantque norme de référence pour définir la variable dépendante du modèle. La sélection de variables a été effectuée à l'aide de la technique BMA (Bayesian Model Averaging), et 10 validations croisées (10-fold) ont été exécutées sur chacun des jeux de données imputés afin de mesurer la performance prédictive du modèle, correspondant à l'AUC (Area Under the Receiver Operating Curve). Résultats : Un total de 1552 cas admissibles, comprenant 107 (6.9%) cas sources, 207 (13.4%) cas secondaires, et 1238 (79.8%) cas isolés ont été utilisés pour la création du modèle. L'AUC du modéle, donc sa capacité à distinguer les cas sources, secondaires et isolés est de 0.59 (95% IC: 0.54, 0.65), 0.64 (95% IC: 0.62, 0.67), and 0.65 (95%IC: 0.63, 0.67), respectivement. Conclusion: La performance du modèle est significativement supérieure à celle d'une prédiction aléatoire. Une étude plus approfondie serait nécessaire afin d'évaluer sa capacité à améliorer la gestion de la tuberculose dans un contexte pratique.

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.106586
Date January 2012
CreatorsMamiya, Hiroshi
ContributorsDavid Buckeridge (Supervisor)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageMaster of Science (Department of Epidemiology & Biostatistics)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.0082 seconds