Return to search

A Bayesian approach to the statistical interpretation of DNA evidence

This dissertation sets forth a foundation for a continuous model for the interpretation of DNA mixture evidence. We take a new approach to modelling electropherogram data by modelling the actual electropherogram as a curve rather than modelling the allelic peak areas under the curve. This shift allows us to retain all the data available and to bypass the approximation of peak areas by GeneMapper R (Applied Biosystems, 2003). The two problems associated with the use of this programme - prohibitive costs and patented processes - are thus avoided. / To establish a model for electropherogram data, we explore two Bayesian wavelet approaches to modelling functions (Chipman et al., 1997 ; M. Clyde et al., 1998) as well as a Bayesian Adaptive Regression Splines approach (DiMatteo et al., 2001). Furthermore, we establish our own genotyping algorithm, once again circumventing the need for GeneMapper R, and obtain posterior probabilities for the resulting genotypes. / With a model in place for single-source DNA samples, we develop an algorithm that deconvolves a two-person mixture into its separate components and provides the posterior probabilities for the resulting genotype combinations. / In addition, because of the widely recognized need to perform further research on continuous models in mixture interpretation and the difficulty in obtaining the necessary data to do so (due to privacy laws and laboratory restrictions), a tool for simulating realistic data is of the utmost importance. PCRSIM (Gill et al., 2005) is the most popular simulation software for this purpose. We propose a method for refining the parameter estimates used in PCRSIM in order to simulate more accurate data. / Cette dissertation établit les fondations nécessaires à la création d'un modèle continu servant à l'interprétation des échantillons d'ADN à sources multiples (mélanges). Nous prenons une nouvelle approche de la modélisation des données d'´electrophérogrammes en modélisant l'électrophérogramme en tant que courbe plutôt que de modéliser l'aire sous la courbe des sommets alléliques. Cette approche nous permet de conserver toutes les données disponibles et d'éviter l'estimation de l'aire sous la courbe au moyen de GeneMapper R (Applied Biosystems, 2003). Deux problèmes associés à l'utilisation de ce programme - des coûts prohibitifs et une procédure brevetée - sont ainsi évités. / Afin d'établir un modèle pour les données d'électrophérogramme, nous explorons deux approches bayésiennes pour la modélisation des fonctions par ondelettes (Chipman et al., 1997 ; M. Clyde et al., 1998) de même qu'une approche connue sous le nom de Bayesian Adaptive Regression Splines (DiMatteo et al., 2001). De plus, nous élaborons notre propre algorithme pour l'analyse des génotypes, nous permettant, encore une fois, d'éviter GeneMapper R, et d'obtenir les probabilités postérieures des génotypes résultants. / À l'aide d'un modèle d'échantillon d'ADN à source unique, nous développons un algorithme qui divise un échantillon de deux personnes en ses composantes séparées et estime les probabilités postérieures des différentes combinaisons possibles de génotype. / De plus, en raison des lacunes dans la littérature sur les modèles continus pour l'analyse d'échantillons d'ADN à sources multiples et de la difficulté à obtenir les données n´ecessaire pour l'effectuer (en raison des lois sur la protection de la vie privée et des restrictions en laboratoire), un outil qui simule des données réalistes est de la plus grande importance. PCRSIM (Gill et al., 2005) est un outil qui permet de répondre à ce besoin. Par cet outil, nous proposons une méthode pour raffiner les estimations des paramètres afin de simuler des données plus précises.

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.92221
Date January 2010
CreatorsMaimon, Geva
ContributorsJames Curran (Internal/Cosupervisor2), Russell Steele (Internal/Supervisor)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageDoctor of Philosophy (Department of Mathematics and Statistics)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.0018 seconds