Return to search

Chaînes de Markov régulées et approximation de Poisson pour l'analyse de séquences biologiques / Drifting Markov models and Poisson approximation for analysis of biological sequences

Cette thèse présente le développement, en vue de l'analyse statistique des séquences d'ADN, de nouveaux modèles permettant de prendre en compte l'hétérogénéité de ces séquences : les chaînes de Markov régulées (DMM pour drifting Markov model). Afin d'éviter l'homogénéité supposé par les modèles de Markov et de Markov cachés, nous permettons à la matrice de transition de varier du début à la fin de la séquence. A chaque position, nous avons une matrice de transition différente. Ces modèles peuvent être vus comme une alternative mais aussi comme un outil complémentaire aux modèles de Markov cachés. Nous avons considéré des dérives polynomiales ainsi que des dérives par splines polynomiales. Nous avons estimé nos modèles de multiples manières puis évalué la qualité de ces estimateurs avant de les utiliser en vue d'applications telle la recherche de mots exceptionnels. Nous avons mis en oeuvre le software DRIMM, dédié à l'estimation de nos modèles. / This document propose the conception, in the way of statistical analysis of DNA sequences, of new models which permit to take into account the heterogeneity of these sequences : the drifting Markov models (DMM). In order to avoid homogeneity of Markov models or hidden Markov models, we allow the transition matrix to vary from the beginning to the end of the sequence. At each position, we obtain a different transition matrix. DMM can be seen as a competitive model to the HMM one but it over all can be understood as a complementary tool: the hidden models of an HMM, usually fixed Markov chains can be replaced by DMM. Along this work, we consider polynomial drift or drift by polynomial splines. We estimate our models by different ways, evaluate their qualities and used them in biological applications such as the search of rare words. We develop the software DRIMM, dedicated to estimation of DMM.

Identiferoai:union.ndltd.org:theses.fr/2008EVRY0006
Date11 July 2008
CreatorsVergne, Nicolas
ContributorsEvry-Val d'Essonne, Prum, Bernard
Source SetsDépôt national des thèses électroniques françaises
LanguageFrench, English
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text, StillImage

Page generated in 0.0012 seconds