Global ETD Search

1	Détection de courts segments inversés dans les génomes - méthodes et applications Robelin, David 27 September 2005 (has links) (PDF) L'inversion de courts segments (moins de 1000 bases) est soupçonnée être un mécanisme majeur de l'évolution des génomes. Deux méthodes de détection ab initio de tels segments sont présentées. La séquence est modélisée par une chaîne de Markov $X^+$. La séquence inverse-complémentaire est alors également modélisée par une chaîne de Markov note $X^-$. Le premier chapitre présente de façon didactique les modèles de Markov utilisés en analyse de séquences génomiques. Une généralisation au cas d'un ordre supérieur à 1 d'un résultat sur la vitesse de convergence vers la distribution stationnaire est également établie. Le deuxième chapitre est consacré à l'étude du score local : $H_(n)=\max_(1\leq i \leq j \leq n)(Y_i+...+Y_j)$, pour une séquence $(Y_1,...,Y_n) \in \R^n$. La loi jointe asymptotique des $r$ plus grandes valeurs de score local est établie à l'aide de la théorie des valeurs extrêmes. Enfin, une démarche de test multiple permettant de choisir $r$ est proposée. Le troisième chapitre propose une statistique de détection fondée sur un rapport de vraisemblance (modèle $X^+$ contre modèle $X^-$) lorsque la longueur du segment retourné est connue. Une approche de type ``fenêtre glissante'' est ensuite appliquée. Une approximation connue de la loi du maximum de ce type de statistique est utilisée pour associer un degré de signification aux segments détectés. Dans le quatrième chapitre, le cas de recherche de segments de longueurs inconnues est traité à l'aide d'une méthode de type score local. Le cinquième chapitre présente l'application de ces méthodes à quelques génomes viraux. Un logiciel développé pour traiter cette problématique est également présenté. [SDV] Life Sciences [MATH] Mathematics chaîne de Markov analyse de séquence génétique score local inversion courte ``scan'' statistique
2	Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle Guedj, Mickael 13 July 2007 (has links) (PDF) Les avancées en Biologie Moléculaire ont accéléré le développement de techniques de génotypage haut-débit et ainsi permis le lancement des premières études génétiques d'association à grande échelle. La dimension et la complexité des données issues de ce nouveau type d'étude posent aujourd'hui de nouvelles perspectives statistiques et informatiques nécessaires à leur analyse, constituant le principal axe de recherche de cette thèse.<br />Après une description introductive des principales problématiques liées aux études d'association à grande échelle, nous abordons plus particulièrement les approches simple-marqueur avec une étude de puissance des principaux tests d'association, ainsi que de leur combinaisons. Nous considérons ensuite l'utilisation d'approches multi-marqueurs avec le développement d'une méthode d'analyse fondée à partir de la statistique du Score Local. Celle-ci permet d'identifier des associations statistiques à partir de régions génomiques complètes, et non plus des marqueurs pris individuellement. Il s'agit d'une méthode simple, rapide et flexible pour laquelle nous évaluons les performances sur des données d'association à grande échelle simulées et réelles. Enfin ce travail traite également du problème du test-multiple, lié aux nombre de tests à réaliser lors de l'analyse de données génétiques ou génomiques haut-débit. La méthode que nous proposons à partir du Score Local prend en compte ce problème. Nous évoquons par ailleurs l'estimation du Local False Discovery Rate à travers un simple modèle de mélange gaussien.<br />L'ensemble des méthodes décrites dans ce manuscrit ont été implémentées à travers trois logiciels disponibles sur le site du laboratoire Statistique et Génome : fueatest, LHiSA et kerfdr. [SDV] Life Sciences Génétique Statistique association déséquilibre de liaison épidémiologie score local test-multiple modèle de mélange puissance modélisation simulation Bioinformatique

Search results

Détection de courts segments inversés dans les génomes - méthodes et applications

Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle