Dans le domaine de l'oncogénomique, l'un des axes actuels de recherche est l'identification de nouveaux marqueurs génétiques permettant entre autres de construire des règles prédictives visant à classer les patients selon le risque d'apparition d'un événement d'intérêt (décès ou récidive tumorale). En présence de telles données de haute dimension, une première étape de sélection parmi l'ensemble des variables candidates est généralement employée afin d'identifier les marqueurs ayant un intérêt explicatif jugé suffisant. Une question récurrente pour les biologistes est le choix de la règle de sélection. Dans le cadre de l'analyse de survie, les approches classiques consistent à ranger les marqueurs génétiques à partir du risque relatif ou de quantités issues de test statistiques (p-value, q-value). Cependant, ces méthodes ne sont pas adaptées à la combinaison de résultats provenant d'études hétérogènes dont les tailles d'échantillons sont très différentes.Utiliser un indice tenant compte à la fois de l'importance de l'effet pronostique et ne dépendant que faiblement de la taille de l'échantillon permet de répondre à cette problématique. Dansce travail, nous proposons un nouvel indice de capacité de prédiction afin de sélectionner des marqueurs génomiques ayant un impact pronostique sur le délai de survenue d'un évènement.Cet indice étend la notion de pseudo-R2 dans le cadre de l'analyse de survie. Il présente également une interprétation originale et intuitive en terme de " séparabilité ". L'indice est tout d'abord construit dans le cadre du modèle de Cox, puis il est étendu à d'autres modèles plus complexes à risques non-proportionnels. Des simulations montrent que l'indice est peu affectée par la taille de l'échantillon et la censure. Il présente de plus une meilleure séparabilité que les indices classiques de la littérature. L'intérêt de l'indice est illustré sur deux exemples. Le premier consiste à identifier des marqueurs génomiques communs à différents types de cancers. Le deuxième, dans le cadre d'une étude sur le cancer broncho-pulmonaire, montre l'intérêt de l'indice pour sélectionner des facteurs génomiques entraînant un croisement des fonctions de risques instantanés pouvant être expliqué par un effet " modulateur " entre les marqueurs. En conclusion, l'indice proposé est un outil prometteur pouvant aider les chercheurs à identifier des listes de gènes méritant des études plus approfondies.
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00718743 |
Date | 30 March 2011 |
Creators | Rouam, Sigrid Laure |
Publisher | Université Paris Sud - Paris XI |
Source Sets | CCSD theses-EN-ligne, France |
Language | French |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0019 seconds