Return to search

Bio-statistical approaches to evaluate the link between specific nutrients and methylation patterns in a breast cancer case-control study nested within the European Prospective Investigation into Cancer and Nutrition (EPIC) study / Approches bio-statistiques pour évaluer le lien entre nutriments et profils de méthylation du cancer du sein dans l’étude prospective Européenne sur le Cancer et la Nutrition (EPIC)

De par les centaines de milliers de données qui les caractérisent, les bases de données épigénétiques représentent actuellement un défi majeur. L’objectif principal de cette thèse est d’évaluer la performance d’outils statistiques développés pour les données de grande dimension, en explorant l’association entre facteurs alimentaires reliés au cancer du sein (CS) et méthylation de l’ADN dans la cohorte EPIC.Afin d’étudier les caractéristiques des données de méthylation, l’identification des sources systématiques de variabilité des mesures de méthylation a été effectuée par la méthode de la PC-PR2. Ainsi la performance de trois techniques de normalisation, très répandues pour corriger la part de variabilité non désirée, a été évaluée en quantifiant l’entendu de variabilité attribuée aux facteurs de laboratoire avant et après chaque méthode de correction.Une fois la méthode de normalisation la plus appropriée identifiée, la relation entre le folate, l’alcool et la méthylation de l’ADN a été analysée par le biais de trois approches : une analyse individuelle des sites CpG, une analyse de DMR et la régression fused lasso. Les deux dernières méthodes visent à identifier des régions spécifiques de l’épigénome grâce aux corrélations possibles entre les sites proches. La méthylation globale a aussi été utilisée pour étudier la relation entre méthylation et risque de CS.Grâce à une évaluation exhaustive d’outils statistiques révélant la complexité des données de méthylation de l’ADN, cette thèse offre un aperçu instructif de connaissances pour les études épigénétiques, avec une possibilité d’application de méthodologie similaire aux analyses d’autres types de données -omiques / Epigenetics data are challenging sets characterized by hundreds of thousands of features. The main objective of this thesis was to evaluate the performance of some of the existing statistical methods to handle sets of large dimension data, exploring the association between dietary factors related to breast cancer (BC) and DNA methylation within the EPIC study.In order to investigate the characteristics of epigenetics data, the identification of random and systematic sources of variability of methylation measurements was attempted, via the principal component partial R-square (PC-PR2) method. Using this technique, the performance of three popular normalization techniques to correct for unwanted sources of variability was evaluated by quantifying epigenetics variability attributed to laboratory factors before and after the application of each correction method.Once a suitable normalization procedure was identified, the association between alcohol intake, dietary folate and methylation levels was examined by means of three approaches: an analysis of individual CpG sites, of differentially methylated regions (DMRs) and using fused lasso regression. The last two methods aim at the identification of specific regions of the epigenome using the potential correlation between neighboring CpG sites. Global methylation levels were used to investigate the relationship between methylation and BC risk.By performing an exhaustive evaluation of the statistical tools used to disclose complexity of DNA methylation data, this thesis provides informative insights for studies focusing on epigenetics, with promising potentials to apply similar methodology to the analysis of other -omics data

Identiferoai:union.ndltd.org:theses.fr/2018LYSE1146
Date13 September 2018
CreatorsPerrier, Flavie
ContributorsLyon, Ferrari, Pietro, Romieu, Isabelle
Source SetsDépôt national des thèses électroniques françaises
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text

Page generated in 0.002 seconds