• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 3
  • 1
  • Tagged with
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Apprentissage statistique pour l'intégration de données omiques / Statistical learning for omics data integration

Mariette, Jérôme 15 December 2017 (has links)
Les avancées des nouvelles techniques de séquençage ont permis de produire des données hétérogènes, volumineuse, de grande dimension et à différentes échelles du vivant. L'intégration de ces différentes données représente un défi en biologie des systèmes, défi qu'il est critique d'aborder pour tirer le meilleur parti possible de l'accumulation d'informations biologiques pour leur interprétation et leur exploitation dans un but finalisé. Cette thèse regroupe plusieurs contributions méthodologiques utiles à l'exploration simultanée de plusieurs jeux de données omiques de natures hétérogènes. Pour aborder cette question, les noyaux et les méthodes à noyaux offrent un cadre naturel, car ils permettent de prendre en compte la nature propre de chacun des tableaux de données tout en permettant leur combinaison. Toutefois, lorsque le nombre d'observations à traiter est grand, les méthodes à noyaux souffrent d'un manque d'interprétabilité et d'une grande complexité algorithmique. Une première partie de mon travail a porté sur l'adaptation de deux méthodes exploratoires à noyaux : l'analyse en composantes principales (K-PCA) et les cartes auto- organisatrices (K-SOM). Les adaptations développées portent d'une part sur le passage à l'échelle du K-SOM et de la K-PCA au domaine des omiques et d'autre part sur l'amélioration de l'interprétabilité des résultats. Dans une seconde partie, je me suis intéressé à l'apprentissage multi-noyaux pour combiner plusieurs jeux de données omiques. L'efficacité des méthodes proposées est illustrée dans le contexte de l'écologie microbienne : huit jeux de données du projet TARA oceans ont été intégrés et analysés à l'aide d'une K-PCA. / The development of high-throughput sequencing technologies has lead to produce high dimensional heterogeneous datasets at different living scales. To process such data, integrative methods have been shown to be relevant, but still remain challenging. This thesis gathers methodological contributions useful to simultaneously explore heterogeneous multi-omics datasets. To tackle this problem, kernels and kernel methods represent a natural framework because they allow to handle the own nature of each datasets while permitting their combination. However, when the number of sample to process is high, kernel methods suffer from several drawbacks: their complexity is increased and the interpretability of the model is lost. A first part of my work is focused on the adaptation of two exploratory kernel methods: the principal component analysis (K-PCA) and the self-organizing map (K-SOM). The proposed adaptations first address the scaling problem of both K-SOM and K-PCA to omics datasets and second improve the interpretability of the models. In a second part, I was interested in multiple kernel learning to combine multiple omics datasets. The proposed methods efficiency is highlighted in the domain of microbial ecology: eight TARA oceans datasets are integrated and analysed using a K-PCA.
2

Réponse du grain de blé à la nutrition azotée et soufrée : étude intégrative des mécanismes moléculaires mis en jeu au cours du développement du grain par des analyses -omiques / Wheat grain response to nitrogen and sulfur supply : integrative study of molecular mechanisms involved during the grain development using -omics analyses

Bonnot, Titouan 09 December 2016 (has links)
L’augmentation des rendements est un enjeu majeur chez les céréales. Dans cet objectif, il est nécessaire de maintenir la qualité du grain de blé, qui est principalement déterminée par sa teneur et sa composition en protéines de réserve. En effet, une forte relation négative existe entre le rendement et la teneur en protéines. Par ailleurs, la qualité du grain est fortement influencée par la disponibilité en azote et en soufre dans le sol. La limitation des apports d’intrants azotés à la culture et la carence en soufre récemment observée dans les sols représentent ainsi des difficultés supplémentaires pour maitriser cette qualité. Une meilleure connaissance des mécanismes moléculaires impliqués dans le contrôle du développement du grain et la mise en place de ses réserves protéiques en réponse à la nutrition azotée et soufrée est donc primordiale. L’objectif de cette thèse a ainsi été d’apporter de nouveaux éléments à la compréhension de ces processus de régulation, aujourd’hui peu connus. Pour cela, les approches -omiques sont apparues comme une stratégie de choix pour identifier les acteurs moléculaires mis en jeu. Le protéome nucléaire a été une cible importante dans les travaux menés. L’étude de ces protéines nucléaires a révélé certains régulateurs transcriptionnels qui pourraient être impliqués dans le contrôle de la mise en place des réserves du grain. Dans une approche combinant des données de protéomique, transcriptomique et métabolomique, une vision intégrative de la réponse du grain à la nutrition azotée et soufrée a été obtenue. L’importance d’un apport de soufre dans le contrôle de la balance azote/soufre du grain, déterminante pour la composition du grain en protéines de réserve, a été clairement vérifiée. Parmi les changements observés au niveau du métabolisme cellulaire, certains des gènes affectés par la modification de cette balance pourraient orchestrer l’ajustement de la composition du grain face à des situations de carences nutritionnelles. Ces nouvelles connaissances devraient permettre de mieux maitriser la qualité du grain de blé dans un contexte d’agriculture durable. / Improving the yield potential of cereals represents a major challenge. In this context, wheat grain quality has to be maintained. Indeed, grain quality is mainly determined by the content and the composition of storage proteins, but there is a strongly negative correlation between yield and grain protein concentration. In addition, grain quality is strongly influenced by the availability of nitrogen and sulfur in soils. Nowadays, the limitation of nitrogen inputs, and also the sulfur deficiency recently observed in soils represent major difficulties to control the quality. Therefore, understanding of molecular mechanisms controlling grain development and accumulation of storage proteins in response to nitrogen and sulfur supply is a major issue. The objective of this thesis was to create knowledge on the comprehension of these regulatory mechanisms. For this purpose, the best strategy to identify molecular actors involved in these processes consisted of -omics approaches. In our studies, the nuclear proteome was an important target. Among these proteins, we revealed some transcriptional regulators likely to be involved in the control of the accumulation of grain storage compounds. Using an approach combining proteomic, transcriptomic and metabolomic data, the characterization of the integrative grain response to the nitrogen and sulfur supply was obtained. Besides, our studies clearly confirmed the major influence of sulfur in the control of the nitrogen/sulfur balance that determines the grain storage protein composition. Among the changes observed in the cell metabolism, some genes were disturbed by the modification of this balance. Thus these genes could coordinate the adjustment of grain composition in response to nutritional deficiencies. These new results contribute in facing the challenge of maintaining wheat grain quality with sustainable agriculture.
3

Approche intégrative du développement musculaire afin de décrire le processus de maturation en lien avec la survie néonatale / Integrative approach of muscular development to describe the maturation process related to the neonatal survival

Voillet, Valentin 29 September 2016 (has links)
Depuis plusieurs années, des projets d'intégration de données omiques se sont développés, notamment avec objectif de participer à la description fine de caractères complexes d'intérêt socio-économique. Dans ce contexte, l'objectif de cette thèse est de combiner différentes données omiques hétérogènes afin de mieux décrire et comprendre le dernier tiers de gestation chez le porc, période influençant la mortinatalité porcine. Durant cette thèse, nous avons identifié les bases moléculaires et cellulaires sous-jacentes de la fin de gestation, en particulier au niveau du muscle squelettique. Ce tissu est en effet déterminant à la naissance car impliqué dans l'efficacité de plusieurs fonctions physiologiques comme la thermorégulation et la capacité à se déplacer. Au niveau du plan expérimental, les tissus analysés proviennent de foetus prélevés à 90 et 110 jours de gestation (naissance à 114 jours), issus de deux lignées extrêmes pour la mortalité à la naissance, Large White et Meishan, et des deux croisements réciproques. Au travers l'application de plusieurs études statistiques et computationnelles (analyses multidimensionnelles, inférence de réseaux, clustering et intégration de données), nous avons montré l'existence de mécanismes biologiques régulant la maturité musculaire chez les porcelets, mais également chez d'autres espèces d'intérêt agronomique (bovin et mouton). Quelques gènes et protéines ont été identifiées comme étant fortement liées à la mise en place du métabolisme énergétique musculaire durant le dernier tiers de gestation. Les porcelets ayant une immaturité du métabolisme musculaire seraient sujets à un plus fort risque de mortalité à la naissance. Un second volet de cette thèse concerne l'imputation de données manquantes (tout un groupe de variables pour un individu) dans les méthodes d'analyses multidimensionnelles, comme l'analyse factorielle multiple (AFM) (ou multiple factor analysis (MFA)). Dans notre contexte, l'AFM fut particulièrement intéressante pour l'intégration de données d'un ensemble d'individus sur différents tissus (deux ou plus). Afin de conserver ces individus manquants pour tout un groupe de variables, nous avons développé une méthode, appelée MI-MFA (multiple imputation - MFA), permettant l'estimation des composantes de l'AFM pour ces individus manquants. / Over the last decades, some omics data integration studies have been developed to participate in the detailed description of complex traits with socio-economic interests. In this context, the aim of the thesis is to combine different heterogeneous omics data to better describe and understand the last third of gestation in pigs, period influencing the piglet mortality at birth. In the thesis, we better defined the molecular and cellular basis underlying the end of gestation, with a focus on the skeletal muscle. This tissue is specially involved in the efficiency of several physiological functions, such as thermoregulation and motor functions. According to the experimental design, tissues were collected at two days of gestation (90 or 110 days of gestation) from four fetal genotypes. These genotypes consisted in two extreme breeds for mortality at birth (Meishan and Large White) and two reciprocal crosses. Through statistical and computational analyses (descriptive analyses, network inference, clustering and biological data integration), we highlighted some biological mechanisms regulating the maturation process in pigs, but also in other livestock species (cattle and sheep). Some genes and proteins were identified as being highly involved in the muscle energy metabolism. Piglets with a muscular metabolism immaturity would be associated with a higher risk of mortality at birth. A second aspect of the thesis was the imputation of missing individual row values in the multidimensional statistical method framework, such as the multiple factor analysis (MFA). In our context, MFA was particularly interesting in integrating data coming from the same individuals on different tissues (two or more). To avoid missing individual row values, we developed a method, called MI-MFA (multiple imputation - MFA), allowing the estimation of the MFA components for these missing individuals.

Page generated in 0.0439 seconds