• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 3
  • Tagged with
  • 3
  • 3
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Development of a Supervised Multivariate Statistical Algorithm for Enhanced Interpretability of Multiblock Analysis. / Utveckling av en algoritm för förbättrad tolkningsbarhet av övervakad multivariat statistisk simultan analys av flera designmatriser.

Petters, Patrik January 2017 (has links)
In modern biological research, OMICs techniques, such as genomics, proteomics or metabolomics, are often employed to gain deep insights into metabolic regulations and biochemical perturbations in response to a specific research question. To gain complementary biologically relevant information, multiOMICs, i.e., several different OMICs measurements on the same specimen, is becoming increasingly frequent. To be able to take full advantage of this complementarity, joint analysis of such multiOMICs data is necessary, but this is yet an underdeveloped area. In this thesis, a theoretical background is given on general component-based methods for dimensionality reduction such as PCA, PLS for single block analysis, and multiblock PLS for co-analysis of OMICs data. This is followed by a rotation of an unsupervised analysis method. The aim of this method is to divide dimensionality-reduced data in block-distinct and common variance partitions, using the DISCO-SCA approach. Finally, an algorithm for a similar rotation of a supervised (PLS) solution is presented using data available in the literature. To the best of our knowledge, this is the first time that such an approach for rotation of a supervised analysis in block-distinct and common partitions has been developed and tested.This newly developed DISCO-PLS algorithm clearly showed an increased potential for visualisation and interpretation of data, compared to standard PLS. This is shown bybiplots of observation scores and multiblock variable loadings.
2

Combining NMR and MS fingerprinting for fine characterization of lipid profiles. : Application to a chemical food safety issue / Caractérisation fine de profils lipidiques via la combinaison de prises d'empreintes par RMN et SdM : Application à une problématique de sécurité chimique des aliments

Marchand, Jérémy 13 December 2018 (has links)
Pour garantir au consommateur des aliments sûrs, l'emploi d'anabolisants chez les animaux de production est prohibée au sein de l'Union Européenne depuis la fin des années 1980. Bien que performantes, les méthodes de contrôle classiques ciblées font face à de nouveaux défis auxquels des stratégies alternatives (non ciblées),visant à identifier des biomarqueurs métaboliques caractéristiques de l'effet associé à ces pratiques, offrent des solutions innovantes. Le lipidome en particulier constitue une fraction d'intérêt pour l'étude des effets liés aux agents de répartition. La Spectrométrie de Masse (SdM) et la Résonance Magnétique Nucléaire (RMN) sont alors classiquement utilisées, indépendamment. Ce travail propose d'évaluer leur combinaison, bénéficiant des niveaux d'information différents associés, et les conséquences en termes de gain de prédiction ou d'identification des biomarqueurs. Comme modèle d'étude, des échantillons sanguins provenant d'animaux traités avec un agent de répartition connu pour perturber les profils lipidiques,ont été caractérisés. L'analyse du lipidome sérique par SdM a impliqué trois plateformes offrant des angles de vue différents afin de fournir une couverture étendue; l'étude de leur cohérence et complémentarité constituant l'un des objectifs de cette thèse. En parallèle, l'analyse par RMN a requis le développement d'une procédure complète, de l'optimisation des conditions de préparation d'échantillon aux paramètres d'acquisition, incluant des approches de RMN 2D rapides récentes. Enfin, le verrou associé à l'analyse des données issues des différentes sources a permis d'évaluer des approches statistiques innovantes, notamment multibloc. / Ln order to ensure safe food products for the consumer, the use of growth promoters in livestock farming has been prohibited in European Union since the end of the 80s. Although efficient, the conventional targeted control methods face new challenges to which alternative strategies (untargeted), aiming at identifying metabolic biomarkers characteristic of the effects induced by such practices, provide innovative solutions. In particular, the lipidome is an area of interest to investigate the effects associated with repartition agents. Mass Spectrometry (MS) and Nuclear Magnetic Resonance (NMR) are then classically used independently. This PhD work intends to evaluate their combination benefiting from the different levels of associated information and the consequences in terms of enhanced prediction or biomarker identification. As a study model, blood samples from animals treated with a repartition agent known to disrupt lipid profiles were characterized. The investigation of the serum lipidome with MS involved three distinct platforms providing different outlooks in order ta generate extended coverage; the study of their consistency and complementarity constituting one of the objectives of this PhD. In parallel, the analysis with NMR prompted the development of a complete workflow, from the optimization of the sample preparation conditions to acquisition parameters -including recent fast 2D NMR approaches. Finally, the challenge associated with the analysis of data from multiple sources allowed ta evaluate innovative statistical approaches such as multiblock analysis.
3

Analyse factorielle de données structurées en groupes d'individus : application en biologie / Multivariate data analysis of multi-group datasets : application to biology

Eslami, Aida 21 October 2013 (has links)
Ce travail concerne les analyses visant à étudier les données où les individus sont structurés en différents groupes (données multi-groupes). La thèse aborde la question des données multi-groupes ayant une structure en un seul tableau, plusieurs tableaux, trois voies et deux blocs (régression). Cette thèse présente plusieurs méthodes d'analyse de données multi-groupes dans le cadre de l'analyse factorielle. Notre travail comporte trois parties. La première partie traite de l'analyse de données multi-groupes (un bloc de variables divisé en sous-groupes d'individus). Le but est soit descriptif (analyse intra-groupes) ou prédictif (analyse discriminante ou analyse inter-groupe). Nous commençons par une description exhaustive des méthodes multi-groupes. En outre, nous proposons deux méthodes : l'Analyse Procrustéenne duale et l'Analyse en Composantes Communes et Poids Spécifiques duale. Nous exposons également de nouvelles propriétés et algorithmes pour l'Analyse en Composantes Principales multi-groupes. La deuxième partie concerne l'analyse multi-blocs et multi-groupes et l'analyse trois voies et multi-groupes. Nous présentons les méthodes existantes. Par ailleurs, nous proposons deux méthodes, l'ACP multi-blocs et multi-groupes et l'ACP multi-blocs et multi-groupes pondérée, vues comme des extensions d'Analyse en Composantes Principales multi-groupes. L'analyse en deux blocs et multi-groupes est prise en compte dans la troisième partie. Tout d'abord, nous présentons des méthodes appropriées pour trouver la relation entre un ensemble de données explicatives et un ensemble de données à expliquer, les deux tableaux présentant une structure de groupe entre les individus. Par la suite, nous proposons quatre méthodes pouvant être vues comme des extensions de la régression PLS au cas multi-groupes, et parmi eux, nous en sélectionnons une et la développons dans une stratégie de régression. Les méthodes proposées sont illustrées sur la base de plusieurs jeux de données réels dans le domaine de la biologie. Toutes les stratégies d'analyse sont programmées sur le logiciel libre R. / This work deals with multi-group analysis, to study multi-group data where individuals are a priori structured into different groups. The thesis tackles the issue of multi-group data in a multivariate, multi-block, three-way and two-block (regression) setting. It presents several methods of multi-group data analysis in the framework of factorial analysis. It includes three sections. The first section concerns the case of multivariate multi-group data. The aim is either descriptive (within-group analysis) or predictive (discriminant analysis, between-group analysis). We start with a comprehensive review of multi-group methods. Furthermore, we propose two methods namely Dual Generalized Procrustes Analysis and Dual Common Component and Specific Weights Analysis. We also exhibit new properties and algorithms for multi-group Principal Component Analysis. The second section deals with multiblock multi-group and three-way multi-group data analysis. We give a general review of multiblock multi-group methods. In addition, we propose two methods, namely multiblock and multi-group PCA and Weighted-multiblock and multi-group PCA, as extensions of multi-group Principal Component Analysis. The two-block multi-group analysis is taken into account in the third section. Firstly, we give a presentation of appropriate methods to investigate the relationship between an explanatory dataset and a dependent dataset where there is a group structure among individuals. Thereafter, we propose four methods, namely multi-group PLS, in the PLS approach, and among them we select one and develop it into a regression strategy. The proposed methods are illustrated on the basis of several real datasets in the field of biology. All the strategies of analysis are implemented within the framework of R.

Page generated in 0.0674 seconds