Spelling suggestions: "subject:"chimiométrie"" "subject:"pluviométriques""
1 |
Disentangling structural complexity in proteins by decomposing SAXS data with chemometric approaches / Détermination de la complexité structurale des protéines en décomposant les données SAXS avec des approches chimiométriquesHerranz-Trillo, Fatima 29 September 2017 (has links)
De nombreux systèmes biologiques sont intrinsèquement polydispersés, présentant de multiples espèces coexistantes, de taille, de forme ou de conformation différentes (c'est-à-dire, mélanges oligomèriques, des complexes faiblement liés se dissociant en composantes individuelles ou des espèces apparaissant lors de processus amyloïdogéniques). L'étude de tels systèmes complexes est une tâche difficile en raison de l'instabilité des espèces concernées, de leurs concentrations relatives faibles et interdépendantes et des difficultés rencontrées pour l'isolation des composantes pures. Dans cette thèse, j'ai développé des approches méthodologiques pour appliquer la diffusion des rayons X aux petits angles (SAXS), une technique de biologie structurale, à l'étude de systèmes polydispersés. SAXS est une technique additive et par conséquent, le diagramme de diffusion mesuré pour un échantillon polydispersé correspond à la somme pondérée en concentration des contributions de chacune des composantes individuelles du mélange. Cependant, la décomposition des données de SAXS en des spectres spécifiques des espèces et de leurs concentrations relatives est extrêmement laborieuse et ambigue. Dans cette thèse, je présente d'abord une approche objective pour solidement décomposer les jeux de données de SAXS en composantes individuelles. Cette approche adapte la méthode chimiométrique « Multivariable Curve Resolution Alternate Least Squares » (MCR-ALS) aux spécificités des données de SAXS. Notre méthode permet une décomposition rigoureuse et robuste des données de SAXS en introduisant simultanément différentes représentations de ces données et par conséquent, en mettant l'accent sur des changements moléculaires à différentes plages de temps et de résolution structurale. Nous avons appliqué cette approche, que nous appelons COSMiCS (Analyse structurelle objective complexe des systèmes multi-composants) pour étudier deux systèmes polydispersés: la fibrillation des protéines, et les fluctuations conformationnelles de protéines grâce à l'analyse de données obtenues à l'aide d’une technique de couplage de chromatographie d'exclusion de taille (SEC) avec le ligne de SAXS (SEC-SAXS). L'importance d'étudier les processus de fibrillation réside dans leur implication dans des pathologies amyloïdogéniques telles que les maladies de Parkinson ou d'Alzheimer. Il existe de fortes indications que les espèces oligomériques solubles, et non les fibrilles matures, sont la cause principale de la cytotoxicité et des dommages neuronaux. Cette observation souligne l'importance de caractériser les premiers stades des processus de fibrillation. Notre approche COSMiCS a permis d'étudier les processus amyloïdogéniques de l'insuline et du mutant familial E46K de l'α-synucléine, une protéine associée à la maladie de Parkinson. Cette analyse permet la caractérisation structurale des espèces présentes (y compris les espèces oligomériques) et la caractérisation cinétique de leurs transformations.La deuxième partie de la thèse est consacrée à l'utilisation de COSMiCS pour analyser des données de SEC-SAXS. Le SEC-SAXS est extrêmement populaire et a été implémenté sur plusieurs lignes de SAXS à travers le monde. En utilisant des données synthétiques, je démontre la capacité des approches chimiométriques à décomposer des profils chromatographiques complexes. À l'aide de cette approche, j'ai décomposé l’ensemble des données SEC-SAXS mesurés pour la Prolyl OligoPeptidase (POP).En résumé, cette thèse présente une nouvelle approche chimiométrique qui peut être généralement appliquée à tout mélange macromoléculaire pouvant subir une modifacation de son équilibre et pouvant être abordé par SAXS. Les complexes biomoleculaires transitoires, les processus de repliement, les réarrangements structuraux dépendants d’un ligand ou la formation de grands ensembles supramoleculaires peuvent être sondés de façon structurale en utilisant l'approche COSMiCS. / Many biological systems are inherently polydisperse, presenting multiple coexisting species differing in size, shape or conformation (i.e. oligomeric mixtures, weakly bound complexes, and species appearing along amyloidogenic processes). The study of such complex systems is challenging due to the instability of the species involved, their low and interdependent relative concentrations, and the difficulties to isolate the pure components. In this thesis, I have developed methodological approaches to apply Small-Angle X-ray Scattering (SAXS), a low-resolution structural biology technique, to the study of polydisperse systems. As an additive technique, the SAXS pattern measured for a polydisperse sample corresponds to the concentration-weighted sum of the contributions from each of the individual components. However, decomposition of SAXS data into species-specific spectra and relative concentrations is laborious and burdened by ambiguity. In this thesis, I present an approach to decompose SAXS datasets into the individual components. This approach adapts the chemometrics Multivariate Curve Resolution Alternating Least Squares (MCR-ALS) method to the specificities of SAXS data. Our method enables the rigorous and robust decomposition of SAXS data by simultaneously introducing different representations of these data and, consequently, emphasizing molecular changes at different time and structural resolution ranges. We have applied this approach, which we name COSMiCS (Complex Objective Structural analysis of Multi-Component Systems), to study two polydisperse systems: amyloid fibrillation by analysing time-dependent SAXSdata, and conformational fluctuations through the analysis of data obtained using on-line size-exclusion chromatography coupled to SAXS (SEC-SAXS). The importance of studying fibrillation processes lies in their implication in amyloidogenic pathologies such as Parkinson’s or Alzheimer’s diseases. There exist strong indications that soluble oligomeric species, and not mature fibrils, are the main cause of cytotoxicity and neuronal damage emphasizing the importance of characterizing early stages of fibrillation. The first application of our COSMiCS approach has allowed the study of the amyloidogenic mechanisms of insulin and the familial mutant E46K of ↵-synuclein, a Parkinson’s disease related protein. The analysis enables the structural characterization of all the species present as well as their kinetic transformations. The second part of the thesis is dedicated to the use of COSMiCS to analyze on-line SEC-SAXS experiments. Using synthetic data, I demonstrate the capacity of chemometric approaches to decompose complex chromatographic profiles. Using this approach, I have studied the conformational fluctuations in prolyl oligopeptidase (POP), a protein related to synaptic functions and neuronal development. In summary, this thesis presents a novel chemometrics approach that can be generally applied to any macromolecular mixture with a tuneable equilibrium that is amenableto SAXS. Transient biomolecular complexes, folding processes, or ligand-dependent structural rearrangements can be probed structurally using COSMiCS.
|
2 |
Couplage entre modélisation opto-physique des scènes de végétation complexes et chimiométrie : application au phénotypage par imagerie hyperspectrale de proximité / Coupling between opto-physical modeling of complex vegetation scenes and chemometry : application to phenotyping by short range hyperspectral imagingMakdessi, Nathalie al 16 November 2017 (has links)
L'imagerie hyperspectrale de proximité est un outil prometteur pour le phénotypage ou la surveillance de la végétation. En association avec la régression des moindres carrés partiels ou PLS-R, elle permet de construire des cartographies de haute résolution spatiale du contenu chimique à l’échelle de la canopée. Cependant, plusieurs phénomènes optiques doivent être pris en compte lors de l'application de cette approche aux scènes de végétation dans des conditions naturelles. Notamment, les facteurs additifs et multiplicatifs liés respectivement à la réflexion spéculaire et à l'inclinaison des feuilles qui peuvent être surmontés par prétraitement. Mais le phénomène qui pose le plus de défis est la réflexion multiple. Il se produit lorsqu'une feuille est éclairée en partie par la lumière directe, et en partie par la réflexion ou la transmission de la lumière des feuilles voisines, induisant de forts effets non linéaires sur son spectre de réflectance. Bien que cet effet puisse être pris en compte dans certains modèles de télédétection à l’échelle de la canopée, aucune étude n’a été proposée à ce jour sur la façon dont un tel phénomène affecte les évaluations spectrales de la biochimie végétale par imagerie de proximité. L'objectif de la présente étude était d'analyser ces effets dans le contexte de l'imagerie hyperspectrale à des fins de phénotypage végétal et de proposer des méthodes chimiométriques pour les surmonter. Le développement méthodologique a été basé sur des outils de simulation inclus dans la plate-forme open source OpenAlea (http://openalea.gforge.inria.fr/dokuwiki/doku.php). Une scène typique de canopée de blé a été modélisée à l'aide du modèle Adel-Wheat et combinée au modèle de propagation de la lumière Caribu. L'outil proposé simule la réflectance apparente de chaque feuille visible dans la canopée pour une réflectance et une transmittance réelles données, permettant de synthétiser des images hyperspectrales réalistes. Cette approche par simulation nous a permis, dans un premier temps, d’analyser la distribution dans l’espace spectral des perturbations engendrées par les réflexions multiples, puis d’en déduire une méthode de correction applicable dans le cas d’une régression PLS. La méthode est basée sur la construction de deux sous-espaces W et B générés respectivement par la formulation analytique des réflexions multiples et la variable d'intérêt. Ceci nous permet alors de définir une matrice de projection sur B selon la direction W (projection oblique), qui permet de supprimer l’effet des réflexions multiples tout en conservant l’information utile. Il suffit ensuite d’appliquer cette projection à chaque spectre lors de l’apprentissage et de la mise en œuvre du modèle PLS. La méthode a d’abord été développée et paramétrée sur les données simulées, dans le contexte de l’évaluation de la teneur en azote (LNC) de feuilles de blé. Pour cela, les spectres de réflectance (450-1100 nm) de 57 feuilles de blé ont été collectés à l'aide d'un spectromètre ASD (FieldSpec®, Analytical Spectral Devices, Inc., Boulder, Colorado, USA), tandis que leur LNC a été mesuré à l'aide d'analyses chimiques. Des modèles de régression avec et sans projection oblique ont alors été construits à partir des spectres ASD et appliqués sur l’ensemble des données simulées. Le modèle avec projection oblique a donné d’excellents résultats (R² = 0.931; RMSEP = 0.29% DM) en comparaison du modèle classique (R² = 0.915; RMSEP = 0.42% DM).La même méthode a ensuite été appliquée en conditions réelles, sur des feuilles de blé cultivées en pot et au champ. Pour cela, des feuilles ont été collectées et imagées à plat sur fond noir pour la construction des modèles PLS, qui ont ensuite été appliqués aux plantes sur pied. Ces expérimentations ont confirmé d’une part que la PLS-R classique entraînait une forte surestimation du LNC sur les feuilles entourées d’autres feuilles, d’autre part que la projection oblique évitait cette surestimation. / Short range hyperspectral imagery is a promising tool for phenotyping and vegetation survey. When associated with partial least square regression (PLS-R), it allows high spatial resolution mapping of the plant chemical content at the canopy scale. However, several optical phenomena have to be taken into account when applying this approach to vegetation scenes in natural conditions. For instance, additive and multiplicative factors due respectively to specular reflection and leaf inclination can be overcome by spectral preprocessing. But the most challenging phenomenon is multiple scattering. It appears when a leaf is partly lightened by the reflected or transmitted light from surrounding leaves, resulting in strong non linear effects in its apparent reflectance spectrum. Though this effect can be taken into account in some remote sensing models at the canopy scale, no study has been proposed until now concerning its impact on spectral prediction of vegetation chemical content by short range imagery.The objective of this project, associated with a PhD work, was to analyze these effects in the context of hyperspectral imagery for vegetation phenotyping purpose, and to propose spectral processing methods to overcome them.The methodological development has been based on simulation tools included in the open source platform OpenAlea (http://openalea.gforge.inria.fr/dokuwiki/doku.php). A typical wheat canopy scene has been modelled using Adel-Wheat and combined with the light propagation model Caribu. The proposed tool simulates the apparent reflectance of every visible leaf in the canopy for a given actual reflectance and transmittance, allowing to synthetize realistic hyperspectral images.This simulation approach has allowed us, in a first step, to analyze the distribution of deviations due to multiple scattering in the spectral space, and then to infer a correction method in the frame of PLS regression. This method relies on the building of two subspaces EW and EB respectively generated by the analytic formulation of multiple scattering and by the variable of interest. It allows us to define a projection operation on EB subspace along EW direction (oblique projection), in order to remove multiple scattering effects while preserving useful information. This projection operation is then applied on every spectra during learning phase and using phase of the PLS model.The method has first been developed and tuned using simulated data, in the frame of leaf nitrogen content (LNC) prediction of wheat leaves. For this purpose, reflectance spectra (450-1100 nm) of 57 wheat leaves have been collected using a ASD filed spectrometer (FieldSpec®, Analytical Spectral Devices, Inc., Boulder, Colorado, USA), while their LNC was measured through reference chemical analyses. Regression models with and without oblique projection have then been built from the ASD spectra and applied to simulated data. The model with oblique projection provided excellent results (R² = 0.931; RMSEP = 0.29% DM), compared to the classical one (R² = 0.915; RMSEP = 0.42% DM).The same method has then been applied in real conditions on wheat pot plants and field plants. For this purpose, some leaves have been collected and laid on a black paper background to be imaged, in order to build PLS models that have then been applied on in-situ plants. These experimentations have confirmed that the classical PLS-R induces a strong overestimation of LNC on leaves surrounded by other leaves, and that oblique projection corrects this overestimation (same prediction on surrounded then isolated leaf).
|
Page generated in 0.0711 seconds