Spelling suggestions: "subject:"partial least square regression (PLS)""
1 |
A Statistical Methodology for Classifying Time Series in the Context of Climatic DataRamírez Buelvas, Sandra Milena 24 February 2022 (has links)
[ES] De acuerdo con las regulaciones europeas y muchos estudios científicos, es necesario monitorear y analizar las condiciones microclimáticas en museos o edificios, para preservar las obras de arte en ellos. Con el objetivo de ofrecer herramientas para el monitoreo de las condiciones climáticas en este tipo de edificios, en esta tesis doctoral se propone una nueva metodología estadística para clasificar series temporales de parámetros climáticos como la temperatura y humedad relativa. La metodología consiste en aplicar un método de clasificación usando variables que se computan a partir de las series de tiempos. Los dos primeros métodos de clasificación son versiones conocidas de métodos sparse PLS que no se habían aplicado a datos correlacionados en el tiempo. El tercer método es una nueva propuesta que usa dos algoritmos conocidos. Los métodos de clasificación se basan en diferentes versiones de un método sparse de análisis discriminante de mínimos cuadra- dos parciales PLS (sPLS-DA, SPLSDA y sPLS) y análisis discriminante lineal (LDA). Las variables que los métodos de clasificación usan como input, corresponden a parámetros estimados a partir de distintos modelos, métodos y funciones del área de las series de tiempo, por ejemplo, modelo ARIMA estacional, modelo ARIMA- TGARCH estacional, método estacional Holt-Winters, función de densidad espectral, función de autocorrelación (ACF), función de autocorrelación parcial (PACF), rango móvil (MR), entre otras funciones. También fueron utilizadas algunas variables que se utilizan en el campo de la astronomía para clasificar estrellas. En los casos que a priori no hubo información de los clusters de las series de tiempos, las dos primeras componentes de un análisis de componentes principales (PCA) fueron utilizadas por el algoritmo k- means para identificar posibles clusters de las series de tiempo. Adicionalmente, los resultados del método sPLS-DA fueron comparados con los del algoritmo random forest. Tres bases de datos de series de tiempos de humedad relativa o de temperatura fueron analizadas. Los clusters de las series de tiempos se analizaron de acuerdo a diferentes zonas o diferentes niveles de alturas donde fueron instalados sensores para el monitoreo de las condiciones climáticas en los 3 edificios.El algoritmo random forest y las diferentes versiones del método sparse PLS fueron útiles para identificar las variables más importantes en la clasificación de las series de tiempos. Los resultados de sPLS-DA y random forest fueron muy similares cuando se usaron como variables de entrada las calculadas a partir del método Holt-Winters o a partir de funciones aplicadas a las series de tiempo. Aunque los resultados del método random forest fueron levemente mejores que los encontrados por sPLS-DA en cuanto a las tasas de error de clasificación, los resultados de sPLS- DA fueron más fáciles de interpretar. Cuando las diferentes versiones del método sparse PLS utilizaron variables resultantes del método Holt-Winters, los clusters de las series de tiempo fueron mejor discriminados. Entre las diferentes versiones del método sparse PLS, la versión sPLS con LDA obtuvo la mejor discriminación de las series de tiempo, con un menor valor de la tasa de error de clasificación, y utilizando el menor o segundo menor número de variables.En esta tesis doctoral se propone usar una versión sparse de PLS (sPLS-DA, o sPLS con LDA) con variables calculadas a partir de series de tiempo para la clasificación de éstas. Al aplicar la metodología a las distintas bases de datos estudiadas, se encontraron modelos parsimoniosos, con pocas variables, y se obtuvo una discriminación satisfactoria de los diferentes clusters de las series de tiempo con fácil interpretación. La metodología propuesta puede ser útil para caracterizar las distintas zonas o alturas en museos o edificios históricos de acuerdo con sus condiciones climáticas, con el objetivo de prevenir problemas de conservación con las obras de arte. / [CA] D'acord amb les regulacions europees i molts estudis científics, és necessari monitorar i analitzar les condiciones microclimàtiques en museus i en edificis similars, per a preservar les obres d'art que s'exposen en ells. Amb l'objectiu d'oferir eines per al monitoratge de les condicions climàtiques en aquesta mena d'edificis, en aquesta tesi es proposa una nova metodologia estadística per a classificar series temporals de paràmetres climàtics com la temperatura i humitat relativa.La metodologia consisteix a aplicar un mètode de classificació usant variables que es computen a partir de les sèries de temps. Els dos primers mètodes de classificació són versions conegudes de mètodes sparse PLS que no s'havien aplicat adades correlacionades en el temps. El tercer mètode és una nova proposta que usados algorismes coneguts. Els mètodes de classificació es basen en diferents versions d'un mètode sparse d'anàlisi discriminant de mínims quadrats parcials PLS (sPLS-DA, SPLSDA i sPLS) i anàlisi discriminant lineal (LDA). Les variables queels mètodes de classificació usen com a input, corresponen a paràmetres estimats a partir de diferents models, mètodes i funcions de l'àrea de les sèries de temps, per exemple, model ARIMA estacional, model ARIMA-TGARCH estacional, mètode estacional Holt-Winters, funció de densitat espectral, funció d'autocorrelació (ACF), funció d'autocorrelació parcial (PACF), rang mòbil (MR), entre altres funcions. També van ser utilitzades algunes variables que s'utilitzen en el camp de l'astronomia per a classificar estreles. En els casos que a priori no va haver-hi información dels clústers de les sèries de temps, les dues primeres components d'una anàlisi de components principals (PCA) van ser utilitzades per l'algorisme k-means per a identificar possibles clústers de les sèries de temps. Addicionalment, els resultats del mètode sPLS-DA van ser comparats amb els de l'algorisme random forest.Tres bases de dades de sèries de temps d'humitat relativa o de temperatura varen ser analitzades. Els clústers de les sèries de temps es van analitzar d'acord a diferents zones o diferents nivells d'altures on van ser instal·lats sensors per al monitoratge de les condicions climàtiques en els edificis.L'algorisme random forest i les diferents versions del mètode sparse PLS van ser útils per a identificar les variables més importants en la classificació de les series de temps. Els resultats de sPLS-DA i random forest van ser molt similars quan es van usar com a variables d'entrada les calculades a partir del mètode Holt-winters o a partir de funcions aplicades a les sèries de temps. Encara que els resultats del mètode random forest van ser lleument millors que els trobats per sPLS-DA quant a les taxes d'error de classificació, els resultats de sPLS-DA van ser més fàcils d'interpretar.Quan les diferents versions del mètode sparse PLS van utilitzar variables resultants del mètode Holt-Winters, els clústers de les sèries de temps van ser més ben discriminats. Entre les diferents versions del mètode sparse PLS, la versió sPLS amb LDA va obtindre la millor discriminació de les sèries de temps, amb un menor valor de la taxa d'error de classificació, i utilitzant el menor o segon menor nombre de variables.En aquesta tesi proposem usar una versió sparse de PLS (sPLS-DA, o sPLS amb LDA) amb variables calculades a partir de sèries de temps per a classificar series de temps. En aplicar la metodologia a les diferents bases de dades estudiades, es van trobar models parsimoniosos, amb poques variables, i varem obtindre una discriminació satisfactòria dels diferents clústers de les sèries de temps amb fácil interpretació. La metodologia proposada pot ser útil per a caracteritzar les diferents zones o altures en museus o edificis similars d'acord amb les seues condicions climàtiques, amb l'objectiu de previndre problemes amb les obres d'art. / [EN] According to different European Standards and several studies, it is necessary to monitor and analyze the microclimatic conditions in museums and similar buildings, with the goal of preserving artworks. With the aim of offering tools to monitor the climatic conditions, a new statistical methodology for classifying time series of different climatic parameters, such as relative humidity and temperature, is pro- posed in this dissertation.The methodology consists of applying a classification method using variables that are computed from time series. The two first classification methods are ver- sions of known sparse methods which have not been applied to time dependent data. The third method is a new proposal that uses two known algorithms. These classification methods are based on different versions of sparse partial least squares discriminant analysis PLS (sPLS-DA, SPLSDA, and sPLS) and Linear Discriminant Analysis (LDA). The variables that are computed from time series, correspond to parameter estimates from functions, methods, or models commonly found in the area of time series, e.g., seasonal ARIMA model, seasonal ARIMA-TGARCH model, seasonal Holt-Winters method, spectral density function, autocorrelation function (ACF), partial autocorrelation function (PACF), moving range (MR), among others functions. Also, some variables employed in the field of astronomy (for classifying stars) were proposed.The methodology proposed consists of two parts. Firstly, different variables are computed applying the methods, models or functions mentioned above, to time series. Next, once the variables are calculated, they are used as input for a classification method like sPLS-DA, SPLSDA, or SPLS with LDA (new proposal). When there was no information about the clusters of the different time series, the first two components from principal component analysis (PCA) were used as input for k-means method for identifying possible clusters of time series. In addition, results from random forest algorithm were compared with results from sPLS-DA.This study analyzed three sets of time series of relative humidity or temperate, recorded in different buildings (Valencia's Cathedral, the archaeological site of L'Almoina, and the baroque church of Saint Thomas and Saint Philip Neri) in Valencia, Spain. The clusters of the time series were analyzed according to different zones or different levels of the sensor heights, for monitoring the climatic conditions in these buildings.Random forest algorithm and different versions of sparse PLS helped identifying the main variables for classifying the time series. When comparing the results from sPLS-DA and random forest, they were very similar for variables from seasonal Holt-Winters method and functions which were applied to the time series. The results from sPLS-DA were easier to interpret than results from random forest. When the different versions of sparse PLS used variables from seasonal Holt- Winters method as input, the clusters of the time series were identified effectively.The variables from seasonal Holt-Winters helped to obtain the best, or the second best results, according to the classification error rate. Among the different versions of sparse PLS proposed, sPLS with LDA helped to classify time series using a fewer number of variables with the lowest classification error rate.We propose using a version of sparse PLS (sPLS-DA, or sPLS with LDA) with variables computed from time series for classifying time series. For the different data sets studied, the methodology helped to produce parsimonious models with few variables, it achieved satisfactory discrimination of the different clusters of the time series which are easily interpreted. This methodology can be useful for characterizing and monitoring micro-climatic conditions in museums, or similar buildings, for preventing problems with artwork. / I gratefully acknowledge the financial support of Pontificia Universidad Javeriana Cali – PUJ and Instituto Colombiano de Crédito Educativo y Estudios Técnicos en el Exterior – ICETEX who awarded me the scholarships ’Convenio de Capacitación para Docentes O. J. 086/17’ and ’Programa Crédito Pasaporte a la Ciencia ID 3595089 foco-reto salud’ respectively. The scholarships were essential for obtaining the Ph.D. Also, I gratefully acknowledge the financial support of the European Union’s Horizon 2020 research and innovation programme under grant agreement No. 814624. / Ramírez Buelvas, SM. (2022). A Statistical Methodology for Classifying Time Series in the Context of Climatic Data [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/181123
|
2 |
Novel chemometric proposals for advanced multivariate data analysis, processing and interpretationVitale, Raffaele 03 November 2017 (has links)
The present Ph.D. thesis, primarily conceived to support and reinforce the relation between academic and industrial worlds, was developed in collaboration with Shell Global Solutions (Amsterdam, The Netherlands) in the endeavour of applying and possibly extending well-established latent variable-based approaches (i.e. Principal Component Analysis - PCA - Partial Least Squares regression - PLS - or Partial Least Squares Discriminant Analysis - PLSDA) for complex problem solving not only in the fields of manufacturing troubleshooting and optimisation, but also in the wider environment of multivariate data analysis. To this end, novel efficient algorithmic solutions are proposed throughout all chapters to address very disparate tasks, from calibration transfer in spectroscopy to real-time modelling of streaming flows of data. The manuscript is divided into the following six parts, focused on various topics of interest:
Part I - Preface, where an overview of this research work, its main aims and justification is given together with a brief introduction on PCA, PLS and PLSDA;
Part II - On kernel-based extensions of PCA, PLS and PLSDA, where the potential of kernel techniques, possibly coupled to specific variants of the recently rediscovered pseudo-sample projection, formulated by the English statistician John C. Gower, is explored and their performance compared to that of more classical methodologies in four different applications scenarios: segmentation of Red-Green-Blue (RGB) images, discrimination of on-/off-specification batch runs, monitoring of batch processes and analysis of mixture designs of experiments;
Part III - On the selection of the number of factors in PCA by permutation testing, where an extensive guideline on how to accomplish the selection of PCA components by permutation testing is provided through the comprehensive illustration of an original algorithmic procedure implemented for such a purpose;
Part IV - On modelling common and distinctive sources of variability in multi-set data analysis, where several practical aspects of two-block common and distinctive component analysis (carried out by methods like Simultaneous Component Analysis - SCA - DIStinctive and COmmon Simultaneous Component Analysis - DISCO-SCA - Adapted Generalised Singular Value Decomposition - Adapted GSVD - ECO-POWER, Canonical Correlation Analysis - CCA - and 2-block Orthogonal Projections to Latent Structures - O2PLS) are discussed, a new computational strategy for determining the number of common factors underlying two data matrices sharing the same row- or column-dimension is described, and two innovative approaches for calibration transfer between near-infrared spectrometers are presented;
Part V - On the on-the-fly processing and modelling of continuous high-dimensional data streams, where a novel software system for rational handling of multi-channel measurements recorded in real time, the On-The-Fly Processing (OTFP) tool, is designed;
Part VI - Epilogue, where final conclusions are drawn, future perspectives are delineated, and annexes are included. / La presente tesis doctoral, concebida principalmente para apoyar y reforzar la relación entre la academia y la industria, se desarrolló en colaboración con Shell Global Solutions (Amsterdam, Países Bajos) en el esfuerzo de aplicar y posiblemente extender los enfoques ya consolidados basados en variables latentes (es decir, Análisis de Componentes Principales - PCA - Regresión en Mínimos Cuadrados Parciales - PLS - o PLS discriminante - PLSDA) para la resolución de problemas complejos no sólo en los campos de mejora y optimización de procesos, sino también en el entorno más amplio del análisis de datos multivariados. Con este fin, en todos los capítulos proponemos nuevas soluciones algorítmicas eficientes para abordar tareas dispares, desde la transferencia de calibración en espectroscopia hasta el modelado en tiempo real de flujos de datos.
El manuscrito se divide en las seis partes siguientes, centradas en diversos temas de interés:
Parte I - Prefacio, donde presentamos un resumen de este trabajo de investigación, damos sus principales objetivos y justificaciones junto con una breve introducción sobre PCA, PLS y PLSDA;
Parte II - Sobre las extensiones basadas en kernels de PCA, PLS y PLSDA, donde presentamos el potencial de las técnicas de kernel, eventualmente acopladas a variantes específicas de la recién redescubierta proyección de pseudo-muestras, formulada por el estadista inglés John C. Gower, y comparamos su rendimiento respecto a metodologías más clásicas en cuatro aplicaciones a escenarios diferentes: segmentación de imágenes Rojo-Verde-Azul (RGB), discriminación y monitorización de procesos por lotes y análisis de diseños de experimentos de mezclas;
Parte III - Sobre la selección del número de factores en el PCA por pruebas de permutación, donde aportamos una guía extensa sobre cómo conseguir la selección de componentes de PCA mediante pruebas de permutación y una ilustración completa de un procedimiento algorítmico original implementado para tal fin;
Parte IV - Sobre la modelización de fuentes de variabilidad común y distintiva en el análisis de datos multi-conjunto, donde discutimos varios aspectos prácticos del análisis de componentes comunes y distintivos de dos bloques de datos (realizado por métodos como el Análisis Simultáneo de Componentes - SCA - Análisis Simultáneo de Componentes Distintivos y Comunes - DISCO-SCA - Descomposición Adaptada Generalizada de Valores Singulares - Adapted GSVD - ECO-POWER, Análisis de Correlaciones Canónicas - CCA - y Proyecciones Ortogonales de 2 conjuntos a Estructuras Latentes - O2PLS). Presentamos a su vez una nueva estrategia computacional para determinar el número de factores comunes subyacentes a dos matrices de datos que comparten la misma dimensión de fila o columna y dos planteamientos novedosos para la transferencia de calibración entre espectrómetros de infrarrojo cercano;
Parte V - Sobre el procesamiento y la modelización en tiempo real de flujos de datos de alta dimensión, donde diseñamos la herramienta de Procesamiento en Tiempo Real (OTFP), un nuevo sistema de manejo racional de mediciones multi-canal registradas en tiempo real;
Parte VI - Epílogo, donde presentamos las conclusiones finales, delimitamos las perspectivas futuras, e incluimos los anexos. / La present tesi doctoral, concebuda principalment per a recolzar i reforçar la relació entre l'acadèmia i la indústria, es va desenvolupar en col·laboració amb Shell Global Solutions (Amsterdam, Països Baixos) amb l'esforç d'aplicar i possiblement estendre els enfocaments ja consolidats basats en variables latents (és a dir, Anàlisi de Components Principals - PCA - Regressió en Mínims Quadrats Parcials - PLS - o PLS discriminant - PLSDA) per a la resolució de problemes complexos no solament en els camps de la millora i optimització de processos, sinó també en l'entorn més ampli de l'anàlisi de dades multivariades. A aquest efecte, en tots els capítols proposem noves solucions algorítmiques eficients per a abordar tasques dispars, des de la transferència de calibratge en espectroscopia fins al modelatge en temps real de fluxos de dades.
El manuscrit es divideix en les sis parts següents, centrades en diversos temes d'interès:
Part I - Prefaci, on presentem un resum d'aquest treball de recerca, es donen els seus principals objectius i justificacions juntament amb una breu introducció sobre PCA, PLS i PLSDA;
Part II - Sobre les extensions basades en kernels de PCA, PLS i PLSDA, on presentem el potencial de les tècniques de kernel, eventualment acoblades a variants específiques de la recentment redescoberta projecció de pseudo-mostres, formulada per l'estadista anglés John C. Gower, i comparem el seu rendiment respecte a metodologies més clàssiques en quatre aplicacions a escenaris diferents: segmentació d'imatges Roig-Verd-Blau (RGB), discriminació i monitorització de processos per lots i anàlisi de dissenys d'experiments de mescles;
Part III - Sobre la selecció del nombre de factors en el PCA per proves de permutació, on aportem una guia extensa sobre com aconseguir la selecció de components de PCA a través de proves de permutació i una il·lustració completa d'un procediment algorítmic original implementat per a la finalitat esmentada;
Part IV - Sobre la modelització de fonts de variabilitat comuna i distintiva en l'anàlisi de dades multi-conjunt, on discutim diversos aspectes pràctics de l'anàlisis de components comuns i distintius de dos blocs de dades (realitzat per mètodes com l'Anàlisi Simultània de Components - SCA - Anàlisi Simultània de Components Distintius i Comuns - DISCO-SCA - Descomposició Adaptada Generalitzada en Valors Singulars - Adapted GSVD - ECO-POWER, Anàlisi de Correlacions Canòniques - CCA - i Projeccions Ortogonals de 2 blocs a Estructures Latents - O2PLS). Presentem al mateix temps una nova estratègia computacional per a determinar el nombre de factors comuns subjacents a dues matrius de dades que comparteixen la mateixa dimensió de fila o columna, i dos plantejaments nous per a la transferència de calibratge entre espectròmetres d'infraroig proper;
Part V - Sobre el processament i la modelització en temps real de fluxos de dades d'alta dimensió, on dissenyem l'eina de Processament en Temps Real (OTFP), un nou sistema de tractament racional de mesures multi-canal registrades en temps real;
Part VI - Epíleg, on presentem les conclusions finals, delimitem les perspectives futures, i incloem annexos. / Vitale, R. (2017). Novel chemometric proposals for advanced multivariate data analysis, processing and interpretation [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/90442
|
3 |
Quality by Design through multivariate latent structuresPalací López, Daniel Gonzalo 14 January 2019 (has links)
La presente tesis doctoral surge ante la necesidad creciente por parte de la mayoría de empresas, y en especial (pero no únicamente) aquellas dentro de los sectores farmacéu-tico, químico, alimentación y bioprocesos, de aumentar la flexibilidad en su rango ope-rativo para reducir los costes de fabricación, manteniendo o mejorando la calidad del producto final obtenido. Para ello, esta tesis se centra en la aplicación de los conceptos del Quality by Design para la aplicación y extensión de distintas metodologías ya exis-tentes y el desarrollo de nuevos algoritmos que permitan la implementación de herra-mientas adecuadas para el diseño de experimentos, el análisis multivariante de datos y la optimización de procesos en el ámbito del diseño de mezclas, pero sin limitarse ex-clusivamente a este tipo de problemas.
Parte I - Prefacio, donde se presenta un resumen del trabajo de investigación realiza-do y los objetivos principales que pretende abordar y su justificación, así como una introducción a los conceptos más importantes relativos a los temas tratados en partes posteriores de la tesis, tales como el diseño de experimentos o diversas herramientas estadísticas de análisis multivariado.
Parte II - Optimización en el diseño de mezclas, donde se lleva a cabo una recapitu-lación de las diversas herramientas existentes para el diseño de experimentos y análisis de datos por medios tradicionales relativos al diseño de mezclas, así como de algunas herramientas basadas en variables latentes, tales como la Regresión en Mínimos Cua-drados Parciales (PLS). En esta parte de la tesis también se propone una extensión del PLS basada en kernels para el análisis de datos de diseños de mezclas, y se hace una comparativa de las distintas metodologías presentadas. Finalmente, se incluye una breve presentación del programa MiDAs, desarrollado con la finalidad de ofrecer a sus usuarios la posibilidad de comparar de forma sencilla diversas metodologías para el diseño de experimentos y análisis de datos para problemas de mezclas.
Parte III - Espacio de diseño y optimización a través del espacio latente, donde se aborda el problema fundamental dentro de la filosofía del Quality by Design asociado a la definición del llamado 'espacio de diseño', que comprendería todo el conjunto de posibles combinaciones de condiciones de proceso, materias primas, etc. que garanti-zan la obtención de un producto con la calidad deseada. En esta parte también se trata el problema de la definición del problema de optimización como herramienta para la mejora de la calidad, pero también para la exploración y flexibilización de los procesos productivos, con el objeto de definir un procedimiento eficiente y robusto de optimiza-ción que se adapte a los diversos problemas que exigen recurrir a dicha optimización.
Parte IV - Epílogo, donde se presentan las conclusiones finales, la consecución de objetivos y posibles líneas futuras de investigación. En esta parte se incluyen además los anexos. / Aquesta tesi doctoral sorgeix davant la necessitat creixent per part de la majoria d'em-preses, i especialment (però no únicament) d'aquelles dins dels sectors farmacèutic, químic, alimentari i de bioprocessos, d'augmentar la flexibilitat en el seu rang operatiu per tal de reduir els costos de fabricació, mantenint o millorant la qualitat del producte final obtingut. La tesi se centra en l'aplicació dels conceptes del Quality by Design per a l'aplicació i extensió de diferents metodologies ja existents i el desenvolupament de nous algorismes que permeten la implementació d'eines adequades per al disseny d'ex-periments, l'anàlisi multivariada de dades i l'optimització de processos en l'àmbit del disseny de mescles, però sense limitar-se exclusivament a aquest tipus de problemes.
Part I- Prefaci, en què es presenta un resum del treball de recerca realitzat i els objec-tius principals que pretén abordar i la seua justificació, així com una introducció als conceptes més importants relatius als temes tractats en parts posteriors de la tesi, com ara el disseny d'experiments o diverses eines estadístiques d'anàlisi multivariada.
Part II - Optimització en el disseny de mescles, on es duu a terme una recapitulació de les diverses eines existents per al disseny d'experiments i anàlisi de dades per mit-jans tradicionals relatius al disseny de mescles, així com d'algunes eines basades en variables latents, tals com la Regressió en Mínims Quadrats Parcials (PLS). En aquesta part de la tesi també es proposa una extensió del PLS basada en kernels per a l'anàlisi de dades de dissenys de mescles, i es fa una comparativa de les diferents metodologies presentades. Finalment, s'inclou una breu presentació del programari MiDAs, que ofe-reix la possibilitat als usuaris de comparar de forma senzilla diverses metodologies per al disseny d'experiments i l'anàlisi de dades per a problemes de mescles.
Part III- Espai de disseny i optimització a través de l'espai latent, on s'aborda el problema fonamental dins de la filosofia del Quality by Design associat a la definició de l'anomenat 'espai de disseny', que comprendria tot el conjunt de possibles combina-cions de condicions de procés, matèries primeres, etc. que garanteixen l'obtenció d'un producte amb la qualitat desitjada. En aquesta part també es tracta el problema de la definició del problema d'optimització com a eina per a la millora de la qualitat, però també per a l'exploració i flexibilització dels processos productius, amb l'objecte de definir un procediment eficient i robust d'optimització que s'adapti als diversos pro-blemes que exigeixen recórrer a aquesta optimització.
Part IV- Epíleg, on es presenten les conclusions finals i la consecució d'objectius i es plantegen possibles línies futures de recerca arran dels resultats de la tesi. En aquesta part s'inclouen a més els annexos. / The present Ph.D. thesis is motivated by the growing need in most companies, and specially (but not solely) those in the pharmaceutical, chemical, food and bioprocess fields, to increase the flexibility in their operating conditions in order to reduce production costs while maintaining or even improving the quality of their products. To this end, this thesis focuses on the application of the concepts of the Quality by Design for the exploitation and development of already existing methodologies, and the development of new algorithms aimed at the proper implementation of tools for the design of experiments, multivariate data analysis and process optimization, specially (but not only) in the context of mixture design.
Part I - Preface, where a summary of the research work done, the main goals it aimed at and their justification, are presented. Some of the most relevant concepts related to the developed work in subsequent chapters are also introduced, such as those regarding design of experiments or latent variable-based multivariate data analysis techniques.
Part II - Mixture design optimization, in which a review of existing mixture design tools for the design of experiments and data analysis via traditional approaches, as well as some latent variable-based techniques, such as Partial Least Squares (PLS), is provided. A kernel-based extension of PLS for mixture design data analysis is also proposed, and the different available methods are compared to each other. Finally, a brief presentation of the software MiDAs is done. MiDAs has been developed in order to provide users with a tool to easily approach mixture design problems for the construction of Designs of Experiments and data analysis with different methods and compare them.
Part III - Design Space and optimization through the latent space, where one of the fundamental issues within the Quality by Design philosophy, the definition of the so-called 'design space' (i.e. the subspace comprised by all possible combinations of process operating conditions, raw materials, etc. that guarantee obtaining a product meeting a required quality standard), is addressed. The problem of properly defining the optimization problem is also tackled, not only as a tool for quality improvement but also when it is to be used for exploration of process flexibilisation purposes, in order to establish an efficient and robust optimization method in accordance with the nature of the different problems that may require such optimization to be resorted to.
Part IV - Epilogue, where final conclusions are drawn, future perspectives suggested, and annexes are included. / Palací López, DG. (2018). Quality by Design through multivariate latent structures [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/115489
|
4 |
Fraktionierung des Chemischen Sauerstoffbedarfs mithilfe von Extinktionsmessungen im UV/Vis-SpektralbereichWeber, Steffen 21 April 2023 (has links)
Das Messverfahren der optischen Spektrophotometrie wird zur kontinuierlichen Messung der Abwasserqualität auf ihre Einsatztauglichkeit überprüft. Der chemische Sauerstoffbedarf (CSB) wird als zentraler Kennwert für die stoffliche Verschmutzung von Abwasser und für dessen Nachweis in Oberflächengewässern eingesetzt, welche es zu bestimmen galt. Dabei wird der Informationsgehalt über eine organische, summarische Kohlenstoffbelastung mittels einer zusätzlichen Fraktionierung erhöht. In einer Labormesskampagne werden auf der Grundlage von Respirationsversuchen Daten aus Extinktionswerten des UV/Vis-Spektrums und Referenzwerten (Standardanalyseparameter und simulierte Stoffkonzentrationen mithilfe des Activated Sludge Modell No. 1) generiert. Darauf aufbauend werden Kalibrationsmodelle für den CSB und einzelne Fraktionen entwickelt. Die Modelle werden mithilfe des Regressionsansatzes der Partial-Least-Squares entwickelt und im Rahmen eines Anwendungsbeispiels auf ihre Praxistauglichkeit überprüft. Als Ergebnis dieser Arbeit stehen Kalibrationsmodelle für den Einsatz im kommunalem Abwasser unter Trockenwetterbedingungen zur Verfügung. Die Vorhersagequalität nimmt mit zunehmender Differenzierung ab. Von einer Weiterverwendung der berechneten Äquivalentkonzentrationen für die CSB-Fraktionen (SS, XS, SI und XI), z. B. als Kalibriergröße für Stofftransportmodelle oder als Steuer- und Regelgröße, wird allerdings abgeraten. Als Ursache für die hohen Messungenauigkeiten wurde eine unzureichende Anpassung an die Veränderungen in der Abwasserzusammensetzung während eines Trockenwettertagesganges identifiziert. Mit einer erweiterten Datengrundlage, unter der Verwendung von Standardanalyseparametern (CSB, CSBmf und BSB) in einer Abwasserprobe, welche für den Ausschluss von Stoffverbindungen vor und nach einer respirativen Vorbehandlung bestimmt werden, wird eine höhere Modellgüte in Aussicht gestellt. Darüber hinaus wird ein Umdenken hinsichtlich statischer - hin zu dynamischen - Kalibrationsfunktionen für UV/Vis-Sensoren vorgeschlagen. Eine Generalisierbarkeit der entwickelten Kalibrationsmodelle auf weitere Wetterbedingungen, Messstandorte oder Sensoren wird nicht empfohlen.:Abbildungen VI
Tabellen XIII
Abkürzungen XV
1 Einleitung 1
1.1 Motivation 1
1.2 Zielstellung 2
2 Stand der Forschung 5
2.1 Kohlenstoffe 6
2.1.1 Zusammensetzung und Herkunft im häuslichen Abwasser 7
2.1.1.1 Fette 8
2.1.1.2 Proteine 8
2.1.1.3 Tenside 9
2.1.1.4 Phenole 10
2.1.1.5 Kohlenwasserstoffe 10
2.1.2 Fraktionierung von Kohlenstoffverbindungen 11
2.1.2.1 Chemischer Sauerstoffbedarf 12
2.1.2.2 Ansätze zur CSB-Fraktionierung 12
2.1.2.3 Stoffzusammensetzung einzelner CSB-Fraktionen 15
2.1.2.4 Messmethoden zur Bestimmung des CSB 18
2.2 Optische Spektroskopie 20
2.2.1 Grundlagen 20
2.2.1.1 Elektromagnetische Strahlung 20
2.2.1.2 Einordnung der optischen Spektroskopie 21
2.2.1.3 Lichtabsorption 21
2.2.1.4 Chemisch-physikalische Grundlagen 22
2.2.1.5 Mathematische Grundlagen 24
2.2.1.6 Extinktionsmessung 25
2.2.2 Online-Messtechnik 26
2.2.2.1 Sensoren /-hersteller 26
2.2.2.2 Kalibrierung 26
2.2.2.2.1 Kalibrierung der S::CAN MESSTECHNIK GmbH 27
2.2.2.2.2 Unabhängige Analyseverfahren zur Auswertung spektrophotometrischer Messreihen 28
2.2.2.3 Messung 29
2.2.2.3.1 Einstellungen und Voraussetzungen 29
2.2.2.3.2 Qualitative Einflussnahme von Störgrößen auf die spektroskopische Datenerfassung 30
2.2.3 Einsatz in der Siedlungswasserwirtschaft und Hydrologie 31
3 Versuchsdurchführung und Analytik 33
3.1 Messkampagnen 33
3.1.1 Labormessversuche 33
3.1.1.1 Respirationsversuch 34
3.1.1.1.1 Versuchsaufbau zum Respirationsversuch 35
3.1.1.1.2 Betriebshinweise Respirationsversuch 38
3.1.1.2 Verdünnungsversuch 41
3.1.1.2.1 Versuchsaufbau zum Verdünnungsversuch 42
3.1.1.2.2 Betriebshinweise Verdünnungsversuch 43
3.1.2 Feldmessversuch 43
3.1.2.1 Versuchsaufbau zum Feldmessversuch 44
3.1.2.2 Betriebshinweise Feldmessversuch 46
3.2 Abwasserproben: Aufbewahrung und Analytik 47
3.2.1 Konservierung und Probenvorbehandlung 48
3.2.2 Standardisierte Laboranalyseverfahren 49
3.2.2.1 CSB 49
3.2.2.2 Biologischer Sauerstoffbedarf BSBn 50
3.3 Mess- und Regelinstrumente 51
3.3.1 Optischer Multiparameter-Sensor 51
3.3.2 Luminescent Dissolved Oxygen-Sensor (LDO) 53
3.3.3 Peristaltik-Pumpe 54
3.3.4 Dispergierer 54
4 Untersuchungen zur Entwicklung und Anwendung von UV/Vis-Kalibrierungen
55
4.1 Statistische Verfahren zur Kalibrierung 55
4.1.1 Datengrundlage und Methoden 56
4.1.1.1 Datengrundlage 56
4.1.1.2 Multivariate Datenanalyse 57
4.1.1.2.1 Regressionsanalyse 58
4.1.1.2.1.1 Schätzung der Regressionsfunktion 59
4.1.1.2.2 Qualitätsprüfung 61
4.1.1.2.3 Prüfung der Modellprämissen 63
4.1.1.2.4 Multivariate Regressionsanalyse 66
4.1.1.3 Vergleich der Kalibrierverfahren 70
4.1.2 Ergebnisse 70
4.1.2.1 Regressionsansätze für UV/Vis-Kalibrierung 70
4.1.2.1.1 Partial-Least-Squares Regression (PLS-R) 70
4.1.2.1.2 Lasso-Regression 73
4.1.2.1.3 Herstellerkalibrierung (SCAN GmbH) 73
4.1.2.1.3.1 Anwendung der globalen Herstellerkalibrierung 73
4.1.2.1.3.2 Lokal angepasste Herstellerkalibrierung 74
4.1.3 Auswertungen 75
4.1.3.1 Tauglichkeit angewandter Regressionsansätze zur Entwicklung von UV/Vis-Kalibrierfunktionen 75
4.1.3.1.1 Vergleich der Vorhersagequalitäten zwischen Regressionsansätzen und Herstellerkali¬- brierung 75
4.1.3.1.2 Aussagekraft angewandter Regressionsmodelle 77
4.1.3.1.2.1 Regressionsfunktion und -koeffizienten 77
4.1.3.1.2.2 Modellprämissen 78
4.1.3.2 Identifizierung signifikanter WL oder -Bereiche 80
4.2 Fraktionierung von CSB-Verbindungen 81
4.2.1 Datengrundlage und Methoden 82
4.2.1.1 Laborwertmethode 83
4.2.1.2 Modellwertmethode 85
4.2.1.2.1 Respirometrische Messung 86
4.2.1.2.2 Sauerstoffverbrauchsrate 87
4.2.1.2.3 Modellberechnung 89
4.2.1.2.4 Simulationsmethode mit modifiziertem Activated Sludge Modell No. 1 92
4.2.1.2.5 Modellkalibrierung 95
4.2.1.2.6 Datenauswahl 96
4.2.1.3 Lichtabsorptionsmethode 96
4.2.2 Ergebnisse 97
4.2.2.1 Modellwertmethode mit ASM No. 1 97
4.2.2.2 Auswahl von Modelldaten 100
4.2.2.3 UV/Vis-Kalibrierfunktionen 101
4.2.2.3.1 CSB-Fraktionen 101
4.2.2.3.2 Vergleich MW- und LW-Modell 103
4.2.3 Auswertungen 104
4.2.3.1 Tauglichkeit von Simulationsergebnissen aus Modellwertmethode zur Entwicklung von Kalibrierfunktionen 104
4.2.3.2 Abweichende Vorhersagequalitäten zwischen den UV/Vis-Kalibrierfunktionen 106
4.2.3.3 Messunsicherheiten und Modellqualität 107
4.2.3.4 Signifikante Wellenlängen oder -bereiche für einzelne CSB-Fraktionen
109
4.3 Anwendungsbeispiel: Kohlenstoffumsatz entlang einer Fließstrecke 111
4.3.1 Datengrundlage und Methoden 112
4.3.1.1 Einsatz von UV/Vis-Messtechnik 115
4.3.1.1.1 Vergleichbarkeit bei Parallelbetrieb baugleicher Sensoren 115
4.3.1.1.1.1 Versuchsdurchführung 116
4.3.1.1.1.2 Berechnungsansätze 116
4.3.1.1.2 Lokale Kalibrierung 117
4.3.1.1.2.1 Univariat 118
4.3.1.1.2.2 Multivariat 118
4.3.1.2 Kohlenstoffumwandlung und -umsatz innerhalb des Durchflussreaktors
118
4.3.1.2.1 Vorverarbeitung von UV/Vis-Daten 120
4.3.1.2.2 Zeitsynchronisation mithilfe der Fließzeit 120
4.3.1.2.3 Bestimmung von stofflichen Veränderungen in einem Wasserpaket 121
4.3.2 Ergebnisse 122
4.3.2.1 Praxiseinsatz von UV/Vis-Messtechnik 122
4.3.2.1.1 Stabilität und Vergleichbarkeit von Messsignalen bei unterschiedlichen Sensoren 122
4.3.2.1.1.1 Messgüte 122
4.3.2.1.1.2 Sensoranpassung 124
4.3.2.1.2 UV/Vis-Kalibrationsfunktionen 125
4.3.2.1.2.1 Validierung LK-PLS-R 126
4.3.2.1.2.2 Lokale Nachkalibrierung LK-PLS-R 128
4.3.2.1.3 Anwendung entwickelter Kalibrationsmodelle auf Zeitreihen 130
4.3.2.2 Kohlenstoffumsatz 131
4.3.3 Auswertungen 135
4.3.3.1 Tauglichkeit von UV/Vis-Messtechnik für den Einsatz in der Kanalisation
135
4.3.3.1.1 Vorhersagegenauigkeit von Kalibrationsfunktionen 135
4.3.3.1.2 Abweichende Messergebnisse der Extinktion von einzelnen Sensoren 135
4.3.3.2 Veränderungen in den Konzentrationen einzelner Kohlenstofffraktionen entlang der Fließstrecke 136
5 Diskussion 139
6 Ausblick 151
7 Zusammenfassung 153
8 Literaturverzeichnis 157
A Anhang 171
A.1 Respirationsversuche CSB-Fraktionen 171
A.1.1 Quellcode - CSB-Fraktionierung 171
A.1.2 Respirationsversuche CSB-Fraktionen 175
A.1.3 Quellcode - PLS-Regression 178
A.1.4 UV/Vis-Kalibrierung - CSB-Fraktionen 180
A.1.5 Modellgüte 183
A.1.6 Modellprämissen 184
A.2 Feldmesskampagne 188
A.2.1 Sensorkompensation 188
A.2.2 Korrelationsplots 189
A.2.2.1 Validierung der Kalibrationsmodelle 189
A.2.2.2 Nachkalibrierung der Kalibrationsmodelle 192
A.2.2.2.1 univariat 192
A.2.3 Stoffliche Veränderungen in Wasserpaketen 198
A.2.4 Laboranalysen Stoffliche Veränderungen in Wasserpaketen 201 / Optical spectrophotometry is checked as measuring method for continuous monitoring of waste water quality. The chemical oxygen demand (COD) is used as a central parame-ter for the material assessment of waste water and for its detection in surface waters. The information value about an organic load is increased using an additional fractiona-tion. In a laboratory measurement campaign, data from extinction values of the UV/Vis spectrum and reference values are created (standard analysis parameters and simulated concentrations by using the Activated Sludge Model No. 1). Based on this calibration models for the COD and individual fractions are developed using the regression ap-proach of the partial least squares and their practical suitability is checked in the context of an application example. As a result of this work, calibration models for use in munici-pal wastewater under dry weather conditions, are available. The prediction quality de-creases with increasing differentiation. We advise against further use of the calculated equivalent concentrations for the COD fractions (SS, XS, SI und XI), e.g. as a calibration var-iable for mass transfer models or as a control and regulation variable. The reason for higher measurement uncertainties is identified as insufficient adaptation to the changing wastewater composition during a dry weather day. With an extended data basis, a higher model quality is promised: Standard analysis parameters (COD, CODmf and BOD) are de-termined in wastewater samples before and after respiratory pretreatment in order to be able to rule out substances. In addition, rethinking of static calibration functions for UV/Vis sensors is proposed towards dynamic methods. A generalization of calibration models to other weather conditions, measurement locations or sensors is not recom-mended.:Abbildungen VI
Tabellen XIII
Abkürzungen XV
1 Einleitung 1
1.1 Motivation 1
1.2 Zielstellung 2
2 Stand der Forschung 5
2.1 Kohlenstoffe 6
2.1.1 Zusammensetzung und Herkunft im häuslichen Abwasser 7
2.1.1.1 Fette 8
2.1.1.2 Proteine 8
2.1.1.3 Tenside 9
2.1.1.4 Phenole 10
2.1.1.5 Kohlenwasserstoffe 10
2.1.2 Fraktionierung von Kohlenstoffverbindungen 11
2.1.2.1 Chemischer Sauerstoffbedarf 12
2.1.2.2 Ansätze zur CSB-Fraktionierung 12
2.1.2.3 Stoffzusammensetzung einzelner CSB-Fraktionen 15
2.1.2.4 Messmethoden zur Bestimmung des CSB 18
2.2 Optische Spektroskopie 20
2.2.1 Grundlagen 20
2.2.1.1 Elektromagnetische Strahlung 20
2.2.1.2 Einordnung der optischen Spektroskopie 21
2.2.1.3 Lichtabsorption 21
2.2.1.4 Chemisch-physikalische Grundlagen 22
2.2.1.5 Mathematische Grundlagen 24
2.2.1.6 Extinktionsmessung 25
2.2.2 Online-Messtechnik 26
2.2.2.1 Sensoren /-hersteller 26
2.2.2.2 Kalibrierung 26
2.2.2.2.1 Kalibrierung der S::CAN MESSTECHNIK GmbH 27
2.2.2.2.2 Unabhängige Analyseverfahren zur Auswertung spektrophotometrischer Messreihen 28
2.2.2.3 Messung 29
2.2.2.3.1 Einstellungen und Voraussetzungen 29
2.2.2.3.2 Qualitative Einflussnahme von Störgrößen auf die spektroskopische Datenerfassung 30
2.2.3 Einsatz in der Siedlungswasserwirtschaft und Hydrologie 31
3 Versuchsdurchführung und Analytik 33
3.1 Messkampagnen 33
3.1.1 Labormessversuche 33
3.1.1.1 Respirationsversuch 34
3.1.1.1.1 Versuchsaufbau zum Respirationsversuch 35
3.1.1.1.2 Betriebshinweise Respirationsversuch 38
3.1.1.2 Verdünnungsversuch 41
3.1.1.2.1 Versuchsaufbau zum Verdünnungsversuch 42
3.1.1.2.2 Betriebshinweise Verdünnungsversuch 43
3.1.2 Feldmessversuch 43
3.1.2.1 Versuchsaufbau zum Feldmessversuch 44
3.1.2.2 Betriebshinweise Feldmessversuch 46
3.2 Abwasserproben: Aufbewahrung und Analytik 47
3.2.1 Konservierung und Probenvorbehandlung 48
3.2.2 Standardisierte Laboranalyseverfahren 49
3.2.2.1 CSB 49
3.2.2.2 Biologischer Sauerstoffbedarf BSBn 50
3.3 Mess- und Regelinstrumente 51
3.3.1 Optischer Multiparameter-Sensor 51
3.3.2 Luminescent Dissolved Oxygen-Sensor (LDO) 53
3.3.3 Peristaltik-Pumpe 54
3.3.4 Dispergierer 54
4 Untersuchungen zur Entwicklung und Anwendung von UV/Vis-Kalibrierungen
55
4.1 Statistische Verfahren zur Kalibrierung 55
4.1.1 Datengrundlage und Methoden 56
4.1.1.1 Datengrundlage 56
4.1.1.2 Multivariate Datenanalyse 57
4.1.1.2.1 Regressionsanalyse 58
4.1.1.2.1.1 Schätzung der Regressionsfunktion 59
4.1.1.2.2 Qualitätsprüfung 61
4.1.1.2.3 Prüfung der Modellprämissen 63
4.1.1.2.4 Multivariate Regressionsanalyse 66
4.1.1.3 Vergleich der Kalibrierverfahren 70
4.1.2 Ergebnisse 70
4.1.2.1 Regressionsansätze für UV/Vis-Kalibrierung 70
4.1.2.1.1 Partial-Least-Squares Regression (PLS-R) 70
4.1.2.1.2 Lasso-Regression 73
4.1.2.1.3 Herstellerkalibrierung (SCAN GmbH) 73
4.1.2.1.3.1 Anwendung der globalen Herstellerkalibrierung 73
4.1.2.1.3.2 Lokal angepasste Herstellerkalibrierung 74
4.1.3 Auswertungen 75
4.1.3.1 Tauglichkeit angewandter Regressionsansätze zur Entwicklung von UV/Vis-Kalibrierfunktionen 75
4.1.3.1.1 Vergleich der Vorhersagequalitäten zwischen Regressionsansätzen und Herstellerkali¬- brierung 75
4.1.3.1.2 Aussagekraft angewandter Regressionsmodelle 77
4.1.3.1.2.1 Regressionsfunktion und -koeffizienten 77
4.1.3.1.2.2 Modellprämissen 78
4.1.3.2 Identifizierung signifikanter WL oder -Bereiche 80
4.2 Fraktionierung von CSB-Verbindungen 81
4.2.1 Datengrundlage und Methoden 82
4.2.1.1 Laborwertmethode 83
4.2.1.2 Modellwertmethode 85
4.2.1.2.1 Respirometrische Messung 86
4.2.1.2.2 Sauerstoffverbrauchsrate 87
4.2.1.2.3 Modellberechnung 89
4.2.1.2.4 Simulationsmethode mit modifiziertem Activated Sludge Modell No. 1 92
4.2.1.2.5 Modellkalibrierung 95
4.2.1.2.6 Datenauswahl 96
4.2.1.3 Lichtabsorptionsmethode 96
4.2.2 Ergebnisse 97
4.2.2.1 Modellwertmethode mit ASM No. 1 97
4.2.2.2 Auswahl von Modelldaten 100
4.2.2.3 UV/Vis-Kalibrierfunktionen 101
4.2.2.3.1 CSB-Fraktionen 101
4.2.2.3.2 Vergleich MW- und LW-Modell 103
4.2.3 Auswertungen 104
4.2.3.1 Tauglichkeit von Simulationsergebnissen aus Modellwertmethode zur Entwicklung von Kalibrierfunktionen 104
4.2.3.2 Abweichende Vorhersagequalitäten zwischen den UV/Vis-Kalibrierfunktionen 106
4.2.3.3 Messunsicherheiten und Modellqualität 107
4.2.3.4 Signifikante Wellenlängen oder -bereiche für einzelne CSB-Fraktionen
109
4.3 Anwendungsbeispiel: Kohlenstoffumsatz entlang einer Fließstrecke 111
4.3.1 Datengrundlage und Methoden 112
4.3.1.1 Einsatz von UV/Vis-Messtechnik 115
4.3.1.1.1 Vergleichbarkeit bei Parallelbetrieb baugleicher Sensoren 115
4.3.1.1.1.1 Versuchsdurchführung 116
4.3.1.1.1.2 Berechnungsansätze 116
4.3.1.1.2 Lokale Kalibrierung 117
4.3.1.1.2.1 Univariat 118
4.3.1.1.2.2 Multivariat 118
4.3.1.2 Kohlenstoffumwandlung und -umsatz innerhalb des Durchflussreaktors
118
4.3.1.2.1 Vorverarbeitung von UV/Vis-Daten 120
4.3.1.2.2 Zeitsynchronisation mithilfe der Fließzeit 120
4.3.1.2.3 Bestimmung von stofflichen Veränderungen in einem Wasserpaket 121
4.3.2 Ergebnisse 122
4.3.2.1 Praxiseinsatz von UV/Vis-Messtechnik 122
4.3.2.1.1 Stabilität und Vergleichbarkeit von Messsignalen bei unterschiedlichen Sensoren 122
4.3.2.1.1.1 Messgüte 122
4.3.2.1.1.2 Sensoranpassung 124
4.3.2.1.2 UV/Vis-Kalibrationsfunktionen 125
4.3.2.1.2.1 Validierung LK-PLS-R 126
4.3.2.1.2.2 Lokale Nachkalibrierung LK-PLS-R 128
4.3.2.1.3 Anwendung entwickelter Kalibrationsmodelle auf Zeitreihen 130
4.3.2.2 Kohlenstoffumsatz 131
4.3.3 Auswertungen 135
4.3.3.1 Tauglichkeit von UV/Vis-Messtechnik für den Einsatz in der Kanalisation
135
4.3.3.1.1 Vorhersagegenauigkeit von Kalibrationsfunktionen 135
4.3.3.1.2 Abweichende Messergebnisse der Extinktion von einzelnen Sensoren 135
4.3.3.2 Veränderungen in den Konzentrationen einzelner Kohlenstofffraktionen entlang der Fließstrecke 136
5 Diskussion 139
6 Ausblick 151
7 Zusammenfassung 153
8 Literaturverzeichnis 157
A Anhang 171
A.1 Respirationsversuche CSB-Fraktionen 171
A.1.1 Quellcode - CSB-Fraktionierung 171
A.1.2 Respirationsversuche CSB-Fraktionen 175
A.1.3 Quellcode - PLS-Regression 178
A.1.4 UV/Vis-Kalibrierung - CSB-Fraktionen 180
A.1.5 Modellgüte 183
A.1.6 Modellprämissen 184
A.2 Feldmesskampagne 188
A.2.1 Sensorkompensation 188
A.2.2 Korrelationsplots 189
A.2.2.1 Validierung der Kalibrationsmodelle 189
A.2.2.2 Nachkalibrierung der Kalibrationsmodelle 192
A.2.2.2.1 univariat 192
A.2.3 Stoffliche Veränderungen in Wasserpaketen 198
A.2.4 Laboranalysen Stoffliche Veränderungen in Wasserpaketen 201
|
5 |
Phytochemical investigation of Acronychia species using NMR and LC-MS based dereplication and metabolomics approaches / Etude phytochimique d’espèces du genre Acronychia en utilisant des approches de déréplication et métabolomique basées sur des techniques RMN et SMKouloura, Eirini 28 November 2014 (has links)
Les plantes médicinales constituent une source inexhaustible de composés (des produits naturels - PN) utilisé en médecine pour la prévention et le traitement de diverses maladies. L'introduction de nouvelles technologies et méthodes dans le domaine de la chimie des produits naturels a permis le développement de méthodes ‘high throughput’ pour la détermination de la composition chimique des extraits de plantes, l'évaluation de leurs propriétés et l'exploration de leur potentiel en tant que candidats médicaments. Dernièrement, la métabolomique, une approche intégrée incorporant les avantages des technologies d'analyse moderne et la puissance de la bioinformatique s’est révélé un outil efficace dans la biologie des systèmes. En particulier, l'application de la métabolomique pour la découverte de nouveaux composés bioactifs constitue un domaine émergent dans la chimie des produits naturels. Dans ce contexte, le genre Acronychia de la famille des Rutaceae a été choisi sur la base de son usage en médecine traditionnelle pour ses propriétés antimicrobienne, antipyrétique, antispasmodique et anti-inflammatoire. Nombre de méthodes chromatographiques modernes, spectrométriques et spectroscopiques sont utilisées pour l'exploration de leur contenu en métabolites suivant trois axes principaux constituant les trois chapitres de cette thèse. En bref, le premier chapitre décrit l’étude phytochimique d’Acronychia pedunculata, l’identification des métabolites secondaires contenus dans cette espèce et l'évaluation de leurs propriétés biologiques. Le deuxième chapitre vise au développement de méthodes analytiques pour l'identification des dimères d’acétophénones (marqueurs chimiotaxonomiques du genre) et aux stratégies utilisées pour la déréplication de ces différents extraits et la caractérisation chimique des composés par UHPLC-HRMSn. Le troisième chapitre se concentre sur l'application de méthodologies métabolomique (RMN et LC-MS) pour l'analyse comparative (entre les différentes espèces, origines, organes), pour des études chimiotaxonomiques (entre les espèces) et pour la corrélation des composés contenus avec une activité pharmacologique. / Medicinal plants constitute an unfailing source of compounds (natural products – NPs) utilised in medicine for the prevention and treatment of various deceases. The introduction of new technologies and methods in the field of natural products chemistry enabled the development of high throughput methodologies for the chemical composition determination of plant extracts, evaluation of their properties and the exploration of their potentials as drug candidates. Lately, metabolomics, an integrated approach incorporating the advantages of modern analytical technologies and the power of bioinformatics has been proven an efficient tool in systems biology. In particular, the application of metabolomics for the discovery of new bioactive compounds constitutes an emerging field in natural products chemistry. In this context, Acronychia genus of Rutaceae family was selected based on its well-known traditional use as antimicrobial, antipyretic, antispasmodic and anti-inflammatory therapeutic agent. Modern chromatographic, spectrometric and spectroscopic methods were utilised for the exploration of their metabolite content following three basic axes constituting the three chapters of this thesis. Briefly, the first chapter describes the phytochemical investigation of Acronychia pedunculata, the identification of secondary metabolites contained in this species and evaluation of their biological properties. The second chapter refers to the development of analytical methods for the identification of acetophenones (chemotaxonomic markers of the genus) and to the dereplication strategies for the chemical characterisation of extracts by UHPLC-HRMSn. The third chapter focuses on the application of metabolomic methodologies (LC-MS & NMR) for comparative analysis (between different species, origins, organs), chemotaxonomic studies (between species) and compound-activity correlations.
|
Page generated in 0.1702 seconds