Spelling suggestions: "subject:"multivariante"" "subject:"multivariable""
11 |
Nous desenvolupaments, aplicacions bioanalítiques i validació dels mètodes de resolució multivariantJaumot Soler, Joaquim 20 June 2006 (has links)
Aquest treball s'integra en una de les línies d'investigació del grup de recerca "Quimiometria" del Departament de Química Analítica de la Universitat de Barcelona. Aquesta línia d'investigació es centra en el desenvolupament de mètodes quimiomètrics d'anàlisi multivariant de dades, i en la seva aplicació a l'estudi analític dels canvis de conformació i/o de les interaccions entre biomolècules.Actualment és possible enregistrar l'espectre sencer d'una mostra en poc temps. Aquest augment del nombre i de la complexitat de les dades adquirides ha portat a l'aparició de mètodes que tenen com a finalitat la obtenció d'informació d'interés físico-químic a partir d'aquests conjunt de dades. Amb aquesta finalitat es poden trobar dues aproximacions: a) els mètodes de modelatge rígid que exigeixen la postulació d'un model químic o cinètic al qual ajustar les dades experimentals, i b) els mètodes de modelatge flexible que no necessiten la postulació d'un model.El treball realitzat en aquests tesi doctoral es pot dividir en tres blocs.En primer lloc, s'ha desenvolupat una interfície gràfica en l'entorn de programació MATLAB pel mètode de resolució multivariant de corbes mitjançant mínims quadrats alternats (MCR-ALS). Aquesta interfície millora notablement la interacció entre l'usuari i el programa, i potencía la seva utilització generalitzada per part d'usuaris no acostumats a treballar amb eines pròpies de la Quimiometria.En segon lloc, s'ha dut a terme la validació de diversos mètodes d'anàlisi multivariant, és a dir, s'ha estudiat la fiabilitat de les solucions obtingudes per aquest tipus de mètodes quimiomètrics. Així, pel mètode MCR-ALS, s'ha analitzat la influència i la propagació de l'error experimental i les possibles repercusions sobre les ambigüetats matemàtiques existents en les solucions obtingudes. Aquest estudi s'ha realitzat tant en el cas de l'anàlisi individual de matrius de dades obtingudes en un únic experiment, com en el cas de l'anàlisi simultani de matrius de dades obtingudes en diversos experiments. En el cas dels mètodes de modelatge rígid s'ha estudiat l'ambigüetat existent al ajustar mecanismes cinètics complexos. En aquest cas s'ha observat l'aparició de mínims locals múltiples amb el mateix valor d'ajust en la superfície de desposta associada.Finalment, s'han aplicat els mètodes quimiomètrics de modelatge flexible i de modelatge rígid a l'estudi dels equilibris en solució dels àcids nucleics. Aquestes són biomolècules que tenen una organització jeràrquica començant en la seqüència de nucleòtids a les cadenes fins a estructures complexes d'ordre superior com els tríplexs o quadruplexs. Els canvis conformacionals o les interaccions amb d'altres biomolècules s'han estudiat tradicionalment mitjançant experiments seguits amb tècniques espectroscòpies. En aquest treball es seguiran aquests processos mitjançant lectures a moltes longituts d'ona (aproximació multivariant) i s'aplicaran mètodes quimiomètrics adients de tractaments de dades multivariants. Els procesos estudiants en aquesta Tesi són bàsicament els canvis conformacionals provocats en variar condicions del medi, com el pH, la temperatura, la concentració d'altres ions... S'han emprat tècniques espectroscòpiques com l'absorció molecular a l'UV-visible, la fluorescència, el dicroisme circular i la ressonància magnètica nuclear. Una altra aplicació, ha estat l'anàlisi de micromatrius d'ADN. L'aparició d'aquesta la tecnologia ha permès obtenir informació sobre els nivells de l'expressió gènica per un gran nombre de gens en un únic experiment. La generació de grans quantitats de dades requereix la utilització d'eines mitjançant les quals es pugui extreure la informació biològica. En aquest treball s'ha aplicat el mètode MCR-ALS a l'anàlisis de diversos conjunts de dades per tal de poder determinar la relació entre les mostres que presenten diferents tipus de càncer i els gens estudiats. / OF THE PHD THESIS: This PhD Thesis has been developed in the framework of the Chemometrics group at the Universitat de Barcelona. The work deals with the development and validation of Multivariate Curve Resolution (MCR) methods (both hard- and soft-modelling), and with their application to bioanalytical problems. The work has been organized into three blocks:First, a graphical interface has been developed for the program running the MCR-ALS (Multivariate Curve resolution Alternating Least Squares) method in the MATLAB® environment. This interface improves the interaction between the user and the program and facilitates the use of multivariate curve resolution to little experineced potential users.Secondly, validation of multivariate resolution methods of data analysis has been carried out. For the MCR-ALS method, effects of rotational ambiguities and of propagation of experimental noise have been studied. These studies have been performed in the analysis of a single experiment and in the case of analyzing multiple experiments simultaneously. In the case of hard-modelling kinetic data fitting methods, ambiguities in the analysis of kinetic experiments have been studied and methods to overcome this ambiguity have been proposed.Third, multivariate resolution methods have been applied to the study of conformational equilibria of nucleic acids. These are biomolecules that have a hierarchic organization from the nucleotide sequence to higher order structures such as triplex or quadruplex. Traditionally, conformational changes or interactions of nucleic acids with other biomolecules have been spectroscopically monitored at just one wavelength. In this work, these processes have been followed at multiple wavelengths and suitable multivariate resolution methods for the data treatment have been applied. Processes studied during this Thesis have been DNA conformational changes induced by pH, temperature or salinity. Spectroscopic techniques such as molecular absorption in the UV-visible, circular dichroism or nuclear magnetic resonance have been used for this purpose. Finally, data obtained using DNA microarrays have been analyzed. This technique allows highthroughput analysis of relative gene expressions of thousands of genes of an organism that generates large amounts of data. This has caused a need for statistical methods that can extract useful information for further research. In this PhD Thesis, the MCR-ALS method has been proposed for the analysis of this kind of data with very promising results.
|
12 |
Utilización de métricas riemannianas en análisis de datos multidimensionales y su aplicación a la biologíaOller i Sala, Josep Maria 25 November 1982 (has links)
Esta Memoria es una aportación al Análisis Multivariante y su aplicación a la Biología. Los numerosos índices de disimilaridad y distancias que se utilizan en Estadística y son aplicados en Genética, Antropología, Ecología, etc., me han motivado a intentar estudiar una distancia entre poblaciones estadísticas paramétricas, de aplicación general, y que posea buenas propiedades matemáticas.En la primera parte (cap. 1 al 6), se desarrolla esta distancia estadística, definible para una clase muy general de funciones de densidad paramétricas, a través de la matriz de información de Fisher, hallando algunas de sus propiedades básicas y calculándola para ciertas distribuciones de probabilidad concretas. En la segunda parte (cap. 7 al 9), se aplican algunos de los resultados obtenidos, proponiendo una metodología estadística para el tratamiento de tablas de contingencia multidimensionales, asociadas a experiencias etológicas, ilustrándolo con el estudio, de la conducta agonística del lugano. También se propone un algoritmo utilizable para el diagnóstico de enfermedades, a partir de los resulta¬dos de unos análisis, aplicándolo al diagnóstico de ciertas enfermedades hematológicas a través de la interpretación de mielogramas.Finalmente se considera una alternativa al test "t" de Student para muestras independientes y se ilustra con el estudio de la relación entre la alcohol deshidrogenasa y el tamaño en "Drosophila melanogaster".
|
13 |
Aplicació de diferents metodologies d'anàlisi i representació de dades per a l'avaluació de la qualitat ambiental d'una conca hidrogràficaTerrado Casanovas, Marta 22 January 2009 (has links)
En aquesta tesi doctoral es proposa la integració de metodologies de tipus quimiomètric i determinista per a l'avaluació la qualitat ambiental d'una conca hidrogràfica. Amb aquesta integració es busca ampliar el coneixement sobre la distribució espacial i temporal de les principals fonts de contaminació que existeixen dins de l'àmbit d'una determinada conca. Les fonts de contaminació poden ser identificades mitjançant mètodes quimiomètrics i de l'estadística multivariant. En concret, en aquesta tesi s'ha posat especial èmfasi en l'aplicació de dos mètodes diferents: l'Anàlisi de Components Principals (PCA) i la Resolució Multivariant de Corbes per Mínims Quadrats Alternats (MCR-ALS). Mentre que PCA és un mètode àmpliament utilitzat en l'anàlisi exploratòria de dades, l'aplicació d' MCR-ALS per a l'estudi de taules de dades ambientals és més incipient. En aquest treball es realitza la validació d'MCR-ALS per a l'estudi de la contaminació en aigües superficials i, a més, s'estén la seva utilització al cas d'altres compartiments ambientals com són les aigües subterrànies, els sòls i els sediments. Un cop identificades mitjançant mètodes quimiomètrics, les fonts de contaminació poden ser modelitzades amb l'aplicació de models deterministes, que facilitaran la presa de decisions respecte a les possibles mesures de gestió per al control i millora de la qualitat ambiental de l'àrea d'estudi. No obstant, això requerirà l'adaptació dels models deterministes a l'estudi de factors multivariables, com són les fonts de contaminació, enlloc d'aplicar-los a l'estudi de variables individuals, com s'ha fet fins al moment.Aquesta tesi recull l'estudi de diferents conques i problemàtiques ambientals: a) contaminació per metalls pesants, compostos orgànics i productes farmacèutics en diferents compartiments ambientals de la conca del riu Ebre; b) contaminació per compostos orgànics en aigües superficials del delta de l'Ebre; i c) contaminació per compostos orgànics en aigües superficials de la conca del riu Llobregat.Addicionalment, es proposa la utilització d'un índex fisicoquímic per a l'avaluació de la qualitat de les aigües superficials que pugui ser aplicat sobre dades generades per xarxes automàtiques de presa de mostra. Les xarxes automàtiques acostumen a mesurar simultàniament diverses variables a diferents localitzacions amb una elevada resolució temporal. L'índex del Canadian Council of Ministers of the Environment (CCME WQI) ha estat seleccionat per a la categorització de la qualitat de les aigües a partir de dades de les estacions automàtiques, gràcies a la seva flexibilitat en la selecció de les variables utilitzades en el seu càlcul, així com per la llibertat en la fixació dels objectius màxims i mínims segons l'ús final específic assignat a la massa d'aigua. D'altra banda, el procediment Combined Monitoring-based and modelling-based Priority Setting scheme (COMMPS) de la Comunitat Europea, ha estat adaptat per a l'establiment d'una llista de substàncies prioritàries de risc de contaminació a l'àmbit de Catalunya. En base a aquest índex també s'ha elaborat un índex prioritari de contaminació a les localitzacions, el qual permet obtenir una indicació de les localitzacions considerades de risc més elevat pel que fa a la contaminació per substàncies químiques orgàniques, tenint en compte els seus efectes toxicològics sobre humans i sobre l'ecosistema aquàtic. / The integration of chemometric and deterministic methods is proposed in this work to evaluate the environmental quality of river basins. This integration allows improving current knowledge about the spatial and temporal distribution of the main contamination sources existing in the river basin under study. The application of Principal Component Analysis (PCA) and Multivariate Curve Resolution using Alternating Least Squares (MCR-ALS) methods is presented. While PCA is a widely-used method for exploratory data analysis purposes, MCR-ALS application to the study of environmental data tables is more incipient. In this work, validation of MCR-ALS for the study of contamination in surface water is performed, and its usage is also extended to other environmental compartments such as groundwater, soil and sediment.Once identified, contamination sources can be modelled by the application of deterministic models. This makes the procedure of decision-making easier in the sense of possible management measures to be applied for improvement of the environmental quality in the study area. However, the adaptation of deterministic models to the study of multivariate factors will be needed in this case.Additionally, a physico-chemical index has been used for the evaluation of surface water quality using data obtained from automated sampling networks (which measure different variables simultaneously at high temporal resolution). The index of the Canadian Council of Ministers of the Environment (CCME) has been selected as the most suitable one for categorization of water quality in this case. The procedure of Combined Monitoring-based and Modelling-based Priority Setting scheme (COMMPS) from the European Community, has been adapted to establish a list of priority substances of contamination risk in Catalunya. Based on it, a priority contamination index at locations has been obtained in order to identify those locations with a higher risk by contamination for organic substances, according to toxicological effects over humans and aquatic ecosystems.
|
14 |
Analyse du flot de contrôle multivariante : application à la détection de comportements des programmes / Multivariant control flow analysis : application to behavior detection in programsLaouadi, Rabah 14 December 2016 (has links)
Sans exécuter une application, est-il possible de prévoir quelle est la méthode cible d’un site d’appel ? Est-il possible de savoir quels sont les types et les valeurs qu’une expression peut contenir ? Est-il possible de déterminer de manière exhaustive l’ensemble de comportements qu’une application peut effectuer ? Dans les trois cas, la réponse est oui, à condition d’accepter une certaine approximation. Il existe une classe d’algorithmes − peu connus à l’extérieur du cercle académique − qui analysent et simulent un programme pour calculer de manière conservatrice l’ensemble des informations qui peuvent être véhiculées dans une expression.Dans cette thèse, nous présentons ces algorithmes appelés CFAs (acronyme de Control Flow Analysis), plus précisément l’algorithme multivariant k-l-CFA. Nous combinons l’algorithme k-l-CFA avec l’analyse de taches (taint analysis),qui consiste à suivre une donnée sensible dans le flot de contrôle, afin de déterminer si elle atteint un puits (un flot sortant du programme). Cet algorithme, en combinaison avec l’interprétation abstraite pour les valeurs, a pour objectif de calculer de manière aussi exhaustive que possible l’ensemble des comportements d’une application. L’un des problèmes de cette approche est le nombre élevé de faux-positifs, qui impose un post-traitement humain. Il est donc essentiel de pouvoir augmenter la précision de l’analyse en augmentant k.k-l-CFA est notoirement connu comme étant très combinatoire, sa complexité étant exponentielle dans la valeur de k. La première contribution de cette thèse est de concevoir un modèle et une implémentation la plus efficace possible, en séparant soigneusement les parties statiques et dynamiques de l’analyse, pour permettre le passage à l’échelle. La seconde contribution de cette thèse est de proposer une nouvelle variante de CFA basée sur k-l-CFA, et appelée *-CFA, qui consiste à faire du paramètre k une propriété de chaque variante, de façon à ne l’augmenter que dans les contextes qui le justifient.Afin d’évaluer l’efficacité de notre implémentation de k-l-CFA, nous avons effectué une comparaison avec le framework Wala. Ensuite, nous validons l’analyse de taches et la détection de comportements avec le Benchmark DroidBench. Enfin, nous présentons les apports de l’algorithme *-CFA par rapport aux algorithmes standards de CFA dans le contexte d’analyse de taches et de détection de comportements. / Without executing an application, is it possible to predict the target method of a call site? Is it possible to know the types and values that an expression can contain? Is it possible to determine exhaustively the set of behaviors that an application can perform? In all three cases, the answer is yes, as long as a certain approximation is accepted.There is a class of algorithms - little known outside of academia - that can simulate and analyze a program to compute conservatively all information that can be conveyed in an expression. In this thesis, we present these algorithms called CFAs (Control flow analysis), and more specifically the multivariant k-l-CFA algorithm.We combine k-l-CFA algorithm with taint analysis, which consists in following tainted sensitive data inthe control flow to determine if it reaches a sink (an outgoing flow of the program).This combination with the integration of abstract interpretation for the values, aims to identify asexhaustively as possible all behaviors performed by an application.The problem with this approach is the high number of false positives, which requiresa human post-processing treatment.It is therefore essential to increase the accuracy of the analysis by increasing k.k-l-CFA is notoriously known as having a high combinatorial complexity, which is exponential commensurately with the value of k.The first contribution of this thesis is to design a model and most efficient implementationpossible, carefully separating the static and dynamic parts of the analysis, to allow scalability.The second contribution of this thesis is to propose a new CFA variant based on k-l-CFA algorithm -called *-CFA - , which consists in keeping locally for each variant the parameter k, and increasing this parameter in the contexts which justifies it.To evaluate the effectiveness of our implementation of k-l-CFA, we make a comparison with the Wala framework.Then, we do the same with the DroidBench benchmark to validate out taint analysis and behavior detection. Finally , we present the contributions of *-CFA algorithm compared to standard CFA algorithms in the context of taint analysis and behavior detection.
|
15 |
Aspectes metodològics i aplicacions de la modelització del temps de supervivència multivariant mitjançant models mixtesRenart i Vicens, Gemma 15 June 2009 (has links)
Els estudis de supervivència s'interessen pel temps que passa des de l'inici de l'estudi (diagnòstic de la malaltia, inici del tractament,...) fins que es produeix l'esdeveniment d'interès (mort, curació, millora,...). No obstant això, moltes vegades aquest esdeveniment s'observa més d'una vegada en un mateix individu durant el període de seguiment (dades de supervivència multivariant). En aquest cas, és necessari utilitzar una metodologia diferent a la utilitzada en l'anàlisi de supervivència estàndard. El principal problema que l'estudi d'aquest tipus de dades comporta és que les observacions poden no ser independents. Fins ara, aquest problema s'ha solucionat de dues maneres diferents en funció de la variable dependent. Si aquesta variable segueix una distribució de la família exponencial s'utilitzen els models lineals generalitzats mixtes (GLMM); i si aquesta variable és el temps, variable amb una distribució de probabilitat no pertanyent a aquesta família, s'utilitza l'anàlisi de supervivència multivariant. El que es pretén en aquesta tesis és unificar aquests dos enfocs, és a dir, utilitzar una variable dependent que sigui el temps amb agrupacions d'individus o d'observacions, a partir d'un GLMM, amb la finalitat d'introduir nous mètodes pel tractament d'aquest tipus de dades. / Survival research is interested in the time that passes from the beginning of the study until the event of interest occurs. However, it is very common to find individuals who experience this event more than once during the period of study. In this case, a different methodology needs to be used to that of the standard univariate survival analysis.In this case, the duration between recurrences could be correlated due to the presence of unobserved individual factors. This type of event is normally dealt with by introducing individual random effects in the model, resulting in a multivariate model. The random effects represent the individual "frailty" and the variance of these effects measures the unobserved heterogeneity between individuals. Until recently, the most common way of dealing with this type of situation in survival analysis was by using marginal models such as the robust covariance matrix estimation in the Andersen-Gill approximation; the Wei, Lin and Weissfeld method or the Prentice, Williams and Peterson method; or using the conditional models such as the frailty models (EM algorhthym). The aim of this study is to model multivariate survival data, based on generalised linear mixed models (GLMM).
|
16 |
How Item Response Theory can solve problems of ipsative dataBrown, Anna 25 October 2010 (has links)
Multidimensional forced-choice questionnaires can reduce the impact of numerous response biases typically associated with Likert scales. However, if scored with traditional methodology these instruments produce ipsative data, which has psychometric problems, such as constrained total test score and negative average scale inter-correlation. Ipsative scores distort scale relationships and reliability estimates, and make interpretation of scores problematic. This research demonstrates how Item Response Theory (IRT) modeling may be applied to overcome these problems. A multidimensional IRT model for forced-choice questionnaires is introduced, which is suitable for use with any forced-choice instrument composed of items fitting the dominance response model, with any number of measured traits, and any block sizes (i.e. pairs, triplets, quads etc.). The proposed model is based on Thurstone's framework for comparative data. Thurstonian IRT models are normal ogive models with structured factor loadings, structured uniquenesses, and structured local dependencies. These models can be straightforwardly estimated using structural equation modeling (SEM) software Mplus. Simulation studies show how the latent traits are recovered from the comparative binary data under different conditions. The Thurstonian IRT model is also tested with real participants in both research and occupational assessment settings. It is concluded that when the recommended design guidelines are met, scores estimated from forced-choice questionnaires with the proposed methodology reproduce the latent traits well.
|
17 |
A Contribution to Multivariate Volatility Modeling with High Frequency DataMarius, Matei 09 March 2012 (has links)
La tesi desenvolupa el tema de la predicció de la volatilitat financera en el context de l’ús de
dades d’alta freqüència, i se centra en una línia de recerca doble: proposar models alternatius que millorarien la predicció de la volatilitat i classificar els models de volatilitat ja existents com els que es proposen en aquesta tesi.
Els objectius es poden classificar en tres categories. El primer consisteix en la proposta d’un nou mètode de predicció de la volatilitat que segueix una línia de recerca desenvolupada recentment, la qual apunta al fet de mesurar la volatilitat intradia, com també la nocturna. Es proposa una categoria de models realized GARCH bivariants. El segon objectiu consisteix en la proposta d’una metodologia per predir la volatilitat diària multivariant amb models autoregressius que utilitzen estimacions de volatilitat diària (i nocturna, en el cas dels bivariants), a més d’informació d’alta freqüència, quan se’n disposava. S’aplica l’anàlisi de components principals (ACP) a un conjunt de models de tipus realized GARCH univariants i bivariants. El mètode representa una extensió d’un model ja existent (PC-GARCH) que estimava un model GARCH multivariant a partir de l’estimació de models GARCH univariants dels components principals de les variables inicials. El tercer objectiu de la tesi és classificar el rendiment dels models de predicció de la volatilitat ja existents o dels nous, a més de la precisió de les mesures intradia que s’utilitzaven en les estimacions dels models.
En relació amb els resultats, s’observa que els models EGARCHX, realized EGARCH i realized GARCH(2,2) obtenen una millor valoració, mentre que els models GARCH i no realized EGARCH obtenen uns resultats inferiors en gairebé totes les proves. Això permet concloure que el fet d’incorporar mesures de volatilitat intradia millora el problema de la modelització. Quant a la classificació dels models realized bivariants, s’observa que tant els models realized GARCH bivariant (en versions completes i parcials) com el model realized EGARCH bivariant obtenen millors resultats; els segueixen els models realized GARCH(2,2) bivariant, EGARCH bivariant I EGARCHX bivariant. En comparar les versions bivariants amb les univariants, amb l’objectiu d’investigar si l’ús de mesures de volatilitat nocturna a les equacions dels models millora l’estimació de la volatilitat, es mostra que els models bivariants superen els univariants. Els resultats proven que els models bivariants no són totalment inferiors als seus homòlegs univariants, sinó que resulten ser bones alternatives per utilitzar-los en la predicció, juntament amb els models univariants, per tal d’obtenir unes estimacions més fiables. / La tesis desarrolla el tema de la predicción de la volatilidad financiera en el contexto del uso de datos de alta frecuencia, y se centra en una doble línea de investigación: la de proponer modelos alternativos que mejorarían la predicción de la volatilidad y la de clasificar modelos de volatilidad ya existentes como los propuestos en esta tesis.
Los objetivos se pueden clasificar en tres categorías. El primero consiste en la propuesta de un nuevo método de predicción de la volatilidad que sigue una línea de investigación recientemente desarrollada, la cual apunta al hecho de medir la volatilidad intradía, así como la nocturna. Se propone una categoría de modelos realized GARCH bivariantes. El segundo objetivo consiste en proponer una metodología para predecir la volatilidad diaria multivariante con modelos autorregresivos que utilizaran estimaciones de volatilidad diaria (y nocturna, en el caso de los bivariantes), además de información de alta frecuencia, si la había disponible. Se aplica el análisis de componentes principales (ACP) a un conjunto de modelos de tipo realized GARCH univariantes y bivariantes. El método representa una extensión de un modelo ya existente (PCGARCH) que calculaba un modelo GARCH multivariante a partir de la estimación de modelos GARCH univariantes de los componentes principales de las variables iniciales. El tercer objetivo de la tesis es clasificar el rendimiento de los modelos de predicción de la volatilidad ya existentes o de los nuevos, así como la precisión de medidas intradía utilizadas en las estimaciones de los modelos.
En relación con los resultados, se observa que los modelos EGARCHX, realized EGARCH y GARCH(2,2) obtienen una mejor valoración, mientras que los modelos GARCH y no realized EGARCH obtienen unos resultados inferiores en casi todas las pruebas. Esto permite concluir que el hecho de incorporar medidas de volatilidad intradía mejora el problema de la modelización. En cuanto a la clasificación de modelos realized bivariantes, se observa que tanto los modelos realized GARCH bivariante (en versiones completas y parciales) como realized EGARCH bivariante obtienen mejores resultados; les siguen los modelos realized GARCH(2,2) bivariante, EGARCH bivariante y EGARCHX bivariante. Al comparar las versiones bivariantes con las univariantes, con el objetivo de investigar si el uso de medidas de volatilidad nocturna en las ecuaciones de los modelos mejora la estimación de la volatilidad, se muestra que los modelos bivariantes superan los univariantes. Los resultados prueban que los modelos bivariantes no son totalmente inferiores a sus homólogos univariantes, sino que resultan ser buenas alternativas para utilizarlos en la predicción, junto con los modelos univariantes, para lograr unas estimaciones más fiables. / The thesis develops the topic of financial volatility forecasting in the context of the usage of high frequency data, and focuses on a twofold line of research: that of proposing alternative models that would enhance volatility forecasting and that of ranking existing or newly proposed volatility models.
The objectives may be disseminated in three categories. The first scope constitutes of the proposal of a new method of volatility forecasting that follows a recently developed research line that pointed to using measures of intraday volatility and also of measures of night volatility, the need for new models being given by the question whether adding measures of night volatility improves day volatility estimations. As a result, a class of bivariate realized GARCH models was proposed. The second scope was to propose a methodology to forecast multivariate day volatility with autoregressive models that used day (and night for bivariate) volatility estimates, as well as high frequency information when that was available. For this, the Principal Component algorithm (PCA) was applied to a class of univariate and bivariate realized GARCH-type of models. The method represents an extension of one existing model (PC GARCH) that estimated a multivariate GARCH model by estimating univariate GARCH models of the principal components of the initial variables. The third goal of the thesis was to rank the performance of existing or newly proposed volatility forecasting models, as well as the accuracy of the intraday measures used in the realized models estimations.
With regards to the univariate realized models’ rankings, it was found that EGARCHX, Realized EGARCH and Realized GARCH(2,2) models persistently ranked better, while the non-realized GARCH and EGARCH models performed poor in each stance almost. This allowed us to conclude that incorporating measures of intraday volatility enhances the modeling problem. With respect to the bivariate realized models’ ranking, it was found that Bivariate Realized GARCH (partial and complete versions) and Bivariate Realized EGARCH models performed the best, followed by the Bivariate Realized GARCH(2,2), Bivariate EGARCH and Bivariate EGARCHX models. When the bivariate versions were compared to the univariate ones in order to investigate whether using night volatility measurements in the models’ equations improves volatility estimation, it was found that the bivariate models surpassed the univariate ones when specific methodology, ranking criteria and stocks were used. The results were mixed, allowing us to conclude that the bivariate models did not prove totally inferior to their univariate counterparts, proving as good alternative options to be used in the forecasting exercise, together with the univariate models, for more reliable estimates. Finally, the PC realized models and PC bivariate realized models were estimated and their performances were ranked; improvements the PC methodology brought in high frequency multivariate modeling of stock returns were also discussed. PC models were found to be highly effective in estimating multivariate volatility of highly correlated stock assets and suggestions on how investors could use them for portfolio selection were made.
|
18 |
Automatic diagnosis of voltage disturbances in power distribution networksBarrera Núñez, Víctor Augusto 10 April 2012 (has links)
This thesis proposes a framework for identifying the root-cause of a voltage disturbance, as well as, its source location (upstream/downstream) from the monitoring place. The framework works with three-phase voltage and current waveforms collected in radial distribution networks without distributed generation. Real-world and synthetic waveforms are used to test it. The framework involves features that are conceived based on electrical principles, and assuming some hypothesis on the analyzed phenomena. Features considered are based on waveforms and timestamp information. Multivariate analysis of variance and rule induction algorithms are applied to assess the amount of meaningful information explained by each feature, according to the root-cause of the disturbance and its source location. The obtained classification rates show that the proposed framework could be used for automatic diagnosis of voltage disturbances collected in radial distribution networks. Furthermore, the diagnostic results can be subsequently used for supporting power network operation, maintenance and planning. / En esta tesis se propone una metodología para la identificación de la localización relativa (aguas arriba/abajo) y la causa de una perturbación eléctrica. La metodología utiliza las ondas trifásicas de tensión y de corriente registradas en redes de distribución radial sin presencia de generación distribuida. La metodología es validada utilizando perturbaciones eléctricas reales y simuladas. La metodología involucra atributos que han sido concebidos basándose en principios eléctricos e hipótesis de acuerdo a cada uno de los fenómenos eléctricos analizados. Se propusieron atributos tanto basados en la forma de onda como en la fecha de ocurrencia de la perturbación. La cantidad de información contenida y/o explicada por cada atributo es valorada mediante la aplicación del análisis multivariante de la varianza y algoritmos de extracción automática de reglas de decisión. Los resultados de clasificación muestran que la metodología propuesta puede ser utilizada para el diagnóstico automático de perturbaciones eléctricas registradas en redes de distribución radial. Los resultados de diagnóstico pueden ser utilizados para apoyar las tareas de operación, mantenimiento y planeamiento de las redes de distribución.
|
19 |
Conceptual design of wastewater treatment plants using multiple objectivesFlores Alsina, Xavier 28 April 2008 (has links)
La implementació de la Directiva Europea 91/271/CEE referent a tractament d'aigües residuals urbanes va promoure la construcció de noves instal·lacions al mateix temps que la introducció de noves tecnologies per tractar nutrients en àrees designades com a sensibles. Tant el disseny d'aquestes noves infraestructures com el redisseny de les ja existents es va portar a terme a partir d'aproximacions basades fonamentalment en objectius econòmics degut a la necessitat d'acabar les obres en un període de temps relativament curt. Aquests estudis estaven basats en coneixement heurístic o correlacions numèriques provinents de models determinístics simplificats. Així doncs, moltes de les estacions depuradores d'aigües residuals (EDARs) resultants van estar caracteritzades per una manca de robustesa i flexibilitat, poca controlabilitat, amb freqüents problemes microbiològics de separació de sòlids en el decantador secundari, elevats costos d'operació i eliminació parcial de nutrients allunyant-les de l'òptim de funcionament. Molts d'aquestes problemes van sorgir degut a un disseny inadequat, de manera que la comunitat científica es va adonar de la importància de les etapes inicials de disseny conceptual. Precisament per aquesta raó, els mètodes tradicionals de disseny han d'evolucionar cap a sistemes d'avaluació mes complexos, que tinguin en compte múltiples objectius, assegurant així un millor funcionament de la planta. Tot i la importància del disseny conceptual tenint en compte múltiples objectius, encara hi ha un buit important en la literatura científica tractant aquest camp d'investigació. L'objectiu que persegueix aquesta tesi és el de desenvolupar un mètode de disseny conceptual d'EDARs considerant múltiples objectius, de manera que serveixi d'eina de suport a la presa de decisions al seleccionar la millor alternativa entre diferents opcions de disseny. Aquest treball de recerca contribueix amb un mètode de disseny modular i evolutiu que combina diferent tècniques com: el procés de decisió jeràrquic, anàlisi multicriteri, optimació preliminar multiobjectiu basada en anàlisi de sensibilitat, tècniques d'extracció de coneixement i mineria de dades, anàlisi multivariant i anàlisi d'incertesa a partir de simulacions de Monte Carlo. Això s'ha aconseguit subdividint el mètode de disseny desenvolupat en aquesta tesis en quatre blocs principals: (1) generació jeràrquica i anàlisi multicriteri d'alternatives, (2) anàlisi de decisions crítiques, (3) anàlisi multivariant i (4) anàlisi d'incertesa. El primer dels blocs combina un procés de decisió jeràrquic amb anàlisi multicriteri. El procés de decisió jeràrquic subdivideix el disseny conceptual en una sèrie de qüestions mes fàcilment analitzables i avaluables mentre que l'anàlisi multicriteri permet la consideració de diferent objectius al mateix temps. D'aquesta manera es redueix el nombre d'alternatives a avaluar i fa que el futur disseny i operació de la planta estigui influenciat per aspectes ambientals, econòmics, tècnics i legals. Finalment aquest bloc inclou una anàlisi de sensibilitat dels pesos que proporciona informació de com varien les diferents alternatives al mateix temps que canvia la importància relativa del objectius de disseny.El segon bloc engloba tècniques d'anàlisi de sensibilitat, optimització preliminar multiobjectiu i extracció de coneixement per donar suport al disseny conceptual d'EDAR, seleccionant la millor alternativa un cop s'han identificat decisions crítiques. Les decisions crítiques són aquelles en les que s'ha de seleccionar entre alternatives que compleixen de forma similar els objectius de disseny però amb diferents implicacions pel que respecte a la futura estructura i operació de la planta. Aquest tipus d'anàlisi proporciona una visió més àmplia de l'espai de disseny i permet identificar direccions desitjables (o indesitjables) cap on el procés de disseny pot derivar. El tercer bloc de la tesi proporciona l'anàlisi multivariant de les matrius multicriteri obtingudes durant l'avaluació de les alternatives de disseny. Específicament, les tècniques utilitzades en aquest treball de recerca engloben: 1) anàlisi de conglomerats, 2) anàlisi de components principals/anàlisi factorial i 3) anàlisi discriminant. Com a resultat és possible un millor accés a les dades per realitzar la selecció de les alternatives, proporcionant més informació per a una avaluació mes efectiva, i finalment incrementant el coneixement del procés d'avaluació de les alternatives de disseny generades. En el quart i últim bloc desenvolupat en aquesta tesi, les diferents alternatives de disseny són avaluades amb incertesa. L'objectiu d'aquest bloc és el d'estudiar el canvi en la presa de decisions quan una alternativa és avaluada incloent o no incertesa en els paràmetres dels models que descriuen el seu comportament. La incertesa en el paràmetres del model s'introdueix a partir de funcions de probabilitat. Desprès es porten a terme simulacions Monte Carlo, on d'aquestes distribucions se n'extrauen números aleatoris que es subsisteixen pels paràmetres del model i permeten estudiar com la incertesa es propaga a través del model. Així és possible analitzar la variació en l'acompliment global dels objectius de disseny per a cada una de les alternatives, quines són les contribucions en aquesta variació que hi tenen els aspectes ambientals, legals, econòmics i tècnics, i finalment el canvi en la selecció d'alternatives quan hi ha una variació de la importància relativa dels objectius de disseny. En comparació amb les aproximacions tradicionals de disseny, el mètode desenvolupat en aquesta tesi adreça problemes de disseny/redisseny tenint en compte múltiples objectius i múltiples criteris. Al mateix temps, el procés de presa de decisions mostra de forma objectiva, transparent i sistemàtica el perquè una alternativa és seleccionada en front de les altres, proporcionant l'opció que més bé acompleix els objectius marcats, mostrant els punts forts i febles, les principals correlacions entre objectius i alternatives, i finalment tenint en compte la possible incertesa inherent en els paràmetres del model que es fan servir durant les anàlisis. Les possibilitats del mètode desenvolupat es demostren en aquesta tesi a partir de diferents casos d'estudi: selecció del tipus d'eliminació biològica de nitrogen (cas d'estudi # 1), optimització d'una estratègia de control (cas d'estudi # 2), redisseny d'una planta per aconseguir eliminació simultània de carboni, nitrogen i fòsfor (cas d'estudi # 3) i finalment anàlisi d'estratègies control a nivell de planta (casos d'estudi # 4 i # 5). / The implementation of EU Directive 91/271/EEC concerning urban wastewater treatment promoted the construction of new facilities and the introduction of nutrient removal technologies in areas designated as sensitive. The need to build at a rapid pace imposed economically sound approaches for the design of the new infrastructures and the retrofit of the existing ones. These studies relied exclusively on the use of heuristic knowledge and numerical correlations generated from simplified activated sludge models. Hence, some of the resulting wastewater treatment plants (WWTPs) were characterized by a lack of robustness and flexibility, bad controller performance, frequent microbiology-related solids separation problems in the secondary settler, high operating and maintenance costs and/or partial nutrient removal, which made their performance far from optimal. Most of these problems arose because of inadequate design, making the scientific community aware of the crucial importance of the conceptual design stage. Thus, these traditional design approaches should turn into more complex assessment methods in order to conduct integrated assessments taking into account a multiplicity of objectives an hence ensuring a correct plant performance. Despite the importance of this fact only a few methods in the literature addressed the systematic evaluation of conceptual WWTP design alternatives using multiple objectives. Yet, the decisions made during this stage are of paramount importance in determining the future plant structure and operation. The main objective pursued in this thesis targets the development of a systematic conceptual design method for WWTP using multiple objectives, which supports decision making when selecting the most desirable option amongst several generated alternatives. This research work contributes with a modular and evolutionary approach combining techniques from different disciplines such as: a hierarchical decision approach, multicriteria decision analysis, preliminary multiobjective optimization using sensitivity functions, knowledge extraction and data mining techniques, multivariate statistical techniques and uncertainty analysis using Monte Carlo simulations. This is accomplished by dividing the design method into 4 different blocks: (1) hierarchical generation and multicriteria evaluation of the design alternatives, (2) analysis of critical decisions, (3) multivariate analysis and, finally, (4) uncertainty analysis. The first block of the proposed method, supports the conceptual design of WWTP combining a hierarchical decision approach with multicriteria analysis. The hierarchical decision approach breaks down the conceptual design into a number of issues that are easier to analyze and to evaluate while the multicriteria analysis allows the inclusion of different objectives at the same time. Hence, the number of alternatives to evaluate is reduced while the future WWTP design and operation is greatly influenced by environmental, technical, economical and legal aspects. Also, the inclusion of a sensitivity analysis facilitates the study of the variation of the generated alternatives with respect to the relative importance of the objectives. The second block, analysis of critical decisions, is tackled with sensitivity analysis, preliminary multiobjective optimization and knowledge extraction to assist the designer during the selection of the best alternative amongst the most promising alternatives i.e. options with a similar overall degree of satisfaction of the design objectives but with completely different implications for the future plant design and operation. The analysis provides a wider picture of the possible design space and allows the identification of desirable (or undesirable) WWTP design directions in advance.The third block of the proposed method, involves the application of multivariate statistical techniques to mine the complex multicriteria matrixes obtained during the evaluation of WWTP alternatives. Specifically, the techniques used in this research work are i) cluster analysis, ii) principal component/factor analysis, and iii) discriminant analysis. As a result, there is a significant improvement in the accessibility of the information needed for effective evaluation of WWTP alternatives, yielding more knowledge than the current evaluation methods to finally enhance the comprehension of the whole evaluation process. In the fourth and last block, uncertainty analysis of the different alternatives is further applied. The objective of this tool is to support the decision making when uncertainty on the model parameters used to carry out the analysis of the WWTP alternatives is either included or not. The uncertainty in the model parameters is introduced, i.e input uncertainty, characterising it by probability distributions. Next, Monte Carlo simulations are run to see how those input uncertainties are propagated through the model and affect the different outcomes. Thus, it is possible to study the variation of the overall degree of satisfaction of the design objectives, the contributions of the different objectives in the overall variance to finally analyze the influence of the relative importance of the design objectives during the selection of the alternatives. Thus, in comparison with the traditional approaches the conceptual design method developed in this thesis addresses design/redesign problems with respect to multiple objectives and multiple performance measures. Also, it includes a more reliable decision procedure that shows in a systematic, objective and transparent fashion the rationale way a certain alternative is selected and not the others. The decision procedure provides to the designer/decision maker with the alternative that best fulfils the defined objectives, showing its main advantages and weaknesses, the different correlations between the alternatives and evaluation criteria and dealing with the uncertainty prevailing in some of the model parameters used during the analysis. A number of case studies, selection of biological nitrogen removal process (case study #1), optimization of the setpoints in two control loops (case study #2), redesign to achieve simultaneous organic carbon, nitrogen and phosphorus removal (case study #3) and evaluation of control strategies at plant wide level (case studies #4 and #5), are used to demonstrate the capabilities of the conceptual design method.
|
20 |
In vitro test buněčné imunitní odpovědi pro diagnostiku Lymeské boreliózy / Lyme borreliosis diagnostics using in vitro cellular immune response testingProkopová, Tereza January 2017 (has links)
Lyme borreliosis is a multisystemic disease affecting skin, joints, heart and central nervous system. The disease is caused by spirochetes of Borrelia burgdorferi sensu lato complex. These bacteria are spread by ticks of Ixodes genus. In 2016 there were almost 4,000 newly infected individuals reported in the Czech Republic. Contemporary serological diagnostics of Lyme borreliosis is not sensitive nor specific enough and does not even correlate with the pathology of the disease in the early or late phases. For the correct diagnosis of the disease it is necessary to detect the pathogen and its genotype. For this reason we had aimed at two goals. Through the digital droplet PCR (ddPCR) method we detected Borrelia-specific DNA and its genotype. The detection limit of borrelial DNA was set on gDNA samples isolated from the tick. Detection threshold for the initial amount of 1 ng of tick gDNA is at the range of 10-17 g of specific borrelial DNA. Borrelia spp. coinfection was detected in 5 out of 12 tested samples. The most frequent type was B. garinii which was detected in 5 samples. On the basis of published sequences for virulent factors we have designed specific primers in conserved regions of the genes flanking their variable segments to be PCR amplified. Gene variability will be monitored through...
|
Page generated in 0.083 seconds