Spelling suggestions: "subject:"hauptkomponenten""
11 |
Approaches to analyse and interpret biological profile dataScholz, Matthias January 2006 (has links)
Advances in biotechnologies rapidly increase the number of molecules of a cell which can be observed simultaneously. This includes expression levels of thousands or ten-thousands of genes as well as concentration levels of metabolites or proteins.
<br><br>
Such Profile data, observed at different times or at different experimental conditions (e.g., heat or dry stress), show how the biological experiment is reflected on the molecular level. This information is helpful to understand the molecular behaviour and to identify molecules or combination of molecules that characterise specific biological condition (e.g., disease).
<br><br>
This work shows the potentials of component extraction algorithms to identify the major factors which influenced the observed data. This can be the expected experimental factors such as the time or temperature as well as unexpected factors such as technical artefacts or even unknown biological behaviour.
<br><br>
Extracting components means to reduce the very high-dimensional data to a small set of new variables termed components. Each component is a combination of all original variables. The classical approach for that purpose is the principal component analysis (PCA).
<br><br>
It is shown that, in contrast to PCA which maximises the variance only, modern approaches such as independent component analysis (ICA) are more suitable for analysing molecular data. The condition of independence between components of ICA fits more naturally our assumption of individual (independent) factors which influence the data. This higher potential of ICA is demonstrated by a crossing experiment of the model plant <i>Arabidopsis thaliana</i> (Thale Cress). The experimental factors could be well identified and, in addition, ICA could even detect a technical artefact.
<br><br>
However, in continuously observations such as in time experiments, the data show, in general, a nonlinear distribution. To analyse such nonlinear data, a nonlinear extension of PCA is used. This nonlinear PCA (NLPCA) is based on a neural network algorithm. The algorithm is adapted to be applicable to incomplete molecular data sets. Thus, it provides also the ability to estimate the missing data. The potential of nonlinear PCA to identify nonlinear factors is demonstrated by a cold stress experiment of <i>Arabidopsis thaliana</i>.
<br><br>
The results of component analysis can be used to build a molecular network model. Since it includes functional dependencies it is termed functional network. Applied to the cold stress data, it is shown that functional networks are appropriate to visualise biological processes and thereby reveals molecular dynamics. / Fortschritte in der Biotechnologie ermöglichen es, eine immer größere Anzahl von Molekülen in einer Zelle gleichzeitig zu erfassen. Das betrifft sowohl die Expressionswerte tausender oder zehntausender Gene als auch die Konzentrationswerte von Metaboliten oder Proteinen.
<br><br>
Diese Profildaten verschiedener Zeitpunkte oder unterschiedlicher experimenteller Bedingungen (z.B. unter Stressbedingungen wie Hitze oder Trockenheit) zeigen, wie sich das biologische Experiment auf molekularer Ebene widerspiegelt. Diese Information kann genutzt werden, um molekulare Abläufe besser zu verstehen und um Moleküle oder Molekül-Kombinationen zu bestimmen, die für bestimmte biologische Zustände (z.B.: Krankheit) charakteristisch sind.
<br><br>
Die Arbeit zeigt die Möglichkeiten von Komponenten-Extraktions-Algorithmen zur Bestimmung der wesentlichen Faktoren, die einen Einfluss auf die beobachteten Daten ausübten. Das können sowohl die erwarteten experimentellen Faktoren wie Zeit oder Temperatur sein als auch unerwartete Faktoren wie technische Einflüsse oder sogar unerwartete biologische Vorgänge.
<br><br>
Unter der Extraktion von Komponenten versteht man die Reduzierung dieser stark hoch-dimensionalen Daten auf wenige neue Variablen, die eine Kombination aus allen ursprünglichen Variablen darstellen und als Komponenten bezeichnet werden. Die Standard-Methode für diesen Zweck ist die Hauptkomponentenanalyse (PCA).
<br><br>
Es wird gezeigt, dass - im Vergleich zur nur die Varianz maximierenden PCA - moderne Methoden wie die Unabhängige Komponentenanalyse (ICA) für die Analyse molekularer Datensätze besser geeignet sind. Die Unabhängigkeit von Komponenten in der ICA entspricht viel besser unserer Annahme individueller (unabhängiger) Faktoren, die einen Einfluss auf die Daten ausüben. Dieser Vorteil der ICA wird anhand eines Kreuzungsexperiments mit der Modell-Pflanze <i>Arabidopsis thaliana</i> (Ackerschmalwand) demonstriert. Die experimentellen Faktoren konnten dabei gut identifiziert werden und ICA erkannte sogar zusätzlich einen technischen Störfaktor.
<br><br>
Bei kontinuierlichen Beobachtungen wie in Zeitexperimenten zeigen die Daten jedoch häufig eine nichtlineare Verteilung. Für die Analyse dieser nichtlinearen Daten wird eine nichtlinear erweiterte Methode der PCA angewandt. Diese nichtlineare PCA (NLPCA) basiert auf einem neuronalen Netzwerk-Algorithmus. Der Algorithmus wurde für die Anwendung auf unvollständigen molekularen Daten erweitert. Dies ermöglicht es, die fehlenden Werte zu schätzen. Die Fähigkeit der nichtlinearen PCA zur Bestimmung nichtlinearer Faktoren wird anhand eines Kältestress-Experiments mit <i>Arabidopsis thaliana</i> demonstriert.
<br><br>
Die Ergebnisse aus der Komponentenanalyse können zur Erstellung molekularer Netzwerk-Modelle genutzt werden. Da sie funktionelle Abhängigkeiten berücksichtigen, werden sie als Funktionale Netzwerke bezeichnet. Anhand der Kältestress-Daten wird demonstriert, dass solche funktionalen Netzwerke geeignet sind, biologische Prozesse zu visualisieren und dadurch die molekularen Dynamiken aufzuzeigen.
|
12 |
Data driven analysis of brain activity and functional connectivity in fMRI / Explorative Datenanalyse und Identifikation funktioneller Konnektivität aus fMRT-DatenDodel, Silke 20 December 2002 (has links)
No description available.
|
13 |
Regional assessment of trends in vegetation change dynamics using principal component analysisOsunmadewa, Babatunde A., Csaplovics, E., R. A., Majdaldin, Aralova, D., Adeofun, C. O. 30 August 2019 (has links)
Vegetation forms the basis for the existence of animal and human. Due to changes in climate and human perturbation, most of the natural vegetation of the world has undergone some form of transformation both in composition and structure. Increased anthropogenic activities over the last decades had pose serious threat on the natural vegetation in Nigeria, many vegetated areas are either transformed to other land use such as deforestation for agricultural purpose or completely lost due to indiscriminate removal of trees for charcoal, fuelwood and timber production. This study therefore aims at examining the rate of change in vegetation cover, the degree of change and the application of Principal Component Analysis (PCA) in the dry sub-humid region of Nigeria using Normalized Difference Vegetation Index (NDVI) data spanning from 1983-2011. The method used for the analysis is the T-mode orientation approach also known as standardized PCA, while trends are examined using ordinary least square, median trend (Theil-Sen) and monotonic trend. The result of the trend analysis shows both positive and negative trend in vegetation change dynamics over the 29 years period examined. Five components were used for the Principal Component Analysis. The results of the first component explains about 98 % of the total variance of the vegetation (NDVI) while components 2-5 have lower variance percentage (< 1%). Two ancillary land use land cover data of 2000 and 2009 from European Space Agency (ESA) were used to further explain changes observed in the Normalized Difference Vegetation Index. The result of the land use data shows changes in land use pattern which can be attributed to anthropogenic activities such as cutting of trees for charcoal production, fuelwood and agricultural practices. The result of this study shows the ability of remote sensing data for monitoring vegetation change in the dry-sub humid region of Nigeria.
|
14 |
Modelle zur Beschreibung der Verkehrssicherheit innerörtlicher Hauptverkehrsstraßennetze unter besonderer Berücksichtigung der Umfeldnutzung / Accident prediction models for urban main road networks considering the adjacent land-useAurich, Allan 15 November 2013 (has links) (PDF)
In der Arbeit wird eine Methodik einer zusammenhängenden Analyse und modellhaften Beschreibung der Verkehrssicherheit in städtischen Hauptstraßennetzen am Beispiel der Stadt Dresden entwickelt. Die dabei gewonnenen Modelle dienen der Abschätzung von Erwartungswerten von Unfallhäufigkeiten mit und ohne Personenschaden unter Berücksichtigung der Verkehrsbeteiligungsart.
Die Grundlage bilden multivariate Regressionsmodelle auf Basis verallgemeinerter linearer Modelle (GLM). Die Verwendung verallgemeinerter Regressionsmodelle erlaubt eine Berücksichtigung von Verteilungen, die besser geeignet sind, den Unfallentstehungsprozess wiederzugeben, als die häufig verwendete Normalverteilung. Im konkreten Fall werden hierzu die Poisson-Verteilung sowie die negative Binomialverteilung verwendet.
Um Effekte im Hauptverkehrsstraßennetz möglichst trennscharf abbilden zu können, werden vier grundsätzliche Netzelemente differenziert und das Netz entsprechend zerlegt. Unterschieden werden neben Streckenabschnitten und Hauptverkehrsknotenpunkten auch Annäherungsbereiche und Anschlussknotenpunkte. Die Kollektive der Knotenpunkte werden ferner in signalisierte und nicht-signalisierte unterteilt. Es werden zunächst Modelle unterschiedlicher Unfallkollektive getrennt für alle Kollektive der vier Netzelemente berechnet. Anschließend werden verschiedene Vorgehensweisen für eine Zusammenfassung zu Netzmodellen entwickelt.
Neben der Verwendung verkehrstechnischer und infrastruktureller Größen als erklärende Variable werden in der Arbeit auch Kenngrößen zur Beschreibung der Umfeldnutzung ermittelt und im Rahmen der Regression einbezogen. Die Quantifizierung der Umfeldnutzung erfolgt mit Hilfe von Korrelations-, Kontingenz- und von Hauptkomponentenanalysen (PCA).
Im Ergebnis werden Modelle präsentiert, die eine multivariate Quantifizierung erwarteter Unfallhäufigkeiten in Hauptverkehrsstraßennetzen erlauben. Die vorgestellte Methodik bildet eine mögliche Grundlage für eine differenzierte Sicherheitsbewertung verkehrsplanerischer Variantenabschätzungen. / A methodology is developed in order to predict the number of accidents within an urban main road network. The analysis was carried out by surveying the road network of Dresden. The resulting models allow the calculation of individual expectancy values for accidents with and without injury involving different traffic modes.
The statistical modelling process is based on generalized linear models (GLM). These were chosen due to their ability to take into account certain non-normal distributions. In the specific case of accident counts, both the Poisson distribution and the negative binomial distribution are more suitable for reproducing the origination process than the normal distribution. Thus they were chosen as underlying distributions for the subsequent regressions.
In order to differentiate overlaying influences, the main road network is separated into four basic elements: major intersections, road sections, minor intersections and approaches. Furthermore the major and minor intersections are additionally subdivided into signalised and non-signalised intersections. Separate models are calculated for different accident collectives for the various types of elements. Afterwards several methodologies for calculating aggregated network models are developed and analysed.
Apart from traffic-related and infrastructural attributes, environmental parameters are derived taking into account the adjacent building structure as well as the surrounding land-use, and incorporated as explanatory variables within the regression. The environmental variables are derived from statistical analyses including correlation matrices, contingency tables and principal components analyses (PCA).
As a result, a set of models is introduced which allows a multivariate calculation of expected accident counts for urban main road networks. The methodology developed can serve as a basis for a differentiated safety assessment of varying scenarios within a traffic planning process.
|
15 |
Modelle zur Beschreibung der Verkehrssicherheit innerörtlicher Hauptverkehrsstraßennetze unter besonderer Berücksichtigung der UmfeldnutzungAurich, Allan 17 May 2013 (has links)
In der Arbeit wird eine Methodik einer zusammenhängenden Analyse und modellhaften Beschreibung der Verkehrssicherheit in städtischen Hauptstraßennetzen am Beispiel der Stadt Dresden entwickelt. Die dabei gewonnenen Modelle dienen der Abschätzung von Erwartungswerten von Unfallhäufigkeiten mit und ohne Personenschaden unter Berücksichtigung der Verkehrsbeteiligungsart.
Die Grundlage bilden multivariate Regressionsmodelle auf Basis verallgemeinerter linearer Modelle (GLM). Die Verwendung verallgemeinerter Regressionsmodelle erlaubt eine Berücksichtigung von Verteilungen, die besser geeignet sind, den Unfallentstehungsprozess wiederzugeben, als die häufig verwendete Normalverteilung. Im konkreten Fall werden hierzu die Poisson-Verteilung sowie die negative Binomialverteilung verwendet.
Um Effekte im Hauptverkehrsstraßennetz möglichst trennscharf abbilden zu können, werden vier grundsätzliche Netzelemente differenziert und das Netz entsprechend zerlegt. Unterschieden werden neben Streckenabschnitten und Hauptverkehrsknotenpunkten auch Annäherungsbereiche und Anschlussknotenpunkte. Die Kollektive der Knotenpunkte werden ferner in signalisierte und nicht-signalisierte unterteilt. Es werden zunächst Modelle unterschiedlicher Unfallkollektive getrennt für alle Kollektive der vier Netzelemente berechnet. Anschließend werden verschiedene Vorgehensweisen für eine Zusammenfassung zu Netzmodellen entwickelt.
Neben der Verwendung verkehrstechnischer und infrastruktureller Größen als erklärende Variable werden in der Arbeit auch Kenngrößen zur Beschreibung der Umfeldnutzung ermittelt und im Rahmen der Regression einbezogen. Die Quantifizierung der Umfeldnutzung erfolgt mit Hilfe von Korrelations-, Kontingenz- und von Hauptkomponentenanalysen (PCA).
Im Ergebnis werden Modelle präsentiert, die eine multivariate Quantifizierung erwarteter Unfallhäufigkeiten in Hauptverkehrsstraßennetzen erlauben. Die vorgestellte Methodik bildet eine mögliche Grundlage für eine differenzierte Sicherheitsbewertung verkehrsplanerischer Variantenabschätzungen. / A methodology is developed in order to predict the number of accidents within an urban main road network. The analysis was carried out by surveying the road network of Dresden. The resulting models allow the calculation of individual expectancy values for accidents with and without injury involving different traffic modes.
The statistical modelling process is based on generalized linear models (GLM). These were chosen due to their ability to take into account certain non-normal distributions. In the specific case of accident counts, both the Poisson distribution and the negative binomial distribution are more suitable for reproducing the origination process than the normal distribution. Thus they were chosen as underlying distributions for the subsequent regressions.
In order to differentiate overlaying influences, the main road network is separated into four basic elements: major intersections, road sections, minor intersections and approaches. Furthermore the major and minor intersections are additionally subdivided into signalised and non-signalised intersections. Separate models are calculated for different accident collectives for the various types of elements. Afterwards several methodologies for calculating aggregated network models are developed and analysed.
Apart from traffic-related and infrastructural attributes, environmental parameters are derived taking into account the adjacent building structure as well as the surrounding land-use, and incorporated as explanatory variables within the regression. The environmental variables are derived from statistical analyses including correlation matrices, contingency tables and principal components analyses (PCA).
As a result, a set of models is introduced which allows a multivariate calculation of expected accident counts for urban main road networks. The methodology developed can serve as a basis for a differentiated safety assessment of varying scenarios within a traffic planning process.
|
16 |
Einsatz der FT-IR-Mikrospektroskopie und multivariater Auswertealgorithmen zur Identifizierung und Klassifizierung von TumorgewebenRichter, Tom 10 August 2002 (has links) (PDF)
Das erste gestellte Ziel war es, die histologischen Strukturen eines Gewebedünnschnittes anhand der aufgenommenen FT-IR-Spektren sichtbar zu machen und diese mit dem konventionell gefärbten Schnitt und der autoradiographischen Aufnahme zu vergleichen. Dazu wurde ein Messsystem bestehend aus einem FT-IR-Spektrometer mit Mikroskop und einem computergesteuerten XY-Tisch aufgebaut und die notwendige Steuer- und Auswerte-Software entwickelt. Es konnte gezeigt werden, dass sich die FT-IR-Spektren mit geeigneten Auswerteverfahren zur Darstellung der histologischen Strukturen nutzen lassen. Dazu wurden zwei verschiedene Methoden eingesetzt, die PCA und die Fuzzy-Clusterung (FCM). Im zweiten Teil dieser Arbeit sollte ein Klassifikations-Algorithmus gefunden werden, mit dessen Hilfe sich Spektren von unbekannten Gewebeproben vorher definierten Modellen zuordnen lassen. Dazu wurde eine Spektren-Datenbank aus mehr als einhundert Gewebeproben angelegt. Aus dieser Datenbank wurden einige zehntausend Spektren ausgewählt und zu Modell-Datensätzen für sechs verschiedene Gewebetypen zusammengefasst. Für die Zuordnung unbekannter Spektren zu diesen Modellen wurde ein SIMCA-Klassifikations-Algorithmus entwickelt sowie ein LDA-Algorithmus eingesetzt. Für beide Methoden wurde die Klassi-fikations-Leistung anhand der Spezifität und Sensitivität bestimmt. Beide Klassifikations-Algorithmen führten zu guten Ergebnissen. Der SIMCA-Algorithmus erreichte eine Spezifität zwischen 97 % und 100 %, sowie eine Sensitivität zwischen 62 % und 78 % (bei einem Vertrauensintervall von 97,5 %). Der LDA-Algorithmus ermöglichte eine etwas bessere Sensitivität von 72 % bis 90 %, auf Kosten der Spezifität, welche zwischen 90 % und 98 % lag. Zusammenfassend kann festgestellt werden, dass sich die FT-IR-Mikrospektroskopie und die vorgestellten Auswerte-Algorithmen sehr gut zur Klassifizierung von Gewebedünnschnitten eignen.
|
17 |
Enhanced Conformational Sampling of Proteins Using TEE-REX / Verbessertes Sampling von Proteinkonformationen durch TEE-REXKubitzki, Marcus 11 December 2007 (has links)
No description available.
|
18 |
Analysis of Implied Volatility Surfaces / Analyse von Impliziten VolatilitätsflächenSchnellen, Marina 04 May 2007 (has links)
No description available.
|
19 |
Einsatz der FT-IR-Mikrospektroskopie und multivariater Auswertealgorithmen zur Identifizierung und Klassifizierung von TumorgewebenRichter, Tom 27 August 2002 (has links)
Das erste gestellte Ziel war es, die histologischen Strukturen eines Gewebedünnschnittes anhand der aufgenommenen FT-IR-Spektren sichtbar zu machen und diese mit dem konventionell gefärbten Schnitt und der autoradiographischen Aufnahme zu vergleichen. Dazu wurde ein Messsystem bestehend aus einem FT-IR-Spektrometer mit Mikroskop und einem computergesteuerten XY-Tisch aufgebaut und die notwendige Steuer- und Auswerte-Software entwickelt. Es konnte gezeigt werden, dass sich die FT-IR-Spektren mit geeigneten Auswerteverfahren zur Darstellung der histologischen Strukturen nutzen lassen. Dazu wurden zwei verschiedene Methoden eingesetzt, die PCA und die Fuzzy-Clusterung (FCM). Im zweiten Teil dieser Arbeit sollte ein Klassifikations-Algorithmus gefunden werden, mit dessen Hilfe sich Spektren von unbekannten Gewebeproben vorher definierten Modellen zuordnen lassen. Dazu wurde eine Spektren-Datenbank aus mehr als einhundert Gewebeproben angelegt. Aus dieser Datenbank wurden einige zehntausend Spektren ausgewählt und zu Modell-Datensätzen für sechs verschiedene Gewebetypen zusammengefasst. Für die Zuordnung unbekannter Spektren zu diesen Modellen wurde ein SIMCA-Klassifikations-Algorithmus entwickelt sowie ein LDA-Algorithmus eingesetzt. Für beide Methoden wurde die Klassi-fikations-Leistung anhand der Spezifität und Sensitivität bestimmt. Beide Klassifikations-Algorithmen führten zu guten Ergebnissen. Der SIMCA-Algorithmus erreichte eine Spezifität zwischen 97 % und 100 %, sowie eine Sensitivität zwischen 62 % und 78 % (bei einem Vertrauensintervall von 97,5 %). Der LDA-Algorithmus ermöglichte eine etwas bessere Sensitivität von 72 % bis 90 %, auf Kosten der Spezifität, welche zwischen 90 % und 98 % lag. Zusammenfassend kann festgestellt werden, dass sich die FT-IR-Mikrospektroskopie und die vorgestellten Auswerte-Algorithmen sehr gut zur Klassifizierung von Gewebedünnschnitten eignen.
|
20 |
Gender Dissimilarities in Body Gait Kinematics at Different SpeedsZaumseil, Falk, Bräuer, Sabrina, Milani, Thomas L., Brunnett, Guido 22 May 2023 (has links)
Observers can identify gender based on individual gait styles visually. Existing research showed that gender differences in gait kinematics mainly occur in the frontal and transverse planes and are influenced by various factors. This study adds to the existing work by analysing the kinematic features that distinguish gait styles influenced by gender and gait speeds. 29 females and 33 males without gait disorders took part in this study. A wireless IMU-based sensor system was used to collect 3D kinematic data at 60 Hz on a 15 m walkway at three different gait speeds. Statistical analysis was based on discrete parameters, principal component analysis (PCA), and support vector machines (SVM). Dissimilarities due to different gait speeds were analysed in transverse and frontal planes for the upper body and in the sagittal plane for the upper and lower body (p < 0.001 and Cohen’s d > 0.8). In joint angles (knees; transversal plane), segment orientation angles (upper body; frontal plane) and segment position (upper body; sagittal and frontal plane), statistically significant differences (p < 0.001 and Cohen’s d > 0.8) were observed for gender.Good classification accuracies for joint angles, segment orientation and segment positions of 97-100 % between gait speed and 77-87 % between gender groups were found. In this study, gender had less influence on gait kinematics than gait speed.:1. Introduction
2. Methods
3. Results
4. Discussion
|
Page generated in 0.0799 seconds