Spelling suggestions: "subject:"symbolise egression"" "subject:"symbolise aregression""
1 |
Investigation of the Potential of Optimal Experimental Design and Symbolic Regression for Thermodynamic Property ModelingFrotscher, Ophelia 26 August 2024 (has links)
In chemical and energy engineering, it is crucial to understand the thermodynamic properties of fluids and solids and their phase behavior. Equations of state have been proven to be extremely helpful in representing these properties. Today, the most accurate modeling approaches for equations of state are empirical methods. These methods typically depend on the expert knowledge of the modeler, as well as on the quantity and quality of the available data. To accelerate the modeling process, the potential of symbolic regression, a method that not only fits the parameters of a given model, but also seeks its functional form, is investigated.
Accurate modeling of thermodynamic properties is impossible, without a reliable data base. While different data acquisition methods exist, carefully conducted measurements are the most important data acquisition method. However, setting up experiments and conducting the measurements are often time-consuming and expensive. Therefore, reducing the experimental effort without sacrificing information for model development is highly desirable.
Optimal experimental design is a methodology for planning measurements
that aims to be the most informative regarding the uncertainty in parameter estimates or predictions of a given model. In the present thesis, the optimal experimental design algorithm was adapted to consider different equilibrium times for changes in temperature and pressure.
The main problems for the individual application of symbolic regression and optimal experimental design are that for symbolic regression,
there are often not enough data available, and for optimal experimental design, the underlying model is rarely known. For this reason, the potential of combining optimal experimental design with symbolic regression for efficient thermodynamic property modeling was investigated within an iterative data acquisition and modeling process.
Optimal experimental design and symbolic regression, individually and together, were found to have the potential to accelerate the data acquisition and modeling of thermodynamic properties, which is also of interest for other applications.:Nomenclature
Abstract
Kurzfassung
Introduction
Results
Summary and Outlook
Bibliography
Appendix / In der Chemie- und Energietechnik ist es von entscheidender Bedeutung, die thermodynamischen Eigenschaften von Flüssigkeiten und Feststoffen und ihr Phasenverhalten zu verstehen. Zustandsgleichungen haben sich bei der Darstellung dieser Eigenschaften als äußerst hilfreich erwiesen. Die genauesten Modellierungsansätze für Zustandsgleichungen sind heute empirische Methoden. Diese Methoden hängen in der Regel vom Fachwissen des Modellierers sowie von der Menge und Qualität der verfügbaren Daten ab. Um den Modellierungsprozess zu beschleunigen, wird das Potenzial der symbolischen Regression untersucht, einer Methode, die nicht nur die Parameter eines gegebenen Modells anpasst, sondern auch dessen funktionale Form sucht.
Eine genaue Modellierung der thermodynamischen Eigenschaften ist ohne eine zuverlässige Datenbasis nicht möglich. Zwar gibt es verschiedene Methoden der Datenerfassung, doch sind sorgfältig durchgeführte Messungen die wichtigste Methode der Datenerfassung. Der Aufbau von Experimenten und die Durchführung der Messungen sind jedoch oft zeitaufwändig und teuer. Daher ist es äußerst wünschenswert, den experimentellen Aufwand zu verringern, ohne dabei Informationen für die Modellentwicklung zu verlieren.
Optimale Versuchsplanung ist eine Methodik zur Planung von Messungen
die darauf abzielt, die Unsicherheit in den Parameterschätzungen oder Vorhersagen eines gegebenen Modells so informativ wie möglich zu gestalten. In der vorliegenden Arbeit wurde der Algorithmus für die optimale Versuchsplanung so angepasst, dass unterschiedliche Gleichgewichtszeiten für Temperatur- und Druckänderungen berücksichtigt werden.
Die Hauptprobleme bei der individuellen Anwendung von symbolischer Regression und optimaler Versuchsplanung sind, dass für die symbolische Regression
oft nicht genügend Daten zur Verfügung stehen und bei der optimalen Versuchsplanung das zugrunde liegende Modell selten bekannt ist. Aus diesem Grund wurde das Potenzial der Kombination von optimaler Versuchsplanung und symbolischer Regression für eine effiziente Modellierung thermodynamischer Eigenschaften im Rahmen eines iterativen Datenerfassungs- und Modellierungsprozesses untersucht.
Es wurde festgestellt, dass die optimale Versuchsplanung und die symbolische Regression, sowohl einzeln als auch zusammen, das Potenzial haben, die Datenerfassung und Modellierung thermodynamischer Eigenschaften zu beschleunigen, was auch für andere Anwendungen von Interesse ist.:Nomenclature
Abstract
Kurzfassung
Introduction
Results
Summary and Outlook
Bibliography
Appendix
|
2 |
Development and Application of Machine Learning Methods to Selected Problems of Theoretical Solid State PhysicsHoock, Benedikt Andreas 16 August 2022 (has links)
In den letzten Jahren hat sich maschinelles Lernen als hilfreiches Werkzeug zur Vorhersage von simulierten Materialeigenschaften erwiesen. Somit können aufwendige Berechnungen mittels Dichtefunktionaltheorie umgangen werden und bereits bekannte Materialien besser verstanden oder sogar neuartige entdeckt werden. Eine zentrale Rolle spielt dabei der Deskriptor, ein möglichst interpretierbarer Satz von Materialkenngrößen. Diese Arbeit präsentiert einen Ansatz zur Auffindung von Deskriptoren für periodische Multikomponentensysteme, deren Eigenschaften durch die genaue atomare Anordnung mitbeinflusst wird. Primäre Features von Einzel-, Paar- und Tetraederclustern werden über die Superzelle gemittelt und weiter algebraisch kombiniert. Aus den so erzeugten Kandidaten wird mittels Dimensionalitätsreduktion ein geeigneter Deskriptor identifiziert. Zudem stellt diese Arbeit Strategien vor bei der Modellfindung Kreuzvalidierung einzusetzen, sodass stabilere und idealerweise besser generalisierbare Deskriptoren gefunden werden. Es werden außerdem mehrere Fehlermaße untersucht, die die Qualität der Deskriptoren bezüglich Genauigkeit, Komplexität der Formeln und Berücksichtung der atomaren Anordnung charakterisieren. Die allgemeine Methodik wurde in einer teilweise parallelisierten Python-Software implementiert. Als konkrete Problemstellungen werden Modelle für die Gitterkonstante und die Mischenergie von ternären Gruppe-IV Zinkblende-Legierungen "gelernt", mit einer Genauigkeit von 0.02 Å bzw. 0.02 eV. Datenbeschaffung, -analyse, und -bereinigung werden im Hinblick auf die Zielgrößen als auch auf die primären Features erläutert, sodass umfassende Analysen und die Parametrisierung der Methodik an diesem Testdatensatz durchgeführt werden können. Als weitere Anwendung werden Gitterkonstante und Bandlücken von binären Oktett-Verbindungen vorhergesagt. Die präsentierten Deskriptoren werden mit den Fehlermaßen evaluiert und ihre physikalische Relevanz wird abschließend disktutiert. / In the last years, machine learning methods have proven as a useful tool for the prediction of simulated material properties. They may replace effortful calculations based on density functional theory, provide a better understanding of known materials or even help to discover new materials. Here, an essential role is played by the descriptor, a desirably interpretable set of material parameters. This PhD thesis presents an approach to find descriptors for periodic multi-component systems where also the exact atomic configuration influences the physical characteristics. We process primary features of one-atom, two-atom and tetrahedron clusters by an averaging scheme and combine them further by simple algebraic operations. Compressed sensing is used to identify an appropriate descriptor out from all candidate features. Furthermore, we develop elaborate cross-validation based model selection strategies that may lead to more robust and ideally better generalizing descriptors. Additionally, we study several error measures which estimate the quality of the descriptors with respect to accuracy, complexity of their formulas and the capturing of configuration effects. These generally formulated methods were implemented in a partially parallelized Python program. Actual learning tasks were studied on the problem of finding models for the lattice constant and the energy of mixing of group-IV ternary compounds in zincblende structure where an accuracy of 0.02 Å and 0.02 eV is reached, respectively. We explain the practical preparation steps of data acquisition, analysis and cleaning for the target properties and the primary features, and continue with extensive analyses and the parametrization of the developed methodology on this test case. As an additional application we predict lattice constants and band gaps of octet binary compounds. The presented descriptors are assessed quantitatively by the error measures and, finally, their physical meaning is discussed.
|
Page generated in 0.0704 seconds