11 |
Μοντελοποίηση χρονοσειρών με χρήση τεχνικών γενετικού προγραμματισμούΘεοφιλάτος, Κωνσταντίνος 03 July 2009 (has links)
Η αυτοματοποιημένη μεθοδολογία εύρεσης προγραμμάτων υπολογιστών (κώδικα) που βασίζεται στις αρχές της βιολογικής εξέλιξης, ονομάζεται Γενετικός Προγραμματισμός (ΓΠ). Με άλλα λόγια, πρόκειται για μια τεχνική Μηχανικής Μάθησης, η οποία χρησιμοποιεί ένα Εξελικτικό Αλγόριθμο για να βελτιστοποιήσει ένα πληθυσμό από προγράμματα υπολογιστή σύμφωνα με μια συνάρτηση καταλληλότητας που καθορίζεται από την ικανότητα του προγράμματος να εκτελέσει ένα δοσμένο υπολογιστικό έργο.
Στην εργασία αυτή θα χρησιμοποιηθούν διάφορες τεχνικές Γενετικού Προγραμματισμού στην μοντελοποίηση Χρονοσειρών. Τα συστήματα που θα αναπτυχθούν, θα χρησιμοποιηθούν για τους παρακάτω σκοπούς:
• Μοντελοποίηση του συστήματος που «παράγει» τη χρονοσειρά,
• Εξαγωγή χαρακτηριστικών και κανόνων που μπορούν να οδηγήσουν στην ικανότητα πρόβλεψης χρονοσειρών.
Οι χρονοσειρές που θα χρησιμοποιηθούν για να δοκιμάσουμε την λειτουργία των συστημάτων που θα υλοποιηθούν είναι οι εξής:
• Χρονοσειρά δεικτών ελληνικού χρηματιστηρίου,
• Χρονοσειρές ιατρικών δεδομένων όπως για παράδειγμα χρονοσειρά σήματος μαγνητοεγκεφαλογραφήματος.
Οι κλασσικές τεχνικές Γενετικού Προγραμματισμού χρησιμοποιούν δενδρικές δομές για την αναπαράσταση των προγραμμάτων-ατόμων των πληθυσμών. Στο παρελθόν έχουν εκπονηθεί και υλοποιηθεί πολλές εργασίες που χρησιμοποιούν γενετικό προγραμματισμό για την μοντελοποίηση χρονοσειρών. Τα αποτελέσματα ήταν ικανοποιητικά. Το βασικό πρόβλημα που αντιμετωπίστηκε ήταν ο μεγάλος χρόνος εκτέλεσης που απαιτούν οι κλασσικές τεχνικές Γενετικού προγραμματισμού. Το θέμα λοιπόν είναι ανοιχτό σε μελέτη και υπάρχει η ανάγκη να χρησιμοποιηθούν νέες τεχνικές γενετικού προγραμματισμού για να πάρουμε και καλύτερα και πιο γρήγορα αποτελέσματα.
Στην εργασία αυτή, θα χρησιμοποιηθεί η τεχνική του Γραμμικού Γενετικού Προγραμματισμού. Σε αυτήν την τεχνική, τα προγράμματα-άτομα του πληθυσμού αναπαρίστανται σαν μια ακολουθία από εντολές οι οποίες αναπαρίστανται σε δυαδική μορφή. Οι δύο αυτές τεχνικές θα συγκριθούν και θα βγουν συμπεράσματα για το ποια είναι η πιο χρήσιμη στον τομέα της μοντελοποίησης χρονοσειρών.
Ακόμη, θα υλοποιηθούν αλγόριθμοι οι οποίοι εντοπίζουν και αφαιρούν τον κώδικα που δεν συμμετέχει στην παραγωγή της εξόδου των προγραμμάτων-ατόμων του πληθυσμού. Οι αλγόριθμοι αυτοί, περιμένουμε να επιταχύνουν κατά πολύ την διαδικασία της εξέλιξης του πληθυσμού, αφού στον γενετικό προγραμματισμό σχηματίζονται συχνά τέτοια μπλοκ κώδικα που δεν επηρεάζουν την έξοδο των προγραμμάτων. / -
|
12 |
Identification of thermal building properties using gray box and deep learning methodsBaasch, Gaby 25 January 2021 (has links)
Enterprising technologies and policies that focus on energy reduction in buildings are paramount to achieving global carbon emissions targets. Energy retrofits, building stock modelling, heating, ventilation, and air conditioning (HVAC) upgrades and demand side management all present high leverage opportunities in this regard. Advances in computing, data science and machine learning can be leveraged to enhance these methods and thus to expedite energy reduction in buildings but challenges such as lack of data, limited model generalizability and reliability and un-reproducible studies have resulted in restricted industry adoption. In this thesis, rigorous and reproducible studies are designed to evaluate the benefits and limitations of state-of-the-art machine learning and statistical techniques for high-impact applications, with an emphasis on addressing the challenges listed above.
The scope of this work includes calibration of physics-based building models and supervised deep learning, both of which are used to estimate building properties from real and synthetic data.
• Original grey-box methods are developed to characterize physical thermal properties (RC and RK)from real-world measurement data.
• The novel application of supervised deep learning for thermal property estimation and HVAC systems identification is shown to achieve state-of-the-art performance (root mean squared error of 0.089 and 87% validation accuracy, respectively).
• A rigorous empirical review is conducted to assess which types of gray and black box models are most suitable for practical application. The scope of the review is wider than previous studies, and the conclusions suggest a re-framing of research priorities for future work.
• Modern interpretability techniques are used to provide unique insight into the learning behaviour of the black box methods.
Overall, this body of work provides a critical appraisal of new and existing data-driven approaches for thermal property estimation in buildings. It provides valuable and novel insight into barriers to widespread adoption of these techniques and suggests pathways forward. Performance benchmarks, open-source model code and a parametrically generated, synthetic dataset are provided to support further research and to encourage industry adoption of the approaches. This lays the necessary groundwork for the accelerated adoption of data-driven models for thermal property identification in buildings. / Graduate
|
13 |
Data-Driven Analysis and Validation of Refrigeration in United StatesCommercial BuildingsTimothy, Stephen Colin 26 August 2022 (has links)
No description available.
|
14 |
Generative Approach For Multivariate SignalsSawant, Vinay, Bhende, Renu January 2024 (has links)
In this thesis, we explored the generative adversarial network called uTSGAN to generate patterns from multivariate CAN bus time series dataset. Since the given data is unlabelled, unprocessed and highly imbalanced containing large amount of missing values, we have to define and discard a few timestamps and limit the focus of the study to the reduced subset involving patterns of the 10-second window size, which are categorised and clustered into majority and minority classes. To generate such an imbalanced set, we have used image based time series GAN called uTSGAN which transforms a time sequence into a spectrogram image and back to a time sequence within the same GAN framework. For the comparison, we also prepared a resampled (balanced) dataset from the imbalanced set to use in alternative experiments. This comparison evaluates the results of the conventional resampling approach against the baseline as well as our novel implementations. We propose two new methods using "cluster density based" and "sample loss based" techniques. Throughout the experimentation, the "cluster density based" GANs consistently achieved better results on some common and uncommon evaluations for multivariate and highly imbalanced sample sets. Among some regular evaluation methods, classification metrics such as balanced accuracy and precision provide a better understanding of experimentation results. The TRTS balanced accuracy and precision from "cluster density based" GAN achieves over 82% and 90% with an improvement of 20-30% and 14-18% respectively from that of baseline; the TSTR balanced accuracy of "cluster density based" increased by 10.6% from that of baseline and it show slightly better precision with respect to that of the baseline when compared on generated results from univariate experiments. Secondly, the alternative "resampling based" implementations show similar values to that of the baseline in TRTS and TSTR classifications. Simultaneously, More distinguished results are seen using a quantitative metric called Earth Mover’s Distance(EMD). We have used this distance measure to calculate the overall mean EMD and clusterwise mean EMD between real samples and fake (i.e. generated) samples. During their evaluations, "cluster density based" experiments showed significantly better results for not only majority but also minority clusters as compared to the results of baseline and "resampling based" experiments. At the end, we have opened a discussion on how one can utilize our findings in MAR problem aswell as improve the results by taking some precautionary measures.
|
Page generated in 0.0675 seconds