Return to search

Development and Analysis of non-standard Echo State Networks

Deep Learning hat in den letzten Jahren mit der Entwicklung leistungsfähigerer Hardware und neuer Architekturen wie dem Convolutional Neural Network (CNN), Transformer, und Netzwerken aus Long-Short Term Memory (LSTM)-Zellen ein rasantes Wachstum erlebt. Modelle für viele verschiedene Anwendungsfälle wurden erfolgreich veröffentlicht, und Deep Learning hat Einzug in viele alltägliche Anwendungen gehalten. Einer der größten Nachteile komplexer Modelle wie den CNNs oder LSTMs ist jedoch ihr hoher Energieverbrauch und der Bedarf an großen Mengen annotierter Trainingsdaten. Zumindest letzteres Problem wird teilweise durch die Einführung von neuen Methoden gelöst, die mit nicht-annotierten Daten umgehen können. In dieser Arbeit werden Echo State Networks (ESNs), eine Variante der rekurrenten neuronalen Netze (RNN), betrachtet, da sie eine Möglichkeit bieten, die betrachteten Probleme vieler Deep-Learning Architekturen zu lösen. Einerseits können sie mit linearer Regression trainiert werden, einer relativ einfachen, effizienten und gut etablierten Trainingsmethode. Andererseits sind ESN-Modelle interessante Kandidaten für die Erforschung neuer Trainingsmethoden, insbesondere unüberwachter Lerntechniken, die später in Deep-Learning-Methoden integriert werden können und diese effizienter und leichter trainierbar machen, da sie in ihrer Grundform relativ einfach zu erzeugen sind. Zunächst wird ein allgemeines ESN-Modell in einzelne Bausteine zerlegt, die flexibel zu neuen Architekturen kombiniert werden können. Anhand eines Beispieldatensatzes werden zunächst Basis-ESN-Modelle mit zufällig initialisierten Gewichten vorgestellt, optimiert und evaluiert. Anschließend werden deterministische ESN-Modelle betrachtet, bei denen der Einfluss unterschiedlicher zufälliger Initialisierungen reduziert ist. Es wird gezeigt, dass diese Architekturen recheneffizienter sind, aber dennoch eine vergleichbare Leistungsfähigkeit wie die Basis-ESN-Modelle aufweisen. Es wird auch gezeigt, dass deterministische ESN-Modelle verwendet werden können, um hierarchische ESN-Architekturen zu bilden. Anschließend werden unüberwachte Trainingsmethoden für die verschiedenen Bausteine des ESN-Modells eingeführt, illustriert und in einer vergleichenden Studie mit Basis- und deterministischen ESN-Architekturen als Basis evaluiert. Anhand einer Vielzahl von Benchmark-Datensätzen für die Zeitreihenklassifikation und verschiedene Audioverarbeitungsaufgaben wird gezeigt, dass die in dieser Arbeit entwickelten ESN-Modelle in der Lage sind, ähnliche Ergebnisse wie der Stand der Technik in den jeweiligen Bereichen zu erzielen. Darüber hinaus werden Anwendungsfälle identifiziert, für die bestimmte ESN-Modelle bevorzugt werden sollten, und es werden die Grenzen der verschiedenen Trainingsmethoden diskutiert. Abschließend wird gezeigt, dass zwischen dem übergeordneten Thema Reservoir Computing und Deep Learning eine Forschungslücke existiert, die in Zukunft zu schließen ist.:Statement of authorship vii
Abstract ix
Zusammenfassung xi
Acknowledgments xiii
Contents xv
Acronyms xix
List of Publications xxiii
1 Introduction 1
1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Reservoir Computing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Objective and Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Outline . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Echo State Network 5
2.1 Artificial neuron model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 The basic Echo State Network . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Advanced Echo State Network structures . . . . . . . . . . . . . . . . . . . . 15
2.4 Hyper-parameter optimization of Echo State Networks . . . . . . . . . . . . . 22
3 Building blocks of Echo State Networks 25
3.1 Toolboxes for Reservoir Computing Networks . . . . . . . . . . . . . . . . . . 25
3.2 Building blocks of Echo State Networks . . . . . . . . . . . . . . . . . . . . . 26
3.3 Define Extreme LearningMachines . . . . . . . . . . . . . . . . . . . . . . . . 30
3.4 Define Echo State Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.5 Sequential hyper-parameter optimization . . . . . . . . . . . . . . . . . . . . . 32
4 Basic, deterministic and hierarchical Echo State Networks 35
4.1 Running example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Performance of a basic Echo State Network . . . . . . . . . . . . . . . . . . . 37
4.3 Performance of hierarchical Echo State Networks . . . . . . . . . . . . . . . . 42
4.4 Performance of deterministic Echo State Network architectures . . . . . . . . 44
4.5 Performance of hierarchical deterministic Echo State Networks . . . . . . . . 50
4.6 Comparison of the considered ESN architectures . . . . . . . . . . . . . . . . 52
4.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5 Unsupervised Training of the Input Weights in Echo State Networks 57
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.2 Method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.3 Optimization of the KM-ESN model . . . . . . . . . . . . . . . . . . . . . . . 63
5.4 Performance of the KM-ESN . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.5 Combination of the KM-ESN and deterministic architectures . . . . . . . . . 74
5.6 Hierarchical (determinstic) KM-ESN architectures . . . . . . . . . . . . . . . 77
5.7 Comparison of the considered KM-ESN architectures . . . . . . . . . . . . . . 80
5.8 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6 Unsupervised Training of the Recurrent Weights in Echo State Networks 85
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.2 Method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.3 Optimization of the pre-trained models . . . . . . . . . . . . . . . . . . . . . . 88
6.4 Performance of the KM-ESN-based models . . . . . . . . . . . . . . . . . . . 93
6.5 Comparison of all considered ESN architectures . . . . . . . . . . . . . . . . . 95
6.6 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
7 Multivariate time series classification with non-standard Echo State Networks 101
7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.2 Datasets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.3 Measurements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
7.4 Optimization of the hyper-parameters . . . . . . . . . . . . . . . . . . . . . . 105
7.5 Comparison of different ESN architectures . . . . . . . . . . . . . . . . . . . . 107
7.6 Overall results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
8 Application of Echo State Networks to audio signals 123
8.1 Acoustic Feature Extraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.2 Phoneme Recognition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.3 Musical Onset Detection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
8.4 Multipitch tracking in audio signals . . . . . . . . . . . . . . . . . . . . . . . . 157
8.5 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
9 Conclusion and Future Work 165
9.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
9.2 Future work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Bibliography 169 / The field of deep learning has experienced rapid growth in recent years with the development of more powerful hardware and new architectures such as the Convolutional Neural Network (CNN), transformer, and Long-Short Term Memory (LSTM) cells. Models for many different use cases have been successfully published, and deep learning has found its way into many everyday applications. However, one of the major drawbacks of complex models based on CNNs or LSTMs is their resource hungry nature such as the need for large amounts of labeled data and excessive energy consumption. This is partially addressed by introducing more and more methods that can deal with unlabeled data. In this thesis, Echo State Network (ESN) models, a variant of a Recurrent Neural Network (RNN), are studied because they offer a way to address the aforementioned problems of many deep learning architectures. On the one hand, they can easily be trained using linear regression, which is a simple, efficient, and well-established training method. On the other hand, since they are relatively easy to generate in their basic form, ESN models are interesting candidates for investigating new training methods, especially unsupervised learning techniques, which can later find their way into deep learning methods, making them more efficient and easier to train. First, a general ESN model is decomposed into building blocks that can be flexibly combined to form new architectures. Using an example dataset, basic ESN models with randomly initialized weights are first introduced, optimized, and evaluated. Then, deterministic ESN models are considered, where the influence of random initialization is reduced. It is shown that these architectures have a lower computational complexity but that they still show a comparable performance to the basic ESN models. It is also shown that deterministic ESN models can be used to build hierarchical ESN architectures. Then, unsupervised training methods for the different building blocks of the ESN model are introduced, illustrated, and evaluated in a comparative study with basic and deterministic ESN architectures as a baseline. Based on a broad variety of benchmark datasets for time-series classification and various audio processing tasks, it is shown that the ESN models proposed in this thesis can achieve results similar to the state-of-the-art approaches in the respective field. Furthermore, use cases are identified, for which specific models should be preferred, and limitations of the different training methods are discussed. It is also shown that there is a research gap between the umbrella topics of Reservoir Computing and Deep Learning that needs to be filled in the future.:Statement of authorship vii
Abstract ix
Zusammenfassung xi
Acknowledgments xiii
Contents xv
Acronyms xix
List of Publications xxiii
1 Introduction 1
1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Reservoir Computing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Objective and Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Outline . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Echo State Network 5
2.1 Artificial neuron model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 The basic Echo State Network . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Advanced Echo State Network structures . . . . . . . . . . . . . . . . . . . . 15
2.4 Hyper-parameter optimization of Echo State Networks . . . . . . . . . . . . . 22
3 Building blocks of Echo State Networks 25
3.1 Toolboxes for Reservoir Computing Networks . . . . . . . . . . . . . . . . . . 25
3.2 Building blocks of Echo State Networks . . . . . . . . . . . . . . . . . . . . . 26
3.3 Define Extreme LearningMachines . . . . . . . . . . . . . . . . . . . . . . . . 30
3.4 Define Echo State Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.5 Sequential hyper-parameter optimization . . . . . . . . . . . . . . . . . . . . . 32
4 Basic, deterministic and hierarchical Echo State Networks 35
4.1 Running example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Performance of a basic Echo State Network . . . . . . . . . . . . . . . . . . . 37
4.3 Performance of hierarchical Echo State Networks . . . . . . . . . . . . . . . . 42
4.4 Performance of deterministic Echo State Network architectures . . . . . . . . 44
4.5 Performance of hierarchical deterministic Echo State Networks . . . . . . . . 50
4.6 Comparison of the considered ESN architectures . . . . . . . . . . . . . . . . 52
4.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5 Unsupervised Training of the Input Weights in Echo State Networks 57
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.2 Method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.3 Optimization of the KM-ESN model . . . . . . . . . . . . . . . . . . . . . . . 63
5.4 Performance of the KM-ESN . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.5 Combination of the KM-ESN and deterministic architectures . . . . . . . . . 74
5.6 Hierarchical (determinstic) KM-ESN architectures . . . . . . . . . . . . . . . 77
5.7 Comparison of the considered KM-ESN architectures . . . . . . . . . . . . . . 80
5.8 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6 Unsupervised Training of the Recurrent Weights in Echo State Networks 85
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.2 Method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.3 Optimization of the pre-trained models . . . . . . . . . . . . . . . . . . . . . . 88
6.4 Performance of the KM-ESN-based models . . . . . . . . . . . . . . . . . . . 93
6.5 Comparison of all considered ESN architectures . . . . . . . . . . . . . . . . . 95
6.6 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
7 Multivariate time series classification with non-standard Echo State Networks 101
7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.2 Datasets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.3 Measurements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
7.4 Optimization of the hyper-parameters . . . . . . . . . . . . . . . . . . . . . . 105
7.5 Comparison of different ESN architectures . . . . . . . . . . . . . . . . . . . . 107
7.6 Overall results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
8 Application of Echo State Networks to audio signals 123
8.1 Acoustic Feature Extraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.2 Phoneme Recognition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.3 Musical Onset Detection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
8.4 Multipitch tracking in audio signals . . . . . . . . . . . . . . . . . . . . . . . . 157
8.5 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
9 Conclusion and Future Work 165
9.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
9.2 Future work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Bibliography 169

Identiferoai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:89685
Date14 March 2024
CreatorsSteiner, Peter
ContributorsBirkholz, Peter, Gallicchio, Claudio, Lehnert, Ralf, Technische Universität Dresden
PublisherThelem Universitätsverlag & Buchhandlung GmbH & Co. KG
Source SetsHochschulschriftenserver (HSSS) der SLUB Dresden
LanguageEnglish
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, doc-type:doctoralThesis, info:eu-repo/semantics/doctoralThesis, doc-type:Text
Rightsinfo:eu-repo/semantics/openAccess
Relationurn:nbn:de:bsz:14-qucosa2-805416, qucosa:80541, info:eu-repo/grantAgreement/Europäischer Sozialfonds/Landesinnovationspromotionen/100327771/

Page generated in 0.0038 seconds