Актуальность и важность исследования автоматизированной системы распознавания эмоций по лицу человека с использованием глубоко разделяемой сверточной нейронной сети во многом определяются использованием преимуществ методов глубокого обучения. Таким образом, для модели с хорошей точностью настройка гиперпараметров является важным аспектом процесса глубокого обучения, а оптимизация поможет в разработке хорошего распознавания эмоций по лицу. Целью диссертации является разработка модели глубокого обучения для распознавания эмоций по лицу с использованием алгоритма сверточной нейронной сети и многоклассовой классификации, а также настройки гиперпараметров с использованием оптимизации ускоренного градиента Нестерова (NAG) для повышения производительности модели глубокого обучения. Целью данной работы является проведение экспериментальных исследований по разработке модели глубокого обучения для определения эмоций человеческого лица на основе черт лица с использованием TensorFlow. Предметом является применение методов машинного обучения для анализа автоматизированной системы распознавания эмоций по лицу человека с использованием DS-CNN. Научная новизна предлагаемой работы заключается в создании нового набора данных по эмоциям лица, который доступен на сайте Kaggle. Во-вторых, для увеличения нелинейности использовались слои глубинной свертки, точечной свертки и глобального среднего пула. И, наконец, алгоритм оптимизации ускоренного градиента Нестерова (NAG) использовался для ускорения обучения и улучшения скорости сходимости. Практическая значимость работы заключается в том, что эта работа позволяет нам разработать модель глубокого обучения с использованием сверточной нейронной сети вместе с многоклассовой классификацией и предлагаемым набором данных, где данные будут предварительно обработаны, а модель DL будет обучена с помощью набора поездов и проверено с помощью тестового набора. Разработанная методология распознает четыре основные эмоции в изображениях людей, такие как счастье, удивление, нейтральность и злость, используя наш предлагаемый набор данных, где эксперимент будет проводиться с предлагаемым набором данных, который доступен на веб-сайте Kaggle. А данные будут оцениваться с помощью статистического анализа с помощью корреляции. Размеченные данные будут предварительно обработаны, а набор данных будет разделен на 3 пары обучающих, проверочных и тестовых наборов различного размера. Модель глубокого обучения будет обучаться с каждым обучающим набором, чтобы найти правильный обучающий размер набора данных, обеспечивающий максимальную точность обучения. Модель глубокого обучения будет проверена с помощью тестового набора для определения наилучшей точности теста, а полученные результаты эксперимента будут проанализированы. / The relevance and importance of the study of automated human facial emotion recognition system using Depthwise Separable Convolutional Neural Network are largely determined by utilizing the benefits of deep learning techniques. So, for a good accuracy model, hyper parameter tuning is an essential aspect of the deep learning process and Optimization will help in developing a good facial emotion recognition. The aim of the thesis is to develop a deep learning model for facial emotion recognition using Convolutional Neural Network algorithm and Multiclass Classification along with Hyper-parameter tuning using Nesterov’s Accelerated Gradient (NAG) Optimization to improve the performance of the deep learning model. The objective of this work is to deal with experimental research to develop a deep learning model to identify the emotion of a human face based on facial features using TensorFlow. The subject is the application of machine learning methods to analyze the automated human facial emotion recognition system using DS-CNN. The scientific novelty of the proposed work is the creation of a new facial emotion dataset which is available on the Kaggle website. Secondly, Depthwise convolutional, pointwise convolutional, and global average pooling layers have been used to increase the nonlinearity. And finally, the Nesterov’s Accelerated Gradient (NAG) optimization algorithm has been used to speed up the training and improve the convergence rate. The practical significance of the work lies in the fact that this work allows us to develop a deep learning model using convolutional neural network along with multiclass classification and proposed dataset where the data will be preprocessed and the DL model will be trained with the train set and validated with the test set. The developed methodology recognizes four basic emotions in images of human beings such as happy, surprise, neutral, and angry using our proposed dataset where experiment will be performed on the proposed dataset which is available on Kaggle website. And the data will be evaluated using statistical analysis with the help of correlation. The labeled data will be pre-processed and the dataset will be split into 3 pairs of training, validation and testing sets of varying sizes. The deep learning model will be trained with each training set to find the proper training size of the dataset which gives highest training accuracy. The deep learning model will be validated with the test set to find the best test accuracy and the obtained results of the experiment will be analyzed.
Identifer | oai:union.ndltd.org:urfu.ru/oai:elar.urfu.ru:10995/129225 |
Date | January 2023 |
Creators | Кумар, А., Kumar, A. |
Contributors | Медведева, М. А., Medvedeva, M. A., УрФУ. Институт радиоэлектроники и информационных технологий-РтФ, Базовая кафедра «Аналитика больших данных и методы видеоанализа» |
Source Sets | Ural Federal University |
Language | English |
Detected Language | Russian |
Type | Master's thesis, info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Rights | Предоставлено автором на условиях простой неисключительной лицензии, http://elar.urfu.ru/handle/10995/31613 |
Page generated in 0.0026 seconds