11 |
Deploying Deep Learning for Facemask Detection in Mobile Healthcare Units : master's thesis / Внедрение глубокого обучения для распознавания лицевых масок в мобильных медицинских учрежденияхХаяви, В. М. Х., Hayawi, W. M. H. January 2024 (has links)
Identifying facemasks is an important duty that affects public health and safety, especially during epidemics of communicable diseases. Many architectures of deep learning models are being investigated for their effectiveness, as they have demonstrated great potential in automating this process. The performance of four well-known deep learning architectures—VGG19, VGG16, GRU, and Fully Convolutional Neural Networks (FCNN)—for facemask identification is thoroughly compared in this thesis. The goal of the study is to assess these architectures in terms of accuracy, efficiency, and robustness in order to offer important information for the creation of efficient facemask detection systems. This study examines the advantages and disadvantages of each model in relation to facemask detection through thorough testing and analysis. The models are statistically evaluated for their ability to detect facemasks in pictures or video streams using performance metrics including precision, recall, and F1-score. Furthermore, the actual feasibility of using these models in real-world applications is assessed by analyzing computational efficiency measures like inference time and model size. Moreover, the models' resilience is assessed in a range of demanding scenarios, such as changes in illumination, facial expressions, and occlusions. The consequences of these results are discussed in the thesis along with suggestions for improving each architecture for facemask detection tasks. This study's methodology focuses on developing and evaluating deep learning models for facemask recognition that are especially suited for usage in mobile health care units. This method seeks to guarantee high accuracy, robustness, and efficiency in real-world healthcare environments, where prompt and accurate facemask detection is essential. Four well-known deep learning architectures VGG19, VGG16, Gated Recurrent Unit (GRU), and Fully Convolutional Neural Networks (FCNN) were chosen for the models' selection and development. Due to their shown effectiveness in a range of image recognition tasks and possible flexibility to facemask detection, these models were selected. / Идентификация лицевых масок является важной задачей, которая влияет на здоровье и безопасность населения, особенно во время эпидемий инфекционных заболеваний. Многие архитектуры моделей глубокого обучения исследуются на предмет их эффективности, поскольку они продемонстрировали большой потенциал в автоматизации этого процесса. В этой работе проводится тщательное сравнение производительности четырех хорошо известных архитектур глубокого обучения —VGG19, VGG16, GRU и полностью сверточных нейронных сетей (FCNN)— для идентификации лицевых масок. Цель исследования - оценить эти архитектуры с точки зрения точности, эффективности и надежности, чтобы предоставить важную информацию для создания эффективных систем обнаружения лицевых масок. В этом исследовании рассматриваются преимущества и недостатки каждой модели в отношении распознавания лицевых масок путем тщательного тестирования и анализа. Модели подвергаются статистической оценке на предмет их способности обнаруживать лицевые маски на изображениях или в видеопотоках с использованием показателей производительности, включая точность, запоминаемость и показатель F1. Кроме того, фактическая возможность использования этих моделей в реальных приложениях оценивается путем анализа показателей вычислительной эффективности, таких как время вывода и размер модели. Более того, устойчивость моделей оценивается в ряде сложных сценариев, таких как изменение освещения, выражения лица и прикуса. В диссертации обсуждаются последствия этих результатов, а также предложения по улучшению каждой архитектуры для задач обнаружения лицевых масок. Методология этого исследования направлена на разработку и оценку моделей глубокого обучения для распознавания лицевых масок, которые особенно подходят для использования в мобильных медицинских учреждениях. Этот метод призван гарантировать высокую точность, надежность и эффективность в реальных условиях здравоохранения, где важно быстрое и точное распознавание лицевых масок. Для выбора и разработки моделей были выбраны четыре хорошо известные архитектуры глубокого обучения VGG19, VGG16, Gated Recurrent Unit (GRU) и полностью сверточные нейронные сети (FCNN). Эти модели были выбраны из-за их доказанной эффективности в решении целого ряда задач распознавания изображений и возможной гибкости в обнаружении лицевых масок. Ключевые слова: Распознавание лицевых масок, глубокое обучение, VGG19, VGG16, GRU, Полностью сверточные нейронные сети, Оценка эффективности, Мобильные медицинские учреждения.
|
12 |
Анализ корневых причин (RCA) возникновения инцидента методами машинного обучения : магистерская диссертация / Root cause analysis (RCA) of an incident using machine learning methodsПодлягин, А. В., Podlyagin, A. V. January 2023 (has links)
Объект исследования – кибер-физические системы, подверженные различным инцидентам, отказам и сбоям в своей работе. Цель работы – разработка модели машинного обучения для определения корневых причин сбоев в производственной системе, а также исследование возможности использования машинного обучения для определения причин будущих сбоев. Методы исследования: сбор, анализ и синтез данных, сравнение, обобщение, классификация, аналогия, эксперимент, измерение, описание. Результаты работы: разработана и обучена модель машинного обучения для анализа корневых причин инцидентов производственной установки методом классификации на выбранном наборе «сырых» данных небольшого объема с последующей проверкой качества ее работы на тестовых данных. Область применения – обучение модели корневым причинам инцидентов (отказов, сбоев) производственных систем на имеющихся данных с последующим оперативным обнаружением причин аномальной работы систем в тандеме с работой алгоритма по автоматическому обнаружению и прогнозированию аномалий. / The object of research is cyber-physical systems that are susceptible to various incidents, failures and malfunctions in their operation. The goal of the work is to develop a machine learning model to determine the root causes of failures in a production system, as well as to explore the possibility of using machine learning to determine the causes of future failures. Research methods: collection, analysis and synthesis of data, comparison, generalization, classification, analogy, experiment, measurement, description. Results of the work: a machine learning model was developed and trained to analyze the root causes of incidents in a production facility using the classification method on a selected set of small-volume “raw” data, followed by checking the quality of its work on test data. Scope of application: training a model for the root causes of incidents (failures, failures) of production systems using available data, followed by prompt detection of the causes of abnormal operation of systems in tandem with the work of the algorithm for automatic detection and prediction of anomalies.
|
13 |
Нейросетевая модель предупреждения столкновений квадрокоптера на основе компьютерного зрения : магистерская диссертация / Neural Network Based Quadcopter Collision Avoidance System using Computer VisionТуомас, Э. В., Tuomas, E. V. January 2024 (has links)
Разработка нейросетевой модели детектора препятствий для квадрокоптеров с использованием компьютерного зрения и её оптимизация для развертывания на устройствах с ограниченными вычислительными ресурсами. В работе проведен обзор особенностей задачи бинарной классификации, обучена базовая нейросетевая модель детектора препятствий и применены различные методы оптимизации для повышения её вычислительной эффективности. / Development of a neural network obstacle detector for quadcopters using computer vision and its optimization for deployment on resource-constrained embedded devices. The project involved a review of the features of binary classification tasks, training a base neural network model for obstacle detection, and applying various optimization techniques to improve its computational efficiency.
|
14 |
Развитие методов защиты от спама и атак по электронной почте с использованием машинного обучения и нейронных сетей : магистерская диссертацияКолтушкин, Г. И., Koltushkin, G. January 2024 (has links)
The increasing volume of unsolicited e-mail, called spam, has created an urgent need to develop more robust and resilient anti-spam filters. Recently, machine learning techniques have been used to successfully detect and filter spam. We present a systematic review of some popular machine learning based approaches for email spam filtering. Our review focuses on important concepts, attempts, performance and research trends in spam filtering. The preliminary part of the study examines the application of machine learning techniques in the process of email spam filtering by leading Internet Service Providers (ISPs) such as Gmail, Yahoo and Outlook email spam filters. The overall process of email spam filtering is discussed along with the efforts of various researchers to combat spam using machine learning techniques. Our review compares the advantages and disadvantages of existing machine learning approaches and open research problems in the field of spam filtering. / Увеличение объема нежелательной электронной почты, называемой спамом, вызвало острую необходимость в разработке более надежных и устойчивых антиспамовых фильтров. В последнее время для успешного обнаружения и фильтрации спама используются методы машинного обучения. Мы представляем систематический обзор популярных подходов к фильтрации почтового спама на основе машинного обучения. В нашем обзоре рассматриваются важные концепции, попытки, эффективность и тенденции исследований в области фильтрации спама. Рассматривается применение методов машинного обучения в процессе фильтрации почтового спама ведущими интернет-провайдерами (ISP), такими как Gmail, Yahoo и спам-фильтры электронной почты Outlook. Обсуждается общий процесс фильтрации почтового спама, а также усилия различных исследователей по борьбе со спамом с помощью методов машинного обучения. Сравниваются достоинства и недостатки существующих подходов машинного обучения и исследовательские проблемы в области фильтрации спама.
|
15 |
Analysis and Classification of Full-Field Electroretinogram Signals : master's thesisАлбасу, Ф. Б., Albas, F. B. January 2024 (has links)
Электроретинография (ЭРГ) — это неинвазивный способ измерения электрической активности сетчатки с помощью световой стимуляции. Сигналы ЭРГ содержат несколько различных компонентов, которые можно использовать для диагностики различных заболеваний сетчатки. Некоторые из этих заболеваний включают дистрофии, связанные с колбочками и палочками, возрастную дегенерацию желтого пятна, диабетическую ретинопатию, глаукому и пигментный ретинит. В этой диссертации использовались различные методы для анализа сигналов ЭРГ, включая методы временной области, частотной области и частотно-временной области. Процесс начался с очистки базы данных сигналов и предварительной обработки извлеченных сигналов. Затем были вычислены стандартные компоненты сигнала, включая a- и b-волны и неявное время, и был проведен анализ сигналов во временной области. Анализ во временной области включал изучение амплитуд и задержек различных компонентов волны, что может дать представление о функционировании различных типов клеток сетчатки. Корреляционный анализ также проводился для изучения взаимосвязи между возрастом пациентов и компонентами сигнала, результаты которого показывают очень слабую корреляцию между возрастом и компонентами, с некоторой значительной корреляцией между отдельными компонентами. В частотной области преобразование Фурье использовалось для извлечения частот сигналов для анализа. Частотное содержимое сигналов ЭРГ может раскрыть информацию о базовых физиологических процессах и потенциальных отклонениях. Однако из-за инвариантной во времени природы частотной области делать выводы, основанные исключительно на этом анализе, может быть сложно. Для анализа частотно-временной области использовалось кратковременное преобразование Фурье (STFT) вместе с анализом спектрограмм. STFT позволяло изучить, как частотное содержимое сигналов менялось с течением времени, обеспечивая более полное представление динамики сигнала. Кроме того, признаки извлекались с использованием различных окон и размеров окон для обучения классификатора машинного обучения с целью классификации сигналов. Вычисленные спектрограммы также использовались для обучения моделей глубокого обучения с различными архитектурами, и результаты сравнивались на основе используемых окон. Результаты показывают, что нет заметной корреляции между возрастом и другими компонентами сигнала во временной области. Это говорит о том, что возраст сам по себе не может быть надежным предиктором характеристик сигнала ERG. В частотной области делать выводы, основанные исключительно на частотном содержании, оказалось сложно из-за инвариантной во времени природы анализа. Более того, очевидно, что размеры окон оказывают более существенное влияние на результирующие признаки по сравнению с функциями окна. Большие размеры окон обеспечивают улучшенное разрешение по частоте, в то время как меньшие окна обеспечивают более высокое разрешение по времени. Это означает, что разрешение по времени и частоте играет более существенную роль в формировании результирующих признаков, чем обработка сигнала, выполняемая самой функцией окна. Анализ сигналов ERG с использованием различных методов, включая методы временной области, частотной области и частотно-временной области, дает ценную информацию о функции сетчатки и потенциальных расстройствах. Сочетание этих подходов, наряду с методами извлечения признаков и машинного обучения, предлагает комплексную структуру для понимания и интерпретации сигналов ERG. Однако тщательное рассмотрение таких факторов, как размеры окон и компромиссы разрешения, имеет решающее значение для получения значимых и точных результатов. / Electroretinography (ERG) is a non-invasive way of measuring the electrical activity of the retina with the help of light stimulation. ERG signals contain several different components which can be used to diagnose various retinal disorders. Some of these disorders include cone and rod related dystrophies, age-related macular degeneration, diabetic retinopathies, glaucoma and retinitis pigmentosa. In this thesis, various methods were utilized to analyze ERG signals, including time-domain, frequency-domain, and time-frequency domain techniques. The process began with cleaning the signals database and preprocessing the extracted signals. Next, standard signal components including the a- and b-waves and implicit times were computed, and time-domain analysis was conducted on the signals. The time-domain analysis involved examining the amplitudes and latencies of the different wave components, which can provide insights into the functioning of different retinal cell types. Correlation analysis was also conducted to examine there’s relationship between the patients’ age and the signal components which the results show very little correlation between the age and the components, with some significant correlation between the individual components. In the frequency domain, Fourier Transform was used to extract signal frequencies for analysis. The frequency content of the ERG signals can reveal information about the underlying physiological processes and potential abnormalities. However, due to the time-invariant nature of the frequency domain, drawing conclusions based solely on this analysis can be challenging. For time-frequency domain analysis, short-time Fourier transform (STFT) was employed along with spectrogram analysis. The STFT allowed for the examination of how the frequency content of the signals evolved over time, providing a more comprehensive representation of the signal dynamics. Additionally, features were extracted using different windows and window sizes for machine learning classifier training to classify the signals. The spectrograms computed were also used to train deep learning models with different architectures, and the results were compared based on the windows used. The findings indicate that there is no discernible correlation between age and other signal components in the time domain. This suggests that age alone may not be a reliable predictor of ERG signal characteristics. In the frequency domain, drawing conclusions based solely on the frequency content proved challenging due to the time-invariant nature of the analysis. Moreover, it is evident that window sizes have a more significant impact on the resulting features compared to window functions. Larger window sizes yield improved frequency resolution, while smaller windows offer higher time resolution. This implies that the time and frequency resolution play a more substantial role in shaping the resulting features than the signal processing performed by the window function itself. The analysis of ERG signals using various techniques, including time-domain, frequency-domain, and time-frequency domain methods, provides valuable insights into retinal function and potential disorders. The combination of these approaches, along with feature extraction and machine learning techniques, offers a comprehensive framework for understanding and interpreting ERG signals. However, careful consideration of factors such as window sizes and resolution trade-offs is crucial for obtaining meaningful and accurate results.
|
16 |
Time Series Classification of Sport Activities using Neural Networks : master's thesisМостафа, В. М. М., Mostafa, W. M. M. January 2024 (has links)
В диссертации изучается влияние аугментации данных скользящим окном на производительность различных архитектур рекуррентных нейронных сетей (RNN) для классификации временных рядов. Исследование оценивает модели на основе слоев долговременной краткосрочной памяти (LSTM), SimpleRNN, Gated Recurrent Unit (GRU) и гибридной RNN, применяемые к классификации пяти видов деятельности: езда на велосипеде, катание на роликовых лыжах (R-Skiing), бег, катание на лыжах и ходьба. Результаты показывают, что аугментация данных скользящим окном значительно повышает производительность модели, улучшая ключевые показатели, такие как точность, отзыв, F1-оценка и достоверность. Среди протестированных моделей модели гибридной RNN и GRU продемонстрировали наивысшую точность и возможности обобщения. Кроме того, мы протестировали несколько размеров окна и шага. Конфигурация с большим размером окна (256) в целом дала лучшие результаты. Эти результаты согласуются с существующей литературой, подчеркивая эффективность аугментации данных и передовых архитектур RNN в классификации временных рядов. Исследование подчеркивает важность дополнения данных для повышения надежности моделей и предоставляет ценную информацию для будущих исследований и практических приложений в различных областях. / The thesis explores the impact of sliding window data augmentation on the performance of various Recurrent Neural Network (RNN) architectures for time series classification. The study evaluates models based on Long Short-Term Memory (LSTM) layers, SimpleRNN, Gated Recurrent Unit (GRU), and a Hybrid RNN, applied to the classification of five activities: Biking, Roller Skiing (R-Skiing), Running, Skiing, and Walking. The results show that sliding window data augmentation significantly enhances model performance, improving key metrics such as precision, recall, F1-score, and accuracy. Among the models tested, the Hybrid RNN and GRU models demonstrated the highest accuracy and generalization capabilities. Additionally, we tested several window and step sizes. The configuration with a larger window size (256) generally yielded better results. These findings are consistent with existing literature, highlighting the effectiveness of data augmentation and advanced RNN architectures in time series classification. The study highlights the importance of data augmentation in improving model robustness and provides valuable insights for future research and practical applications in various fields.
|
Page generated in 0.0262 seconds