1 |
Анализ средств для интерпретирования моделей машинного обучения при анализе табличных данных : магистерская диссертация / Analysis of tools for interpreting machine learning models when analyzing tabular dataБабий, И. Н., Babiy, I. N. January 2023 (has links)
Цель работы – анализ средств для интерпретирования моделей машинного обучения и их практического применения для интерпретирования результатов моделей машинного обучения при анализе табличных данных. Объект исследования – средства для интерпретирования моделей машинного обучения. Методы исследования: теоретический анализ литературы по теме исследования, изучение документации библиотек машинного обучения, классификация исследуемых методов, экспериментальный включающий проведение исследовательского анализа данных, обучение моделей машинного обучения и применение интерпретирования, обобщение полученных данных и их сравнение. Результаты работы: подготовлен обзор и практическое руководство по интерпретации результатов машинного обучения для табличных данных. Выпускная квалификационная работа выполнена в текстовом редакторе Microsoft Word и представлена в твердой копии. / The purpose of the work is to analyze tools for interpreting machine learning models and their practical application for interpreting the results of machine learning models when analyzing tabular data. The object of study is tools for interpreting machine learning models. Research methods: theoretical analysis of literature on the research topic, study of documentation of machine learning libraries, classification of methods being studied, experimental, including conducting exploratory data analysis, training machine learning models and applying interpretation, summarizing the data obtained and comparison. their. Results of the work: a review and practical guidance on interpreting the results of machine learning of tabular data has been prepared. The final qualifying work was completed in the text editor Microsoft Word and presented on paper.
|
2 |
Потенциалы глубокого машинного обучения для неупорядоченных систем: применимость, переносимость, предсказательная способность : автореферат диссертации на соискание ученой степени кандидата физико-математических наук : 1.3.8Балякин, И. А. January 2023 (has links)
No description available.
|
3 |
Потенциалы глубокого машинного обучения для неупорядоченных систем: применимость, переносимость, предсказательная способность : диссертация на соискание ученой степени кандидата физико-математических наук : 1.3.8Балякин, И. А. January 2023 (has links)
No description available.
|
4 |
Разработка инструмента для автоматического выявления уязвимостей в исходном коде на основе глубоких нейронных сетей : магистерская диссертация / Development of a tool for automatic detection of vulnerabilities in the source code based on deep neural networksРусинова, З. Р., Rusinova, Z. R. January 2024 (has links)
This work is devoted to the development of an automatic code testing tool that allows to effectively detect and classify vulnerabilities using deep learning methods, in particular, natural language processing methods. The paper provides an overview of existing approaches and methods of machine learning, analyzes and selects datasets and machine learning algorithms to solve the task, describes the infrastructure for conducting research and tracking their results. In the course of the study, binary classification models, multiclass classification models for determining CWE identifiers, and large language models for generating descriptions of detected vulnerabilities were studied. A new approach has also been developed to localize vulnerabilities at the line level of program code using the explainability methods of the SHAP and LIME machine learning models. / Данная работа посвящена разработке инструмента автоматического тестирования программного кода, который позволяет эффективно обнаруживать и классифицировать уязвимости с помощью методов глубокого обучения, в частности, методов обработки естественного языка. В работе представлен обзор существующих подходов и методов машинного обучения, проведен анализ и подбор наборов данных и алгоритмов машинного обучения для решения поставленной задачи, описана инфраструктура для проведения исследований и отслеживания их результатов. В ходе исследования изучены модели бинарной классификации, модели многоклассовой классификации для определения идентификаторов CWE, большие языковые модели для генерации описаний обнаруженных уязвимостей. Также был разработан новый подход для локализации уязвимостей на уровне строк программного кода с использованием методов объяснимости моделей машинного обучения SHAP и LIME.
|
5 |
Разработка системы автоматической валидации лабораторного комплекса по дисциплине «Автоматизация машинного обучения» : магистерская диссертация / Development of an automatic validation system for a laboratory complex in the discipline "Automation of machine learning"Маркин, М. Ю., Markin, M. Y. January 2024 (has links)
The object of the study is a laboratory complex in the discipline ""automation of machine learning"". All laboratory work performed by students in this discipline is subject to analysis and verification. The subject of the research is the development of an automatic validation system for a laboratory complex in the discipline ""automation of machine learning"". The system includes the creation of job verification algorithms, the integration of tools and other aspects necessary for the effective operation of the system. The purpose of the study is to develop an automatic validation system for a laboratory complex in the discipline ""automation of machine learning"". Research methods include analyzing the history and tools for automating machine learning, studying documentation for the tools involved in the work, conducting a research analysis on the possibility of generalizing the development to all laboratory work. The result of the work is a software package capable of automatically checking and evaluating students' work. / Объектом исследования является лабораторный комплекс по дисциплине «автоматизация машинного обучения». Все лабораторные работы, выполняемые студентами в рамках этой дисциплины, являются объектом анализа и проверки. Предметом исследования является разработка системы автоматической валидации лабораторного комплекса по дисциплине «автоматизация машинного обучения». Система включает в себя создание алгоритмов проверки работ, интеграцию инструментов и другие аспекты, необходимые для эффективной работы системы. Цель исследования – разработка системы автоматической валидации лабораторного комплекса по дисциплине «автоматизация машинного обучения». Методы исследования – проведение анализа истории и инструментов для автоматизации машинного обучения, изучение документации к задействованным в работе инструментам, проведение исследовательского анализа на возможность обобщения разработки на все лабораторные работы. Результат работы – программный комплекс, способный автоматически проверять и оценивать работы студентов.
|
6 |
Повышение эффективности систем машинного перевода: анализ метрик оценки качества перевода : магистерская диссертация / Improving the efficiency of machine translation systems: analyzing translation quality assessment metricsНиколаенко, Р. Р., Nikolaenko, R. R. January 2024 (has links)
С развитием технологий и увеличением объема глобальной информации машинный перевод (МП) становится все более востребованным инструментом для межъязыковой коммуникации. Современные системы машинного перевода, такие как PROMT, Yandex, Google и DeepL, генерируют значительные объемы данных, что требует надежных методов оценки их качества для повышения точности и надежности перевода. Существующие метрики, такие как BLEU, ROUGE и METEOR, имеют свои преимущества, но также обладают ограничениями, которые могут влиять на объективность оценки. В данной работе проведен всесторонний анализ существующих метрик оценки качества перевода и предложены новые метрики, адаптированные к различным жанрам текстов: художественным, техническим и документационным. Эти метрики учитывают лексические, семантические и стилистические особенности каждого жанра, что позволяет более точно и объективно оценивать качество перевода. Были разработаны алгоритмы и программное обеспечение для автоматизации процесса оценки перевода. В ходе исследования проведен сравнительный анализ эффективности работы популярных онлайн-переводчиков на основе новых метрик. Результаты исследования показали, что предложенные метрики демонстрируют высокую точность и надежность в оценке качества перевода, превосходя традиционные методы. Внедрение этих метрик в системы машинного перевода способствует повышению объективности оценки переводов, улучшению качества перевода и развитию новых методов обработки естественного языка. / With the development of technology and the increasing amount of global information, machine translation (MT) is becoming an increasingly sought-after tool for cross-lingual communication. Modern machine translation systems such as PROMT, Yandex, Google and DeepL generate significant amounts of data, which requires reliable methods to assess their quality to improve the accuracy and reliability of translation. Existing metrics such as BLEU, ROUGE and METEOR have their advantages but also have limitations that may affect the objectivity of the evaluation. This paper comprehensively analyzes existing metrics for evaluating translation quality and proposes new metrics adapted to different genres of texts: fiction, technical and documentary. These metrics take into account the lexical, semantic and stylistic features of each genre, which allows for a more accurate and objective evaluation of translation quality. Algorithms and software were developed to automate the translation evaluation process. The study conducted a comparative analysis of the performance of popular online translators based on the new metrics. The results of the study showed that the proposed metrics demonstrate high accuracy and reliability in evaluating translation quality, outperforming traditional methods. The introduction of these metrics into machine translation systems contributes to improving the objectivity of translation evaluation, enhancing translation quality and developing new methods of natural language processing.
|
7 |
Разработка учебно-практического комплекса для дисциплины «Автоматизация машинного обучения» : магистерская диссертация / Development of an educational and practical complex for the discipline “Automation of Machine Learning”Токарев, А. В., Tokarev, A. V. January 2023 (has links)
Объект исследования: является процесс обучения MLOps. Цель работы: состоит в создании учебно-практического комплекса для дисциплины «Автоматизация машинного обучения» для обучения студентов основным инструментам и технологиям автоматизации машинного обучения с возможностью дальнейшего применения полученных знаний в профессиональной деятельности. Для достижения поставленной цели необходимо решить следующие задачи. Методы исследования включают в себя: Анализ методических документов, сравнение используемых технологий, систематизацию и обобщение данных о существующих онлайн-курсах по дисциплине «Автоматизация машинного обучения»; Анализ современных программных инструментов, позволяющих выполнить и ускорить процесс автоматизации машинного обучения. / Object of study: is the MLOps learning process. The purpose of the work: is to create an educational and practical complex for the discipline “Automation of Machine Learning” to teach students the basic tools and technologies of machine learning automation with the possibility of further application of the acquired knowledge in professional activities. To achieve this goal, it is necessary to solve the following tasks. Research methods include: Analysis of methodological documents, comparison of the technologies used, systematization and synthesis of data on existing online courses in the discipline “Automation of Machine Learning”; Analysis of modern software tools that allow you to perform and speed up the process of automating machine learning.
|
8 |
Разработка аналитического обеспечения технологии машинного обучения в деятельности страховой компании : магистерская диссертация / Development of analytical support for machine learning technology in the activities of an insurance companyДенисенко, Н. С., Denisenko, N. S. January 2022 (has links)
В диссертации были изучены особенности использования методов машинного обучения в сфере страхования. Рассмотрены возможности архитектурного подхода в разработке модели машинного обучения. Осуществлен анализ тенденций цифровой трансформации сферы страхования. Осуществлена оценка результативности использования машинного обучения в страховании. Построена полная модель архитектуры ПАО СК «Росгосстрах». Разработана аналитическая модель машинного обучения в сфере тарификации страховой компании. На основе процессного подхода детально рассмотрены все фазы проекта по внедрению модели машинного обучения в деятельность страховой компании. Разработана и реализована имитационная модель управления проектом разработки и внедрения модели машинного обучения в деятельность страховой компании на основе различных сценарием. / The dissertation studied the features of using machine learning methods in the field of insurance. The possibilities of the architectural approach in the development of a machine learning model are considered. The analysis of trends in the digital transformation of the insurance industry has been carried out. The effectiveness of the use of machine learning in insurance has been evaluated. A complete model of the architecture of PJSC IC Rosgosstrakh was built. An analytical model of machine learning in the field of tariffing of an insurance company has been developed. Based on the process approach, all phases of the project to introduce a machine learning model into the activities of an insurance company are considered in detail. A simulation model for project management for the development and implementation of a machine learning model in the activities of an insurance company has been developed and implemented based on various scenarios.
|
9 |
Автоматизированная система распознавания эмоций по лицу человека с использованием разделяемой по глубине сверточной нейронной сети : магистерская диссертация / Automated Human Facial Emotion Recognition System Using Depthwise Separable Convolutional Neural NetworkКумар, А., Kumar, A. January 2023 (has links)
Актуальность и важность исследования автоматизированной системы распознавания эмоций по лицу человека с использованием глубоко разделяемой сверточной нейронной сети во многом определяются использованием преимуществ методов глубокого обучения. Таким образом, для модели с хорошей точностью настройка гиперпараметров является важным аспектом процесса глубокого обучения, а оптимизация поможет в разработке хорошего распознавания эмоций по лицу. Целью диссертации является разработка модели глубокого обучения для распознавания эмоций по лицу с использованием алгоритма сверточной нейронной сети и многоклассовой классификации, а также настройки гиперпараметров с использованием оптимизации ускоренного градиента Нестерова (NAG) для повышения производительности модели глубокого обучения. Целью данной работы является проведение экспериментальных исследований по разработке модели глубокого обучения для определения эмоций человеческого лица на основе черт лица с использованием TensorFlow. Предметом является применение методов машинного обучения для анализа автоматизированной системы распознавания эмоций по лицу человека с использованием DS-CNN. Научная новизна предлагаемой работы заключается в создании нового набора данных по эмоциям лица, который доступен на сайте Kaggle. Во-вторых, для увеличения нелинейности использовались слои глубинной свертки, точечной свертки и глобального среднего пула. И, наконец, алгоритм оптимизации ускоренного градиента Нестерова (NAG) использовался для ускорения обучения и улучшения скорости сходимости. Практическая значимость работы заключается в том, что эта работа позволяет нам разработать модель глубокого обучения с использованием сверточной нейронной сети вместе с многоклассовой классификацией и предлагаемым набором данных, где данные будут предварительно обработаны, а модель DL будет обучена с помощью набора поездов и проверено с помощью тестового набора. Разработанная методология распознает четыре основные эмоции в изображениях людей, такие как счастье, удивление, нейтральность и злость, используя наш предлагаемый набор данных, где эксперимент будет проводиться с предлагаемым набором данных, который доступен на веб-сайте Kaggle. А данные будут оцениваться с помощью статистического анализа с помощью корреляции. Размеченные данные будут предварительно обработаны, а набор данных будет разделен на 3 пары обучающих, проверочных и тестовых наборов различного размера. Модель глубокого обучения будет обучаться с каждым обучающим набором, чтобы найти правильный обучающий размер набора данных, обеспечивающий максимальную точность обучения. Модель глубокого обучения будет проверена с помощью тестового набора для определения наилучшей точности теста, а полученные результаты эксперимента будут проанализированы. / The relevance and importance of the study of automated human facial emotion recognition system using Depthwise Separable Convolutional Neural Network are largely determined by utilizing the benefits of deep learning techniques. So, for a good accuracy model, hyper parameter tuning is an essential aspect of the deep learning process and Optimization will help in developing a good facial emotion recognition. The aim of the thesis is to develop a deep learning model for facial emotion recognition using Convolutional Neural Network algorithm and Multiclass Classification along with Hyper-parameter tuning using Nesterov’s Accelerated Gradient (NAG) Optimization to improve the performance of the deep learning model. The objective of this work is to deal with experimental research to develop a deep learning model to identify the emotion of a human face based on facial features using TensorFlow. The subject is the application of machine learning methods to analyze the automated human facial emotion recognition system using DS-CNN. The scientific novelty of the proposed work is the creation of a new facial emotion dataset which is available on the Kaggle website. Secondly, Depthwise convolutional, pointwise convolutional, and global average pooling layers have been used to increase the nonlinearity. And finally, the Nesterov’s Accelerated Gradient (NAG) optimization algorithm has been used to speed up the training and improve the convergence rate. The practical significance of the work lies in the fact that this work allows us to develop a deep learning model using convolutional neural network along with multiclass classification and proposed dataset where the data will be preprocessed and the DL model will be trained with the train set and validated with the test set. The developed methodology recognizes four basic emotions in images of human beings such as happy, surprise, neutral, and angry using our proposed dataset where experiment will be performed on the proposed dataset which is available on Kaggle website. And the data will be evaluated using statistical analysis with the help of correlation. The labeled data will be pre-processed and the dataset will be split into 3 pairs of training, validation and testing sets of varying sizes. The deep learning model will be trained with each training set to find the proper training size of the dataset which gives highest training accuracy. The deep learning model will be validated with the test set to find the best test accuracy and the obtained results of the experiment will be analyzed.
|
10 |
Предсказание кредитных рисков с помощью машинного обучения : магистерская диссертация / Prediction of credit risks using machine learningЧераева, О. Р., Cheraeva, O. R. January 2024 (has links)
This diploma work consists of three chapters and is devoted to the prediction of credit risks using machine learning methods, in particular, to finding the most effective model for predicting credit risk. An analysis of scientific literature was conducted in order to identify the most popular models in this area, as well as data sets that can be used for their subsequent training. The found sets containing data on credit risk were analyzed, transformed, normalized and sent to train several models: logistic regression, decision tree, random forest, support vector machine, k-nearest neighbors, XGBoost and CatBoost. When training the models mentioned above, the imbalance between credit risk classes was taken into account - methods for combating unbalanced classes were considered. The results obtained during the work were presented in the form of tables with metric values. The work of some of the considered machine learning models was interpreted using the SHAP library. In conclusion of this study, a conclusion was made about which of the considered models showed the highest results in determining credit risk. / Данная дипломная работа состоит из трех глав и посвящена предсказанию кредитных рисков с помощью методов машинного обучения, в частности, поиску наиболее эффективной для предсказания кредитного риска модели. Был проведен анализ научной литературы в целях выявления наиболее популярных в данной сфере моделей, а также наборов данных, которые могут быть использованы для их последующего обучения.Найденные наборы, содержащие в себе данные о кредитном риске, были проанализированы, преобразованы, нормализованы и отправлены на обучение нескольких моделей: логистическая регрессия, дерево решений, случайный лес, метод опорных векторов, метод k-ближайших соседей, XGBoost и CatBoost. При обучении упомянутых ранее моделей учитывался дисбаланс между классами кредитного риска – рассмотрены методы борьбы с несбалансированными классами. Полученные в ходе работы результаты представили в виде таблиц со значениями метрик. Работу некоторых рассмотренных моделей машинного обучения удалось интерпретировать с помощью библиотеки SHAP. В заключении данного исследования был сделан вывод о том, какие из рассматриваемых моделей показали наивысшие результаты при определении кредитного риска.
|
Page generated in 0.0445 seconds