Целью данной магистерской диссертации является разработка и оценка модели глубокого обучения для автоматизированного повествования на основе последовательностей изображений. В работе рассматриваются современные методы компьютерного зрения и алгоритмы машинного обучения, которые позволяют генерировать текстовые описания на основе визуальных данных. Проведен анализ существующих подходов, разработана и настроена модель для генерации текстов, реализована и протестирована ее работа на реальных данных. Полученные результаты сравниваются с существующими решениями, что позволяет сделать выводы о преимуществе предложенной модели. / The aim of this master's thesis is to develop and evaluate deep learning model for automated storytelling based on image sequences. The thesis explores modern computer vision methods and machine learning algorithms that enable the generation of textual descriptions from visual data. An analysis of existing approaches was conducted, a model for text generation was developed and configured, and its performance was implemented and tested on real data. The obtained results are compared with existing solutions, allowing conclusions to be drawn about the advantages of the proposed model.
Identifer | oai:union.ndltd.org:urfu.ru/oai:elar.urfu.ru:10995/140508 |
Date | January 2024 |
Creators | Антропова, Н. Г., Antropova, N. G. |
Contributors | Сысков, А. М., Syskov, A. M., УрФУ. Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления |
Publisher | б. и. |
Source Sets | Ural Federal University |
Language | Russian |
Detected Language | Russian |
Type | Master's thesis, info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Rights | Предоставлено автором на условиях простой неисключительной лицензии, http://elar.urfu.ru/handle/10995/31613 |
Page generated in 0.0021 seconds