Global ETD Search

Return to search

Popis fotografií pomocí rekurentních neuronových sítí / Image Captioning with Recurrent Neural Networks

Tato práce se zabývá automatickým generovaním popisů obrázků s využitím několika druhů neuronových sítí. Práce je založena na článcích z MS COCO Captioning Challenge 2015 a znakových jazykových modelech, popularizovaných A. Karpathym. Navržený model je kombinací konvoluční a rekurentní neuronové sítě s architekturou kodér--dekodér. Vektor reprezentující zakódovaný obrázek je předáván jazykovému modelu jako hodnoty paměti LSTM vrstev v síti. Práce zkoumá, na jaké úrovni je model s takto jednoduchou architekturou schopen popisovat obrázky a jak si stojí v porovnání s ostatními současnými modely. Jedním ze závěrů práce je, že navržená architektura není dostatečná pro jakýkoli popis obrázků.

http://www.nusl.cz/ntk/nusl-255324

Identifer	oai:union.ndltd.org:nusl.cz/oai:invenio.nusl.cz:255324
Date	January 2016
Creators	Kvita, Jakub
Contributors	Španěl, Michal, Hradiš, Michal
Publisher	Vysoké učení technické v Brně. Fakulta informačních technologií
Source Sets	Czech ETDs
Language	English
Detected Language	Unknown
Type	info:eu-repo/semantics/masterThesis
Rights	info:eu-repo/semantics/restrictedAccess

Page generated in 0.0019 seconds

Popis fotografií pomocí rekurentních neuronových sítí / Image Captioning with Recurrent Neural Networks

Description

Links & Downloads

Tags

Additional Fields