Global ETD Search

Return to search

Speaker Recognition Based on Long Temporal Context / Speaker Recognition Based on Long Temporal Context

Tato práce se zabývá extrakcí vhodných příznaků pro rozpoznávání řečníka z delších časových úseků. Po představení současných technik pro extrakci takových příznaků navrhujeme a popisujeme novou metodu pracující v časovém rozsahu fonémů a využívající známou techniku i-vektorů. Velké úsilí bylo vynaloženo na nalezení vhodné reprezentace temporálních příznaků, díky kterým by mohly být systémy pro rozpoznávání řečníka robustnější, zejména modelování prosodie. Náš přístup nemodeluje explicitně žádné specifické temporální parametry řeči, namísto toho používá kookurenci řečových rámců jako zdroj temporálních příznaků. Tuto techniku testujeme a analyzujeme na řečové databázi NIST SRE 2008. Z výsledků bohužel vyplývá, že pro rozpoznávání řečníka tato technika nepřináší očekávané zlepšení. Tento fakt diskutujeme a analyzujeme ke konci práce.

http://www.nusl.cz/ntk/nusl-236121

Identifer	oai:union.ndltd.org:nusl.cz/oai:invenio.nusl.cz:236121
Date	January 2014
Creators	Fér, Radek
Contributors	Matějka, Pavel, Černocký, Jan
Publisher	Vysoké učení technické v Brně. Fakulta informačních technologií
Source Sets	Czech ETDs
Language	English
Detected Language	Unknown
Type	info:eu-repo/semantics/masterThesis
Rights	info:eu-repo/semantics/restrictedAccess

Page generated in 0.0019 seconds

Speaker Recognition Based on Long Temporal Context / Speaker Recognition Based on Long Temporal Context

Description

Links & Downloads

Tags

Additional Fields