Diplomová práce se zabývá problémem strojového učení nepozorovaných úrovní abstrakce mělké sémantické reprezentace. Odstraňujeme předpoklady, které se při sémantické anotaci lingvistických zdrojů obvykle činí, např. pevný počet sémantických rolí v PropBanku, a učíme se klíčové lingvistické prvky této ano- tace (sémantické rámce, slovesa, lexikální a syntaktické třídy) s různou mírou ab- strakce. Model implementujeme pomocí latentních gramatik a získané struktury je možné použít pro úlohu značkování sémantických rolí (semantic role labeling, SRL) v několika jazycích s přesností srovnatelnou s jinými současnými přístupy. Navíc ukazujeme, že tyto struktury jsou velmi blízké abstrakcím, které je možné pozorovat ve FrameNetu. Celkovým výsledkem je tak jazykově-nezávislý model sémantické informace bez rysů, který produkuje interpretovatelné struktury a jeho použitelnost je na úloze SRL empiricky ověřena.
Identifer | oai:union.ndltd.org:nusl.cz/oai:invenio.nusl.cz:328566 |
Date | January 2013 |
Creators | Ercegovcevic, Milos |
Contributors | Bojar, Ondřej, Mareček, David |
Source Sets | Czech ETDs |
Language | English |
Detected Language | Unknown |
Type | info:eu-repo/semantics/masterThesis |
Rights | info:eu-repo/semantics/restrictedAccess |
Page generated in 0.002 seconds