Global ETD Search

Return to search

Extrakce informací z textu

Cieľom tejto práce je preskúmať dostupné systémy pre extrakciu informácií a možnosti ich použitia v projekte MedIEQ. Teoretickú časť obsahuje úvod do oblasti extrakcie informácií. Popisujem účel, potreby a použitie a vzťah k iným úlohám spracovania prirodzeného jazyka. Prechádzam históriou, nedávnym vývojom, meraním výkonnosti a jeho kritikou. Taktiež popisujem všeobecnú architektúru IE systému a základné úlohy, ktoré má riešiť, s dôrazom na extrakciu entít. V praktickej časti sa nacházda prehľad algoritmov používaných v systémoch pre extrakciu informácií. Opisujem oba typy algoritmov ? pravidlové aj štatistické. V ďalšej kapitole je zoznam a krátky popis existujúcich voľných systémov. Nakoniec robím vlastný experiment s dvomi systémami ? LingPipe a GATE na vybraných korpusoch. Meriam rôzne výkonnostné štatistiky. Taktiež som vytvoril malý slovník a regulárny výraz pre email aby som demonštroval taktiež pravidlá pre extrahovanie určitých špecifických informácií.

http://www.nusl.cz/ntk/nusl-2840

Identifer	oai:union.ndltd.org:nusl.cz/oai:invenio.nusl.cz:2840
Date	January 2008
Creators	Michalko, Boris
Contributors	Labský, Martin, Svátek, Vojtěch, Nováček, Jan
Publisher	Vysoká škola ekonomická v Praze
Source Sets	Czech ETDs
Language	Slovak
Detected Language	Unknown
Type	info:eu-repo/semantics/masterThesis
Rights	info:eu-repo/semantics/restrictedAccess

Page generated in 0.0018 seconds

Extrakce informací z textu

Description

Links & Downloads

Tags

Additional Fields