面對知識管理時代與學術論文不斷的激增下,快速擷取學術論文的研究主題領域是相當重要的項研究。本研究從文獻結構中分析,應用了特徵擷取、中文字詞分析、統計及演算等方法,對中文學術論文標題及其中文參考文獻標題進行分析,以擷取可描述該篇論文研究主題之專業詞彙。
對應論文的研究主題擷取,本研究建立了專業詞彙資料庫以及虛字符號字庫,應用在研究主題詞彙擷取時,論文標題的詞彙比對。專業詞彙資料庫,包括了各專業詞彙,以及詞彙間的研究主題關係,此外,也包含了詞彙間的同義詞關係。虛字符號字庫,則包含了需要在去除標題中各虛字符號時,所比對的字庫。
在最後的結果分析上,採用詞頻統計統計出論文及其參考文獻標題所出現的專業詞彙次數,並使用論文與參考文獻的對應分析產生六種可能的結果,說明應用此結果加上次數統計的方式,如何確切的擷取可描述該論文研究主題的詞彙。而在研究過程中,本研究以“中文文獻及字詞的資訊化處理”此研究主題的論文為例,建置雛型系統及詞庫來加以探討及印證。
Identifer | oai:union.ndltd.org:CHENGCHI/A2002002099 |
Creators | 謝武星, Chia, Wu-Sin |
Publisher | 國立政治大學 |
Source Sets | National Chengchi University Libraries |
Language | 中文 |
Detected Language | Unknown |
Type | text |
Rights | Copyright © nccu library on behalf of the copyright holders |
Page generated in 0.002 seconds