語音文件中關鍵用語之自動擷取及其關係圖之自動生成

Yu Huang; 黃宥

請用此 Handle URI 來引用此文件： http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/47903

標題:	語音文件中關鍵用語之自動擷取及其關係圖之自動生成 Automatic Key Term Extraction and Key Term Graph Generation from Spoken Documents
作者:	Yu Huang 黃宥
指導教授:	李琳山
關鍵字:	關鍵用語,關鍵詞,關鍵片語,語音文件,關鍵用語關係圖,機率式潛藏語意分析,機器學習,支撐向量機, Key Term,Keyword,Key Phrase,Spoken Documents,Key Term Graph,Probabilistic Latent Semantic Analysis,PLSA,Machine Learning,Support Vector Machine,SVM,
出版年 :	2011
學位:	碩士
摘要:	本論文研究語音文件中關鍵用語之自動擷取及其關係圖之自動生成。本論文將關鍵用語分成關鍵片語(Key Phrase) 和關鍵詞(Keyword)，並用不同方法來擷取。在擷取關鍵片語部分，我們提出了分岐亂度(Branching Entropy)。在擷取關鍵詞的部分，我們提出了二階段擷取(Two-Stage Extraction) 的方法，其中第一階段(First-Stage) 利用相對連貫性計算(Relative Coherence Measure; RCM) 取得關鍵詞的初始排序(Initial Ranking)，並以網路知識為輔助；第二階段(Second-Stage)則利用第一階段得出的初始排序，從語音文件中抽取候選關鍵詞的詞彙特徵(Lexical Feature)、韻律特徵(Prosodic Feature) 以及語意特徵(Semantic Feature)，再透過機器學習方法訓練分類器，得到關鍵詞的重排序(Re-Ranking)。有了關鍵用語，我們進一步利用機器學習方法訓練分類器(Classifier) 來自動判別兩兩關鍵用語之間的關係以生成關係圖，包括抽取詞彙特徵、語意特徵以及網路知識特徵(Feature from Web Knowledge) 以描述關鍵用語之間的關係，發現這些特徵是可加成的，並提出一個評比關係圖的方法。
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/47903
全文授權:	有償授權
顯示於系所單位：	資訊工程學系

文件中的檔案：

檔案	大小	格式
ntu-100-1.pdf 未授權公開取用	4.69 MB	Adobe PDF

顯示文件完整紀錄

系統中的文件，除了特別指名其著作權條款之外，均受到著作權保護，並且保留所有的權利。

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料（如：文字、圖片、PDF）並使其易於取用。