語音文件中關鍵用語之自動擷取及其關係圖之自動生成

Yu Huang; 黃宥

Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/47903

Title:	語音文件中關鍵用語之自動擷取及其關係圖之自動生成 Automatic Key Term Extraction and Key Term Graph Generation from Spoken Documents
Authors:	Yu Huang 黃宥
Advisor:	李琳山
Keyword:	關鍵用語,關鍵詞,關鍵片語,語音文件,關鍵用語關係圖,機率式潛藏語意分析,機器學習,支撐向量機, Key Term,Keyword,Key Phrase,Spoken Documents,Key Term Graph,Probabilistic Latent Semantic Analysis,PLSA,Machine Learning,Support Vector Machine,SVM,
Publication Year :	2011
Degree:	碩士
Abstract:	本論文研究語音文件中關鍵用語之自動擷取及其關係圖之自動生成。本論文將關鍵用語分成關鍵片語(Key Phrase) 和關鍵詞(Keyword)，並用不同方法來擷取。在擷取關鍵片語部分，我們提出了分岐亂度(Branching Entropy)。在擷取關鍵詞的部分，我們提出了二階段擷取(Two-Stage Extraction) 的方法，其中第一階段(First-Stage) 利用相對連貫性計算(Relative Coherence Measure; RCM) 取得關鍵詞的初始排序(Initial Ranking)，並以網路知識為輔助；第二階段(Second-Stage)則利用第一階段得出的初始排序，從語音文件中抽取候選關鍵詞的詞彙特徵(Lexical Feature)、韻律特徵(Prosodic Feature) 以及語意特徵(Semantic Feature)，再透過機器學習方法訓練分類器，得到關鍵詞的重排序(Re-Ranking)。有了關鍵用語，我們進一步利用機器學習方法訓練分類器(Classifier) 來自動判別兩兩關鍵用語之間的關係以生成關係圖，包括抽取詞彙特徵、語意特徵以及網路知識特徵(Feature from Web Knowledge) 以描述關鍵用語之間的關係，發現這些特徵是可加成的，並提出一個評比關係圖的方法。
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/47903
Fulltext Rights:	有償授權
Appears in Collections:	資訊工程學系

Files in This Item:

File	Size	Format
ntu-100-1.pdf Restricted Access	4.69 MB	Adobe PDF

Show full item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets