Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/47903
標題: 語音文件中關鍵用語之自動擷取及其關係圖之自動生成
Automatic Key Term Extraction and Key Term Graph Generation from Spoken Documents
作者: Yu Huang
黃宥
指導教授: 李琳山
關鍵字: 關鍵用語,關鍵詞,關鍵片語,語音文件,關鍵用語關係圖,機率式潛藏語意分析,機器學習,支撐向量機,
Key Term,Keyword,Key Phrase,Spoken Documents,Key Term Graph,Probabilistic Latent Semantic Analysis,PLSA,Machine Learning,Support Vector Machine,SVM,
出版年 : 2011
學位: 碩士
摘要: 本論文研究語音文件中關鍵用語之自動擷取及其關係圖之自動生成。本論文將關鍵用語分成關鍵片語(Key Phrase) 和關鍵詞(Keyword),並用不同方法來擷取。在擷取關鍵片語部分,我們提出了分岐亂度(Branching Entropy)。在擷取關鍵詞的部分,我們提出了二階段擷取(Two-Stage Extraction) 的方法,其中第一階段(First-Stage) 利用相對連貫性計算(Relative Coherence Measure; RCM) 取得關鍵詞的初始排序(Initial Ranking),並以網路知識為輔助;第二階段(Second-Stage)則利用第一階段得出的初始排序,從語音文件中抽取候選關鍵詞的詞彙特徵(Lexical Feature)、韻律特徵(Prosodic Feature) 以及語意特徵(Semantic Feature),再透過機器學習方法訓練分類器,得到關鍵詞的重排序(Re-Ranking)。
有了關鍵用語,我們進一步利用機器學習方法訓練分類器(Classifier) 來自動
判別兩兩關鍵用語之間的關係以生成關係圖,包括抽取詞彙特徵、語意特徵以及網路知識特徵(Feature from Web Knowledge) 以描述關鍵用語之間的關係, 發現這些特徵是可加成的, 並提出一個評比關係圖的方法。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/47903
全文授權: 有償授權
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-100-1.pdf
  未授權公開取用
4.69 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved