Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/70589
標題: 使用深度強化學習技術與可訓練模擬使用者之互動式語音數位內容檢索
Interactive Spoken Content Retrieval with Deep Reinforcement Learning and Trainable User Simulator
作者: Pei-Hung Chung
鍾佩宏
指導教授: 李宏毅
關鍵字: 深度強化學習,語音數位內容檢索,互動式資訊檢索,
Deep Reinforcement Learning,Spoken Content Retrieval,Interactive Information Retrieval,
出版年 : 2018
學位: 碩士
摘要: 本論文之主軸在探討語音數位內容之互動式檢索 (Interactive Retrieval of Spoken Content) 與針對互動式檢索系統中的模擬使用者做改進。由於數位語音內 容難以快速瀏覽,且語音辨識的錯誤造成高度的不確定性,所以使用者與系統 的互動對語音數位內容檢索系統 (Spoken Content Retrieval System) 有關鍵性的影 響。 在互動式檢索的系統中,系統會選擇不同的行動與使用者互動來得到更多資 訊,所以如何讓系統根據目前的狀態選擇最有效率的行動是極為重要的。在前人 的研究中,互動式檢索系統使用深度Q-類神經網路 (Deep-Q Network) 的演算法訓 練馬可夫決策模型 (Markov Decision Process, MDP) ,並使用基於經驗法則訂定規 則 (Rule-based) 的模擬使用者 (User Simulator)。 然而,建立一個可信賴且貼近真 實使用者行為的模擬使用者是很大的挑戰。本論文提出可與互動式檢索系統同步 訓練的模擬使用者,來增進互動式語音數位內容檢索系統的效能,取代基於規則 的模擬使用者。實驗顯示,可與檢索系統同步訓練的模擬使用者比起基於規則的 模擬使用者不但得到更大獎勵,在真人評估 (Human Evaluation) 的測驗中也更像 真實使用者。
User-machine interaction is crucial for information retrieval, especially for spoken con- tent retrieval, because spoken content is difficult to browse, and speech recognition has a high degree of uncertainty. In interactive retrieval, the machine takes different actions to interact with the user to obtain better retrieval results; here it is critical to select the most efficient action. In previous work, deep Q-learning techniques were proposed to train an interactive retrieval system but rely on a hand-crafted user simulator; building a reliable user simulator is difficult. In this thesis, we further improve the interactive spoken content retrieval framework by proposing a learnable user simulator which is jointly trained with interactive retrieval system, making the hand-crafted user simulator unnecessary. The ex- perimental results show that the learned simulated users not only achieve larger rewards than the hand-crafted ones but act more like real users.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/70589
DOI: 10.6342/NTU201802898
全文授權: 有償授權
顯示於系所單位:電信工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-107-1.pdf
  未授權公開取用
3.89 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved