Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67254
標題: 基於專注式類神經網路之依例查詢口述語彙偵測
Query-by-example Spoken Term Detection based on
Attention-based Neural Network
作者: Chia-Wei Ao
敖家維
指導教授: 李宏毅
關鍵字: 專注式模型,依例查詢,
Attention-based Model,Query-by-example,
出版年 : 2017
學位: 碩士
摘要: 本論文之主軸在探討語音數位內容之口述詞彙偵測。由於近年來網路蓬勃發
展,使得網路上包含語音資訊的多媒體如線上課程、電影、戲劇、會議錄音等日
漸增加,因此,語音數位內容之檢索也隨之受到重視。語音數位內容檢索的關鍵
部分為口述語彙偵測,找出語音文件中出現查詢詞的部分。本論文的查詢詞為語
音訊號,並非文字。傳統的方法都會藉由語音辨識系統先將查詢詞轉為文字,而
本論文則不經過語音辨識系統,使用機器學習中的類神經網路,在訓練語料中學
習聲音的特徵,如此便可直接在語音訊號上進行口述詞彙偵測,以避免語音辨識
系統錯誤率影響檢索系統的問題。
本論文採用了專注式機制,此機制能夠使模型關注在語音文件中某個區塊,
避免多餘的雜訊影響。回顧機制能夠使模型依照先前的輸入而關注在語音文件中
不同地方,進而模型能夠多次關注語音文件,且更精準的找到查詢詞。同時也嘗
試使用語音詞向量,將語音文件編碼成為一向量,其向量能夠有詞與詞之間的相
關性,藉由語音文件向量進行口述詞彙偵測。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67254
DOI: 10.6342/NTU201702646
全文授權: 有償授權
顯示於系所單位:電信工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-106-1.pdf
  未授權公開取用
8.02 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved