Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/15788
標題: 基於深度學習的端到端語者驗證系統之損失函數的研究
A Study on Loss Functions in End-to-end DNN-based Speaker Verification
作者: Chih-hao Wang
王智顥
指導教授: 張智星(Jyh-Shing Jang)
關鍵字: 語者辨識,聲紋辨識,語者驗證,度量學習,
speaker recognition,speaker verification,metric learning,
出版年 : 2020
學位: 碩士
摘要: 深度學習搭配度量學習(metric learning )在辨別臉部特徵之應用,已經被證實有良好的效果,其中利用角度間隔( angular margin )限制的 Additive Angular Margin Softmax Loss 在計算機視覺的成功,也帶領了語者驗證領域的進步。本論文將使用以角度間隔為基礎的 Angular Triplet Loss 以及 Angulart Triplet Center Loss 所訓練之端到端語者驗證模型,以 Equal Error Rate 和 NIST SRE 所訂定的 Cprimary 作為衡量標準,將其應用在公開的中文語音資料集 aishell1 來衡量模型的表現。最終本次研究的最佳模型相較於 Additive Angular Margin Softmax Loss 模型在平均 Equal Error Rate 獲得了 7.4% 的相對進步,以及在平均 Cprimary 獲得了 6.1% 的相對進步。
Deep metric learning has proven itself an effective way to discriminate clustering embedding for face recognition. The success of the modified softmax Loss function, additive angular margin softmax loss, in computer vision leads the improvement of training speaker recognition. We introduce angular triplet loss and angular triplet center loss into end-to-end speaker verification. Experiments are conducted on Aishell1 dataset and demonstrate the performance with equal error rate and Cprimary. By testing the combination of different loss function with angular triplet loss and angular triplet center loss, our best model show a relative improvement of 7.4% on average Equal Error Rate and 6.1% on average Cprimary over the additive angular margin softmax loss.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/15788
DOI: 10.6342/NTU202002234
全文授權: 未授權
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
U0001-0208202022505600.pdf
  未授權公開取用
11.02 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved