於未見噪音環境下以非監督式域調適於語音增強之研究

Chien-Feng Liao; 廖峴鋒

請用此 Handle URI 來引用此文件： http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/74084

標題:	於未見噪音環境下以非監督式域調適於語音增強之研究 A Study of Unsupervised Domain Adaptation in Speech Enhancement under Unseen Noise Environments
作者:	Chien-Feng Liao 廖峴鋒
指導教授:	曹昱
共同指導教授:	李宏毅
關鍵字:	深度學習,語音增強,非監督式域調適, deep learning,speech ehancement,unsupervised domain adaptation,
出版年 :	2019
學位:	碩士
摘要:	本論文中，我們提出了一種新穎的噪音調適語音增強系統，該系統採用域對抗訓練來解決訓練集和測試集之間噪音環境不匹配的問題。這種不匹配是基於深度學習的語音增強系統中的關鍵問題，當測試環境的噪音是訓練時``未見'的種類時，可能導致語音增強系統的去噪能力嚴重降低。而真實世界中存在無數種的聲學環境，因此這個不匹配的問題非常容易發生，我們試圖利用非監督式域調適的方法來解決此問題。本論文的系統包含了基於類神經網路的語音增強模型和一個域鑑別器，在訓練期間，鑑別器藉由對抗訓練的方式鼓勵語音增強模型產生噪音不變的特徵，藉此強化系統對未見噪音環境的穩健性。我們使用了TIMIT語料庫來評估所提出的系統，實驗結果顯示相較於基準模型，經過噪音調適的語音增強模型在三個常用的語音評估指標：PESQ、SSNR、STOI上都獲得了顯著進步。更進一步地，我們提出了改進版本的域對抗訓練，將域對抗訓練從原本的特徵空間移至輸出空間進行，使模型能夠更好地保留頻譜結構。實驗結果證實，此改進方法在語音品質和降噪能力上相較原始的域對抗訓練又能夠得到更多的提升。
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/74084
DOI:	10.6342/NTU201901634
全文授權:	有償授權
顯示於系所單位：	資料科學學位學程

文件中的檔案：

檔案	大小	格式
ntu-108-1.pdf 目前未授權公開取用	7.52 MB	Adobe PDF

顯示文件完整紀錄

系統中的文件，除了特別指名其著作權條款之外，均受到著作權保護，並且保留所有的權利。

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料（如：文字、圖片、PDF）並使其易於取用。