Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電機工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/91012
標題: 針對語音辨識系統之決策型對抗式攻擊:查詢效率與不可感知性改善
Improving Query Efficiency and Imperceptibility of Decision-based Adversarial Attack Against ASR Systems
作者: 曾昶凱
Chang-Kai Tseng
指導教授: 謝宏昀
Hung-Yun Hsieh
關鍵字: 對抗式攻擊,自動語音辨識,
Adversarial Attack,Decision-based Black-box Adversarial Attack,Automatic Speech Recognition,
出版年 : 2023
學位: 碩士
摘要: 近年來,針對自動語音辨識系統的對抗式攻擊(adversarial attack)研究變得至關重要。此類的攻擊通常透過生成精心設計的擾動使得能將隱藏的指令注入到背景聲音信號中。預處理技術顯著影響對抗式攻擊的性能。在對自動語音辨識系統的攻擊當中,基於決策的黑箱(decision-based black-box)攻擊尤其值得注意,因為只需要模型的輸出,使其成為最實際的攻擊情境。在基於決策的攻擊中,攻擊者會重複查詢目標模型,以最小化最佳函數。在這種攻擊框架中,攻擊者所能獲取的有信資訊使查詢效率(query efficiency)成為了一項挑戰,使得擾動之不可感知性的改善更加困難。因此我們提出了qScore,一種基於人類感知的指標,作為目標函數,以增強查詢效率和不可感知性。此外,我們基於引入了基於心理聲學研究的在時間尺度去調整信號的預處理方法,提高攻擊的不可感知性。為了進行實驗,我們從免費資源網站上收集了聲音信號檔案,並使用語音合成生成了指令信號。最終的性能評估分為兩個部分:首先,我們比較了不同目標函數的查詢效率。其次,我們邀請了志願受試者對實驗結果進行評估。實驗結果顯示,qScore平均能在查詢次數減少40.01%的情況下,達到與2-範數可比的信號雜訊比。經過我們提出的時間尺度上調整信號的預處理方法後,我們觀察到平均意見分數(Mean opinion score)有著 2.50 至3.45之顯著提高。實驗結果顯示,我們提出的方法同時改善了對抗式攻擊的查詢效率和不可感知性。
In recent years, research on adversarial attacks against Automatic Speech Recognition (ASR) systems has become critical. Adversarial attacks against ASR systems typically involve the careful generation of audio perturbations which aim to inject hidden commands into background sound signals. Preprocessing techniques significantly impact adversarial attack performance. Among the studies on attacks against ASR systems, decision-based attacks are particularly noteworthy as they only require the output of the model, making them the most practical attack scenario. In decision-based attacks, attackers repeatedly query the target model to minimize the objective function. In such attack framework, the limited information available to attackers poses challenges in query efficiency, making the achievement of imperceptibility in perturbations more difficult. Hence, we propose qScore, a human perception metric, as the objective function to enhance query efficiency and imperceptibility.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/91012
DOI: 10.6342/NTU202303967
全文授權: 同意授權(限校園內公開)
電子全文公開日期: 2024-09-01
顯示於系所單位:電機工程學系

文件中的檔案:
檔案 大小格式 
ntu-111-2.pdf
授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務)
11.99 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved