Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/87976
標題: 透過多樣化的權重修剪提升目標攻擊的可轉移性
Enhancing Targeted Attack Transferability via Diversified Weight Pruning
作者: 王竑睿
Hung-Jui Wang
指導教授: 陳尚澤
Shang-Tse Chen
關鍵字: 對抗式攻擊,神經網路修剪,電腦視覺與圖型識別,
Adversarial Attack,Network Pruning,Computer Vision and Pattern Recognition,
出版年 : 2023
學位: 碩士
摘要: 惡意攻擊者可以透過添加微小的擾動生成目標性對抗例,促使神經網路產生特定的錯誤輸出。在跨模型的遷移性下,即使無法直接存取神經網路模型的參數,模型一樣可能受到對抗例的攻擊。現今研究提出以集成式方法來生成對抗例以增加遷移性。為了更加提升遷移性,模型增強法會增加參與集成式方法的模型數量。然而,現存的模型增強法只在無目標性攻擊的設定上進行。在本作中,我們提出多樣化權重修剪,一個新穎的模型增強法,來產生目標性攻擊。相較於以往的研究,多樣化權重修剪會保護模型中必要的權重,並同時確保修剪後模型的多樣性。我們將在實驗中呈現此對目標性攻擊的重要性。我們在 ImageNet 兼容資料集上,提供了更具挑戰性的設定下的實驗結果:分別是遷移到經過對抗訓練的模型、非捲積神經網路模型以及 Google 雲端電腦視覺服務。結果顯示我們提出的多樣化權重修剪分別能在三個設定下,基於最新方法,提升目標性攻擊成功率10.1%, 6.6%, 以及 7.0%。我們將會在投稿接受後開放程式碼。
Malicious attackers can generate targeted adversarial examples by imposing tiny noises, forcing neural networks to produce specific incorrect outputs. With cross-model transferability, network models remain vulnerable even in black-box settings. Recent studies have shown the effectiveness of ensemble-based methods in generating transferable adversarial examples. To further enhance transferability, model augmentation methods aim to produce more networks participating in the ensemble. However, existing model augmentation methods are only proven effective in untargeted attacks. In this work, we propose Diversified Weight Pruning (DWP), a novel model augmentation technique for generating transferable targeted attacks. DWP leverages the weight pruning method commonly used in model compression. Compared with prior work, DWP protects necessary connections and ensures the diversity of the pruned models simultaneously, which we show are crucial for targeted transferability. Experiments on the ImageNet-compatible dataset under various and more challenging scenarios confirm the effectiveness: transfer to adversarially trained models, Non-CNN architectures, and Google Cloud Vision. The results show that our proposed DWP improves the targeted attack success rates with up to 10.1%, 6.6%, and 7.0% on the combination of state-of-the-art methods, respectively. The source code will be made available after acceptance.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/87976
DOI: 10.6342/NTU202301130
全文授權: 同意授權(全球公開)
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-111-2.pdf14.66 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved