Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊網路與多媒體研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98347
標題: 潛在擴散模型中的內嵌式浮水印方法:使用者歸因與篡改定位應用
In-generation Watermarking for User Attribution and Tamper Localization in Latent Diffusion Models
作者: 葉修瑜
Xiu-Yu Ye
指導教授: 吳家麟
Ja-Ling Wu
關鍵字: 潛在擴散模型,內嵌式浮水印,使用者歸因,竄改定位,變分自編碼器,
Latent diffusion model,In-generation watermarking,User attribution,Tamper localization,Variational AutoEncoder,
出版年 : 2025
學位: 碩士
摘要: 隨著近年生成式人工智慧的快速發展,利用公開應用程式介面快速產生高品質圖像已成為常態。然而,這樣的便利也伴隨個資洩漏與圖像遭竄改等安全風險。雖然傳統的圖像浮水印技術能達到使用者身分識別與篡改區域標記,但這類「後處理式」方法需在每張圖像生成後再額外嵌入資訊,不僅操作繁瑣,效率也非常低落,不利於大規模應用。
為解決上述問題,本文提出一種全新的「生成中嵌入式」方法,直接在圖像產生過程中,將使用者身分與篡改標記模板一併嵌入,無需額外後處理,大幅提升整體效率。我們的做法是針對變分自動編碼器中的解碼器進行微調,使其生成圖像時自動帶有不可見的識別與定位資訊。同時,我們引入模擬失真層,透過裁切、縮放、壓縮、亮度調整等常見圖像變化來模擬真實環境中可能出現的破壞行為,提升整體的穩定性與耐用性。
實驗結果顯示,本方法能在維持生成圖像視覺品質的前提下,能準確還原使用者身分並精確標示被竄改區域,同時展現出更高的嵌入效率與執行效能,證實其在實務應用上的潛力與價值。
With the rapid advancement of generative artificial intelligence, generating high-quality images through public APIs has become increasingly common. However, this convenience also brings serious security concerns like personal privacy leakage and unauthorized image manipulation. Although traditional post-generation watermarking methods can achieve user attribution and tamper localization, they require additional data embedding for each generated image, resulting in low efficiency and limited scalability in large-scale applications. To address this issue, this work presents a novel in-generation watermarking framework that embeds invisible user-specific identification and localization templates directly during the image generation stage. Specifically, we fine-tune the decoder of a Variational Autoencoder within a Latent Diffusion Model, enabling the generated images to carry the embedded invisible information without requiring any post-processing. This design significantly improves the integration capability and operational efficiency of watermarking. To enhance the system's robustness, we introduce a noise simulation layer during training, which emulates common image manipulations such as cropping, resizing, JPEG compression, and brightness adjustment. This extra layer enables the model to remain effective under divergent real-world scenarios. Experimental results demonstrate that our method maintains high perceptual quality of the generated images while achieving accurate and robust user attribution and tamper localization simultaneously. Moreover, our in-generation strategy outperforms existing benchmarked works simultaneously in terms of performance and efficiency.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98347
DOI: 10.6342/NTU202502749
全文授權: 同意授權(限校園內公開)
電子全文公開日期: 2025-08-05
顯示於系所單位:資訊網路與多媒體研究所

文件中的檔案:
檔案 大小格式 
ntu-113-2.pdf
授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務)
6.6 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved