Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊網路與多媒體研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/20909
標題: 基於深度學習方法在複雜光影環境下獲得掃描品質之文件影像
A Learning-Based Approach for Scanner-Quality Document Images under Complex Illumination
作者: Chih-Jou Hsu
許芝柔
指導教授: 李明穗(Ming-Sui Lee)
共同指導教授: 莊永裕(Yung-Yu Chuang)
關鍵字: 文件品質增強,陰影去除,深度學習,
Document enhancement,shadow removal,deep learning,
出版年 : 2020
學位: 碩士
摘要: 現代人大多數使用手機拍攝文件影像,然而以此方式拍攝的文件影像通常會被光線影響,在文件表面產生陰影和明暗變化。這些影像可能讓閱讀者無法獲得文件的資訊,也會降低文件影像的美觀性。過去雖然有許多演算法作用在去除陰影上,這些方法其陰影去除的效果仍有所侷限,且並無前人得到具有掃描品質的文件影像。在這篇論文中,我們提出了一個使用深度學習之演算法,掃描網路,可將拍攝所得之被陰影及明暗變化影響的單張文件影像轉變成掃描品質的文件。我們的方法利用了陰影與明暗變化的不同特性設計了兩個網路,第一個網路移除陰影,第二個網路則負責校正明暗變化。我們也設計了一個產生模擬資料的方式,此方式可以快速且有效率的產生大量且多變的數據集,以訓練我們的模型。此方法所產生的資料變化量,可以訓練更為泛用的模型,以解決前人在陰影去除效果上的限制。我們的方法在陰影去除的效果、掃描文件影像品質、文件文字辨識上都達到相較於前人較好的成果。
Document images captured by smartphones and digital cameras are often vulnerable to photometric distortions, including shadows, non-uniform shading, and color shift due to the imperfect white balance of sensors. These distortions can confuse readers with indistinguishable content and background, significantly reducing the visual quality and legibility. Although real photos often contain a mixture of such distortions, most existing approaches for document illumination correction focus on a small subset of them. In this paper, we present ScannerNet, a comprehensive method that can eliminate complex photometric distortions. For exploiting the different characteristics of shadow and shading, our model consists of a shadow removal sub-network followed by a shading correction sub-network. In order to model the various illumination types in the real world, we also carefully design a data synthesis method to efficiently construct a large-scale document dataset with great variations to train our model. Extensive quantitative and qualitative experiments show that our method significantly enhances image quality by removing shadows and shading, preserving figure colors, and improving readability.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/20909
DOI: 10.6342/NTU202004029
全文授權: 未授權
顯示於系所單位:資訊網路與多媒體研究所

文件中的檔案:
檔案 大小格式 
U0001-1808202020412200.pdf
  未授權公開取用
62.78 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved