Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 工程科學及海洋工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/52038
標題: 基於文本的漢字影像辨識研究
Language Context-based Enhancement for Chinese Optical Character Recognition
作者: Shih-Han Wang
王詩涵
指導教授: 黃乾綱
關鍵字: 漢字辨識,語言模型,光學字符辨識,
Chinese character recognition,Language model,Optical Character Recognition,
出版年 : 2015
學位: 碩士
摘要: 隨著時代演進,人們對於電子產品的使用已逐漸普及。傳達文字訊息的方式,由過去的書寫文字,進而進展成現在的數位文字。促使文本數位化的需求提升。為了使影像轉換為數位文字,市面上已有開發光學文字辨識系統,能將影像做自動轉換數位文字,但是這些系統主要是針對現代印刷字體。至於非印刷體文字,如手寫字、雕版印刷等,其辨識率並不佳。因此,本研究,為了改善現有光學文字辨識軟體正確率,增加使用者數位化文本的便利性以減少使用之人力成本。
本研究流程主要分為二步驟,第一步驟:將文本作結構的分析,切割出字符影像,避免切割不完全使得辨識時造成辨識錯誤。第二步驟分為兩個部分,第一部分是將切割出的字符,以方向梯度直方圖(HOG)來表示字符特徵。將字符依特徵向量作粗略分群,再以文本之語言模型,觀察其分群情況,增加其分群效果。最後根據分群的結果,作錯誤辨識的偵測,以及改正其錯誤文字;第二部分是將文本利用現有之文字辨識軟體,將影像轉為數位文字,透過外部文本的語言模型來偵測與改正錯誤文字。最後比較這兩部分之錯誤字偵測及修正情形。本研究方法與使用Plustek DI express 6.0辨識的結果作比較,在使用內部文本的部分,增加5%的辨識正確率,從65%增加至70%。而使用外部文本的部分,則是增加了9.8%的辨識正確率。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/52038
全文授權: 有償授權
顯示於系所單位:工程科學及海洋工程學系

文件中的檔案:
檔案 大小格式 
ntu-104-1.pdf
  目前未授權公開取用
2.1 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved