請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/85622
標題: | 蕭表格: 標籤表格與光學文字識別 XiaoForm: Label Form and Optical Character Recognition |
作者: | 蕭延儒 Yan-Ru Xiao |
指導教授: | 傅楸善 Chiou-Shann Fuh |
關鍵字: | 光學文字辨識,蕭表格,表格偵測,影像接合,場景文字偵測,捲積類神經網路, Optical character recognition,XiaoForm,form detection,image stitching,scene text detection,convolutional neural network, |
出版年 : | 2022 |
學位: | 碩士 |
摘要: | 許多與光學文字識別OCR (Optical Character Recognition)相關的方法都在各個領域得到卓越的表現。但是當這些方法應用在表格文件上,像是行照、駕照等等的時候,準確度經常大幅下降。原因主要歸咎於表格的一些特性與雜訊。我們提出一個針對表格作文字偵測與辨識的方法。文字偵測的部分,我們設計了一個表格配對的演算法來預測圖片中的每一個表格。文字辨識的部分,我們改良現有的深度學習模型來達到更高的準確度。 Many approaches regarding OCR (Optical Character Recognition) have achieved promising performances across various benchmarks. However, for form documents such as vehicle registration license and driver license, they often fall short due to form characteristic structure and noises. We propose our method, XiaoForm, to deal with text detection and recognition specifically for text form. For text detection, we design a form-matching algorithm that predicts each form from standard template. For text recognition, we improve from the existing deep learning model, to achieve better performances. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/85622 |
DOI: | 10.6342/NTU202201187 |
全文授權: | 同意授權(全球公開) |
電子全文公開日期: | 2022-06-28 |
顯示於系所單位: | 資訊工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-110-2.pdf 此日期後於網路公開 2027-07-01 | 11.94 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。