請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/47720完整後設資料紀錄
| DC 欄位 | 值 | 語言 |
|---|---|---|
| dc.contributor.advisor | 項潔 | |
| dc.contributor.author | Wei-Han Lin | en |
| dc.contributor.author | 林韋翰 | zh_TW |
| dc.date.accessioned | 2021-06-15T06:14:37Z | - |
| dc.date.available | 2010-08-16 | |
| dc.date.copyright | 2010-08-16 | |
| dc.date.issued | 2010 | |
| dc.date.submitted | 2010-08-11 | |
| dc.identifier.citation | [1] 林玉茹,「歷史學與區域研究:以東臺灣地區的研究為例」,東台灣研究,7期,台東市:東台灣研究會,2002年,頁103-134。
[2] 葉乃靜,「《臺灣地名辭書》選介」,全國新書資訊月刊,31期,台北市:國家圖書館,2001年,頁47-48。 [3] 臺灣大學數位典藏研究發展中心、臺灣大學數位典藏與自動推論實驗室,「台灣歷史數位圖書館」,http://thdl.ntu.edu.tw/,檢索日期2010年6月24日。 [4] 臺灣大學數位典藏研究發展中心,http://www.digital.ntu.edu.tw/,檢索日期2010年6月23日。 [5] 臺灣大學數位典藏與自動推論實驗室,http://turing.csie.ntu.edu.tw/,檢索日期2010年6月23日。 [6] 項潔、陳詩沛、杜協昌,「台灣古契約文書全文資料庫的建置」,第三屆台灣古文書與歷史研究學術研討會論文集,臺中:逢甲大學出版社,2009年,頁243-269。 [7] 黃于鳴,「臺灣古地契關係自動重建之研究」,臺灣大學資訊工程學研究所碩士論文,2009年。 [8] 張尚斌,「詞夾子演算法在專有名詞辨識上的應用 -以歷史文件為例」,臺灣大學資訊工程學研究所碩士論文,2007年。 [9] 行政院文化建設委員會,「國家文化資料庫」網站,http://nrch.cca.gov.tw/,檢索日期2010年6月23日。 [10] 國立臺中圖書館,「臺灣地區古文書資訊網」網站,http://das.ntl.gov.tw/,檢索日期2010年6月23日。。 [11] 臺灣大學圖書館,「臺灣大學數位典藏資源中心」網站,http://www.darc.ntu.edu.tw/,檢索日期2010年6月23日。 [12] 臺中縣立文化中心,「古文書藏品展示」網站,http://www.tchcc.gov.tw/histbook/,檢索日期2010年6月23日。 [13] 臺中縣立文化中心,「台灣中部平埔族群古文書數位典藏」網站,http://www.tchcc.gov.tw/pingpu/,檢索日期2010年6月23日。 [14] 蔡淑玲,「台灣閩南語地名之語言研究-兼論其文化意涵與演變」,國立新竹師範學院台灣語言與語文教育研究所碩士論文,2004年。 [15] 鄭偉良,「台灣語言與教育研究網站」網站,http://taigu.eic.nctu.edu.tw/language_db/multi/index.asp,檢索日期2009年8月25日。 [16] 李鍌,「國語注音符號手冊序」,國語文教育叢書42,教育部,2000年。 [17] 朱邦復,第五代倉頡輸入法手冊序,深圳科技園區,1990年。 [18] 「Delphi K.Top討論區」網站,http://delphi.ktop.com.tw/,檢索日期2010年6月24日。 [19] 行政院主計處電子處理資料中心,「CNS11643中文標準交換碼全字庫」網站,http://www.cns11643.gov.tw/,檢索日期2010年6月24日。 [20] 中華民國內政部,「臺灣地區地名查詢系統」網站,http://placesearch.moi.gov.tw/search/place_list.php?id=53797,檢索日期2010年6月24日。 [21]國立臺南生活美學館,「南部地區生活美學資源服務網」網站,http://www.tncsec.gov.tw/b_native/b01_content.php?area=cy&c05=23&c03=10&num=23&a=0101,檢索日期2010年6月24日。 | |
| dc.identifier.uri | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/47720 | - |
| dc.description.abstract | 古契書對於研究台灣土地開發及社會經濟活動的歷史脈絡為相當珍貴的資料,契書中所記載的土地資訊卻常因在不同時間或是出自於不同人之手,而發現相同的土地卻有不同寫法的名稱,如此不僅會對系統檢索造成影響,在其他的相關研究中也會產生諸多不便。「台灣歷史數位圖書館」(THDL)蒐集了大量清代及日治時期的古契書,其中記錄的土地範圍遍佈全台,且經過時空變遷後,若想逐篇進行田野調查實為不易。
因此本研究利用中文字音與字形的相似特性,尋找指稱相同地點卻不同寫法的地名。一開始先從契書的全文資料中擷取地名在全文中出現的相對位置,來組織地名之間的階層關係。接著針對中文字的特性,分別依照字音和字形的相似特徵設計模糊比對,再以先前得到的地名階層資訊,對所有具相同上層的地名兩兩進行比對,最後經人工檢查,發現指稱相同地點卻有不同寫法的地名總共有844對。其中結果有包含常見的共通字、有因為音譯的不同產生的不同寫法、也有契書抄寫時的筆誤、還有數位化時的各種因素產生的差異。 本研究得到的結果,可以幫助研究古契書的研究者在THDL中更有效率的收集一範圍內的相關古契書,好讓研究者可以花更多的心力在其研究上。而本研究所使用的方法對於其他使用中文比對的資訊研究亦有助益,例如在古契書中尋找上下手契所需要的地名特徵,也可以使用本研究的相似地名比對方法。 | zh_TW |
| dc.description.provenance | Made available in DSpace on 2021-06-15T06:14:37Z (GMT). No. of bitstreams: 1 ntu-99-R97922135-1.pdf: 684884 bytes, checksum: 7bb2ee9c5217abc0a9d4fdff26fe7863 (MD5) Previous issue date: 2010 | en |
| dc.description.tableofcontents | 誌謝 I
摘要 II ABSTRACT III 第一章 序論 1 1.1研究動機 1 1.2研究目的 1 1.3論文架構 2 第二章 台灣歷史數位圖書館與古契書資料介紹 3 2.1台灣歷史數位圖書館介紹 3 2.2古契書資料介紹 3 2.1.1 國立臺中圖書館 6 2.1.2 臺大圖書館 7 2.1.3 臺灣大學人類學系 7 2.1.4台中縣立文化中心 7 第三章 研究方法 8 3.1 組織地名階層關係 8 3.1.1 地名層級代號定義與分類 8 3.1.2 全文擷取地名階層關係 9 3.1.3 已知的地名階層關係補充 13 3.1.4地名階層關係總結 13 3.2 地名相似字音比對方法 15 3.2.1 台語字典檔處理與比對 15 3.2.2 注音字典檔處理與比對 16 3.2.3 字音模糊比對 17 3.3 地名相似字形比對方法 22 3.3.1倉頡字典檔處理與比對 22 3.3.2字形模糊比對 24 3.4地名的同地異字關係總結 27 第四章 實驗結果與討論 30 4.1 實驗結果 30 4.2 討論 31 4.2.1同地異字結果討論 31 4.2.2 使用同地異字於THDL中增加的效果 34 第五章 結論與未來工作 35 5.1 結論 35 5.2未來工作 35 參考文獻 37 附錄 39 附錄A:同地異字地名對 39 附錄A-1:L1 相似地名對 39 附錄A-2:L2相似地名對 39 附錄A-3:L3相似地名對 51 附錄A-4:L4相似地名對 58 附錄B 單字統計 63 附錄C:各比對方法結果 67 附錄C-1:閩南語字典檔比對 67 附錄C-2:國語注音字典檔比對 71 附錄C-3:倉頡字典檔比對 78 | |
| dc.language.iso | zh-TW | |
| dc.subject | 地名階層 | zh_TW |
| dc.subject | 臺灣歷史 | zh_TW |
| dc.subject | 相似字形 | zh_TW |
| dc.subject | 相似字音 | zh_TW |
| dc.subject | 模糊比對 | zh_TW |
| dc.subject | Taiwan history | en |
| dc.subject | fuzzy match | en |
| dc.subject | similar Chinese orthography | en |
| dc.subject | similar Chinese phonology | en |
| dc.subject | place name hierarchy | en |
| dc.title | 辨識中文字相似特性產生的同地異名-以台灣歷史數位圖書館古契書為例 | zh_TW |
| dc.title | Recognizing Ambiguous Place Names Based on Similarity of Chinese Characters-A Case Study of Land Deeds in THDL | en |
| dc.type | Thesis | |
| dc.date.schoolyear | 98-2 | |
| dc.description.degree | 碩士 | |
| dc.contributor.oralexamcommittee | 謝育平,陳鍾誠 | |
| dc.subject.keyword | 臺灣歷史,地名階層,相似字音,相似字形,模糊比對, | zh_TW |
| dc.subject.keyword | Taiwan history,place name hierarchy,similar Chinese phonology,similar Chinese orthography,fuzzy match, | en |
| dc.relation.page | 78 | |
| dc.rights.note | 有償授權 | |
| dc.date.accepted | 2010-08-12 | |
| dc.contributor.author-college | 電機資訊學院 | zh_TW |
| dc.contributor.author-dept | 資訊工程學研究所 | zh_TW |
| 顯示於系所單位: | 資訊工程學系 | |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-99-1.pdf 未授權公開取用 | 668.83 kB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
