請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/6097完整後設資料紀錄
| DC 欄位 | 值 | 語言 |
|---|---|---|
| dc.contributor.advisor | 項潔(Jieh Hsiang) | |
| dc.contributor.author | Yi-Cheng Lin | en |
| dc.contributor.author | 林易徵 | zh_TW |
| dc.date.accessioned | 2021-05-16T16:20:50Z | - |
| dc.date.available | 2013-08-06 | |
| dc.date.available | 2021-05-16T16:20:50Z | - |
| dc.date.copyright | 2013-08-06 | |
| dc.date.issued | 2013 | |
| dc.date.submitted | 2013-08-01 | |
| dc.identifier.citation | [1] 孫永忠,〈類書淵源與體例形成之研究〉,《古典文獻研究輯刊四編》第3冊,花木蘭文化,2007年,p.1。
[2] 胡道靜,《中國古代的類書》,北京中華書局,1982年,p.5。 [3] 趙含坤,《中國類書》,河北人民出版社,2005年,p.1。 [4] 葉乃靜,〈明清類書、叢書與法國十八世紀百科全書之比較研究〉,1999年,p.4。 [5] 趙含坤,《中國類書》,河北人民出版社,2005年,p.2。 [6] 數位古今圖書集成,Available: http://192.83.187.228/gjtsnet/index.htm。 [7] 古今圖書集成索引&全書圖像,Available: http://gjtsjc.gxu.edu.cn/。 [8] 陳詩沛、項潔、杜協昌,〈史料整體分析工具之幕後──介紹「台灣歷史數位圖書館」的資料前置處理程序〉,《數位典藏與數位人文國際研討會 會議手冊》,2009年12月,p.277-291。 [9] 孟森,《明清史講義》,北京中華書局,1981年,p.531。 [10] 楊玉良,〈《古今圖書集成》考證拾零〉,《故宫博物院院刊》,1985年第一期,p.33。 [11] 吳清輝,〈古今圖書集成相關問題研究〉,2007年6月,p.74-82。 [12] 程發軔,《國學概論(下) 》,國立編譯館,1993年,p.159。 [13] 趙含坤,《中國類書》,河北人民出版社,2005年,p.2。 [14] 詹惠媛,〈《古今圖書集成》研究回顧(1911-2006)〉,《漢學研究通訊》第廿七卷,2008年8月第三期,p.18-19。 [15] 孫永忠,〈類書淵源與體例形成之研究〉,《古典文獻研究輯刊四編》第3冊,花木蘭文化,2007年,p.165-166。 [16] LIS Wiki,古今圖書集成,Available: http://morris.lis.ntu.edu.tw/wikimedia/index.php/%E5%8F%A4%E4%BB%8A%E5%9C%96%E6%9B%B8%E9%9B%86%E6%88%90。 [17] 中國基本古籍庫,Available: http://www.er07.com/。 [18] 國家圖書館,Available: http://www.ncl.edu.tw/。 [19] 國立臺灣大學圖書館,Available: http://www.lib.ntu.edu.tw/。 [20] 漢籍電子文獻資料庫,Available: http://hanchi.ihp.sinica.edu.tw/。 [21] 中央研究院數位文化中心,Available: http://digitalarchives.tw/。 [22] 中國哲學書電子化計劃,Available: http://ctext.org/zh。 [23] 陳夢雷原著,蕭孟能編印,《古今圖書集成及索引》第○○一冊,文星書店,1964年,p.2-3。 [24] 陳夢雷原著,蕭孟能編印,《古今圖書集成及索引》第○○一冊,文星書店,1964年,p.3。 [25] 陳夢雷原著,蕭孟能編印,《古今圖書集成及索引》,文星書店,1964年。 [26] 蕭孟能主編,《古今圖書集成索引》,文星書店,1964年。 [27] 夏南强,〈类书通论——论类书的性质起源发展演变和影响〉,华中师范大学历史文化学院,2001年4月。 [28] 黃柏淳,〈藝文類聚及太平御覽詮釋資料的建立〉,國立臺灣大學資訊工程研究所,2012年7月。 [29] 陳詩沛,〈資訊技術與歷史文獻分析〉,國立臺灣大學資訊工程研究所,2011年6月。 [30] 陳品諺,〈《清實錄》之文本分析與時間標記初探〉,國立臺灣大學資訊工程研究所,2011年6月。 | |
| dc.identifier.uri | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/6097 | - |
| dc.description.abstract | 類書是中國歷史上重要的工具類型之書,其將古籍中各個不同的知識敘述片段擷取出來,並依照類書本身的分類方式及編排架構編纂而成,以類相從,以達到整理經籍以及方便查閱的作用。自三國時代開始,類書在中國的發展已近兩千年,收錄典籍愈多,分類方法愈詳細。目前現存以清代康熙、雍正時期所編纂的《古今圖書集成》最為重要,其資料也最為豐富,於現代也仍舊是值得參考的工具書。
《古今圖書集成》內含有約一億七千萬餘的文字量,並且收錄自上古至清初約一萬餘本的古籍資料,又其收錄的知識類型包羅萬象、應有盡有。如此鉅作要能方便地瀏覽查找其內含的豐富知識實屬不易,因此在本研究嘗試以資訊方法來解決這些問題。 本研究主要分為三個部份,第一部份主要說明《古今圖書集成》的成書架構,並依照其架構設計一套處理的流程將其所收錄的知識敘述文句段落切開為獨立條目,並套入台灣歷史數位圖書館(Taiwan History Digital Library, THDL)模型以供使用者方便查閱。第二部份主要針對各條目的古籍出處作整理,利用資訊方法將錯誤或是缺失的出處資訊補正,以達到整理經籍,甚至輯佚的目的。第三部份則是根據前兩部份的資料架構建置及出處整理結果,作交叉性的統計數據。 希望本研究也能夠對於未來類書或是《古今圖書集成》的研究者,達到前導及縮短研究時間之目的。 | zh_TW |
| dc.description.abstract | Leishu(類書, categorically data-assembling book) is a type of reference books developed in ancient China. A leishu first develops a classification structure for the intended knowledge domain, then extracts segments from existing books and fits them into the proper categories so that they can be retrieved and used conveniently later. Gujin Tushu Jicheng(古今圖書集成, Completed Collection of Graphs and Writings of Ancient and Modern Times), published in the 18th century during the Qing Dynasty, is the largest and most valuable leishu.
Gujin Tushu Jicheng contains approximate 170 million words, which were taken from over 10 thousand ancient classics and books. In this thesis, we develop information technologies to effectively harness this great book. There are mainly three parts in this thesis. In the first part, we introduce the background and overall structure of Gujin Tushu Jicheng. We also design an automated procedure to identify and analyze the entries in the book. We then build a retrieval system by incorporating the restructured content into the THDL(Taiwan History Digital Library) shell. In the second part, we try to identify the sources of the entries automatically and systematically, fix the errors and patch the omissions. In the last part, we give some statistical data drawn from the analysis done in the first two parts of the thesis. | en |
| dc.description.provenance | Made available in DSpace on 2021-05-16T16:20:50Z (GMT). No. of bitstreams: 1 ntu-102-R00922101-1.pdf: 15326562 bytes, checksum: 0fe7e016bf46ae9f4f1c66df593bd2a9 (MD5) Previous issue date: 2013 | en |
| dc.description.tableofcontents | 誌謝 i
中文摘要 ii ABSTRACT iii CONTENTS iv LIST OF FIGURES vi LIST OF TABLES viii Chapter 1 緒論 1 1.1 引言 1 1.2 研究動機與目的 1 1.3 論文架構 2 1.4 常用名詞定義 3 Chapter 2 《古今圖書集成》介紹 5 2.1 成書背景與概述 5 2.2 全書之編排架構 7 Chapter 3 數位檔案處理方式與流程 13 3.1 數位檔案格式介紹與紙本比較 13 3.2 數位檔案條目建構流程 15 3.2.1 擷取經度及其他資訊 16 3.2.2 擷取目錄並架構化 16 3.2.3 切出獨立內文/條目群 17 3.2.4 斷句回接處理 18 3.2.5 校驗項目總數與偵錯 19 3.2.6 自動與人工修正錯誤 19 3.2.7 部分條目群分切各條目 22 3.2.8 計算各條目之ID 23 3.2.9 寫入資料庫及匯出XML檔 24 3.3 例外處理與其他觀察 26 Chapter 4 出處自動化擷取與補正 29 4.1 原始出處格式與擷取 29 4.2 擷取後出處處理流程及方法 30 4.2.1 自動斷詞 31 4.2.2 自動標籤 32 4.2.3 補缺資訊 34 4.2.4 Query偵錯與修正 35 4.3 新增出處資訊後之XML檔 36 Chapter 5 THDL系統呈現與相關統計數據 37 5.1 THDL系統介面與功能概述 37 5.2 《集成》相關統計數據 39 5.2.1 形式架構相關 39 5.2.2 條目出處相關 43 Chapter 6 結論與未來工作 59 REFERENCE 61 附錄一:部名總表 63 附錄二:目錄存在但內容缺漏之項目列表 83 附錄三:多重書目與單一篇章包含關係列表 91 附錄四:出處資訊別名列表 123 附錄五:書目與無書目包含篇章出處列表 125 附錄六:詩詞曲賦出處作者列表 489 | |
| dc.language.iso | zh-TW | |
| dc.title | 《古今圖書集成》自動化內容建構與出處擷取 | zh_TW |
| dc.title | Automated Content Construction and Reference Retrieval on the Completed Collection of Graphs and Writings of Ancient and Modern Times | en |
| dc.type | Thesis | |
| dc.date.schoolyear | 101-2 | |
| dc.description.degree | 碩士 | |
| dc.contributor.oralexamcommittee | 吳密察(Mi-Cha Mu),蔡宗翰(Tzong-Han Tsai) | |
| dc.subject.keyword | 古今圖書集成,類書,條目,條目出處,自動化,數位人文,台灣歷史數位圖書館, | zh_TW |
| dc.subject.keyword | Gujin Tushu Jicheng(Completed Collection of Graphs and Writings of Ancient and Modern Times),leishu,entries,references of entries,automation,digital humanities,Taiwan History Digital Library, | en |
| dc.relation.page | 741 | |
| dc.rights.note | 同意授權(全球公開) | |
| dc.date.accepted | 2013-08-01 | |
| dc.contributor.author-college | 電機資訊學院 | zh_TW |
| dc.contributor.author-dept | 資訊工程學研究所 | zh_TW |
| 顯示於系所單位: | 資訊工程學系 | |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-102-1.pdf | 14.97 MB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
