請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/85014完整後設資料紀錄
| DC 欄位 | 值 | 語言 |
|---|---|---|
| dc.contributor.advisor | 項潔(Jieh Hsiang) | |
| dc.contributor.author | Hong-Mo Tsai | en |
| dc.contributor.author | 蔡鴻謨 | zh_TW |
| dc.date.accessioned | 2023-03-19T22:38:12Z | - |
| dc.date.copyright | 2022-08-24 | |
| dc.date.issued | 2021 | |
| dc.date.submitted | 2022-08-19 | |
| dc.identifier.citation | 國立臺灣大學數位人文研究中心。(1995)。國立臺灣大學佛學數位圖書館。 國立臺灣大學。2022年6月檢自: http://doi.airiti.com/LandingPage/NTURCDH/10.6681/NTURCDH.DB_DLMBS/Collection 廖昱甄(2022)。個人化書目管理應用工具──以臺大佛學數位圖書館為例(未出版碩士論文)。國立臺灣大學,臺北市。 香光尼眾佛學院圖書館(2011)。佛教圖書分類法2011年版(初版)。嘉義市:香光書鄉。 藍文欽(2011)。《佛教圖書分類法(2011年版)》評介。佛教圖書館館刊,53,48-58。 DILA人名規範資料庫。2022年6月檢自:https://authority.dila.edu.tw/person/ CBETA 中華電子佛典協會。2022年6月檢自:https://cbeta.org/ Markus半自動標記平台。2022年6月檢自:https://dh.chinese-empires.eu/markus/beta/index.html 何浩洋(2014)。MARKUS:中文古籍文本半自動標記平台。第五屆數位典藏與數位人文國際研討會, pp.117-137, 2014. Maabar, Maha (17 November 2014). Trie Data Structure. Retrieved June, 2022, from https://bioinformatics.cvr.ac.uk/trie-data-structure/ Microsoft. Clustered and Nonclustered Indexes Described. Retrieved June, 2022, from https://docs.microsoft.com/en-us/previous-versions/sql/sql-server-2012/ms190457(v=sql.110) Bayer, R., & McCreight, E. (2002). Organization and maintenance of large ordered indexes. In Software pioneers (pp. 245-262). Springer, Berlin, Heidelberg. | |
| dc.identifier.uri | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/85014 | - |
| dc.description.abstract | 臺大佛學數位圖書館(NTU Digital Library of Buddhist Studies)收錄了大量的佛學書目資料,並且擁有完善的書目檢索系統,提供研究人員做佛學資料的蒐集。基於書目metadata的欄位,臺大佛學數位圖書館的書目檢索系統對檢索結果提供了6種後分類:出版年份、資料類型、出處題名、關鍵詞、著者、語言,這些後分類都是書目匯入時既有的metadata欄位,若是能為書目做佛學類別專門詞彙的標記,並且將標記做為後分類提供給使用者,將更有利於研究人員對於書目資料的篩選及整理。 本研究旨在於為臺大佛學數位圖書館的書目資料進行標記,新增三個標記類別:佛教宗派、佛教人物、佛教經典。事先收集這些類別的專門詞彙進行字串比對實現自動標記,並建立停用詞表,以利為字串比對的專門詞彙進行篩選,搭配人工輔助檢核標記、專門詞彙、停用詞表以進行更新,並為臺大佛學數位圖書館的書目檢索系統新增三種不同的後分類:「提及:佛教宗派」、「提及:佛教人物」、「提及:佛教經典」,隨著專門詞彙及停用詞表的完整,期望能夠帶給使用者較為準確的標記及後分類,為使用者帶來更佳的使用體驗。 | zh_TW |
| dc.description.abstract | NTU Digital Library of Buddhist Studies has a large collection of bibliographies of Buddhist studies and a comprehensive bibliographic search system for researchers to access Buddhist materials. Based on bibliographic metadata, the bibliographic search system of NTU Digital Library of Buddhist Studies provides six types of post-categories of query results: publication years, media types, source topics, keywords, authors, and languages. These post-classifications utilize the existing metadata attributes of the bibliographies. If the bibliographies can be tagged with specific vocabularies of new categories, the categories and taggings can also be used for additional post-query classification. This will provide more beneficial for researchers to filter and organize the bibliographic data. The purpose of this study is to tag the bibliographic data of NTU Digital Library of Buddhist Studies by add three new tag categories: Buddhist sects, Buddhist persons, and Sutras. The terms of each categories are collected in advance for string matching to obtain automatic tagging. A list of stopwords is also created to facilitate the filtering of specific words for string matching and correction of tags. The lists of vocabulary and stopwords can be modified manually. We added three different categories to the bibliographic search system of NTU Digital Library of Buddhist Studies. They are 'Mentions: Buddhist Sect', 'Mentions: Buddhist Person', and 'Mentions: Sutra', each with a specialized vocabulary and a list of stopwords. Through post-query classification using these categories, we hope to provide better user experience. | en |
| dc.description.provenance | Made available in DSpace on 2023-03-19T22:38:12Z (GMT). No. of bitstreams: 1 U0001-1808202215373800.pdf: 4053369 bytes, checksum: 4356169f589ad5a74f563f5789cb936b (MD5) Previous issue date: 2021 | en |
| dc.description.tableofcontents | 口試委員會審定書 i 致謝 ii 摘要 iii Abstract iv 圖目錄 vii 表目錄 ix 第一章 緒論 1 1.1 研究背景與動機 1 1.2 研究目的與問題 1 1.3 論文架構 2 第二章 現況探討與相關文獻 3 2.1 臺大佛學數位圖書館 3 2.2 專門詞彙資料收集參考 5 2.2.1 《佛教圖書分類法(2011年版)》 5 2.2.2 DILA人名規範資料庫 5 2.2.3 CBETA 中華電子佛典協會 6 2.3 標記工具參考 7 2.3.1 Markus半自動標記平台 7 2.4 本章小結 8 第三章 研究方法 9 3.1 研究對象與範圍 9 3.2 研究流程與方法 9 第四章 功能設計與實作 14 4.1 架構設計 14 4.2 資料處理 15 4.2.1 書目資料表欄位新增 15 4.2.2 停用詞資料表 18 4.2.3 佛教宗派專門詞彙 18 4.2.4 佛教人物專門詞彙 20 4.2.5 佛教經典專門詞彙 24 4.2.6 資料處理實作 25 4.2.7 小結 26 4.3 自動標記實作 27 4.4 輔助人工檢核 29 第五章 UI功能設計與範例演示 32 5.1 輔助人工檢核範例演示 32 5.2 書目後分類及標記呈現 37 5.3 本章回顧 41 第六章 結論與未來工作 42 6.1 研究結論 42 6.2 未來工作 43 參考文獻 44 | |
| dc.language.iso | zh-TW | |
| dc.subject | 臺大佛學數位圖書館 | zh_TW |
| dc.subject | 字串比對 | zh_TW |
| dc.subject | 後分類 | zh_TW |
| dc.subject | 停用詞 | zh_TW |
| dc.subject | 標記 | zh_TW |
| dc.subject | tagging | en |
| dc.subject | NTU Digital Library of Buddhist Studies | en |
| dc.subject | string matching | en |
| dc.subject | post-classification | en |
| dc.subject | stopwords | en |
| dc.title | 佛學書目自動化標記與後分類應用研究 | zh_TW |
| dc.title | Automated Tagging and Post-Classification Analysis of Bibliographies of Buddhist Studies | en |
| dc.type | Thesis | |
| dc.date.schoolyear | 110-2 | |
| dc.description.degree | 碩士 | |
| dc.contributor.oralexamcommittee | 謝育平(Yuh-Pyng Shieh),胡其瑞(Chi-Jui Hu) | |
| dc.subject.keyword | 臺大佛學數位圖書館,字串比對,後分類,停用詞,標記, | zh_TW |
| dc.subject.keyword | NTU Digital Library of Buddhist Studies,string matching,post-classification,stopwords,tagging, | en |
| dc.relation.page | 44 | |
| dc.identifier.doi | 10.6342/NTU202202547 | |
| dc.rights.note | 同意授權(限校園內公開) | |
| dc.date.accepted | 2022-08-19 | |
| dc.contributor.author-college | 電機資訊學院 | zh_TW |
| dc.contributor.author-dept | 資訊工程學研究所 | zh_TW |
| dc.date.embargo-lift | 2022-08-24 | - |
| 顯示於系所單位: | 資訊工程學系 | |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| U0001-1808202215373800.pdf 授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務) | 3.96 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
