Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/85014
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor項潔(Jieh Hsiang)
dc.contributor.authorHong-Mo Tsaien
dc.contributor.author蔡鴻謨zh_TW
dc.date.accessioned2023-03-19T22:38:12Z-
dc.date.copyright2022-08-24
dc.date.issued2021
dc.date.submitted2022-08-19
dc.identifier.citation國立臺灣大學數位人文研究中心。(1995)。國立臺灣大學佛學數位圖書館。 國立臺灣大學。2022年6月檢自: http://doi.airiti.com/LandingPage/NTURCDH/10.6681/NTURCDH.DB_DLMBS/Collection 廖昱甄(2022)。個人化書目管理應用工具──以臺大佛學數位圖書館為例(未出版碩士論文)。國立臺灣大學,臺北市。 香光尼眾佛學院圖書館(2011)。佛教圖書分類法2011年版(初版)。嘉義市:香光書鄉。 藍文欽(2011)。《佛教圖書分類法(2011年版)》評介。佛教圖書館館刊,53,48-58。 DILA人名規範資料庫。2022年6月檢自:https://authority.dila.edu.tw/person/ CBETA 中華電子佛典協會。2022年6月檢自:https://cbeta.org/ Markus半自動標記平台。2022年6月檢自:https://dh.chinese-empires.eu/markus/beta/index.html 何浩洋(2014)。MARKUS:中文古籍文本半自動標記平台。第五屆數位典藏與數位人文國際研討會, pp.117-137, 2014. Maabar, Maha (17 November 2014). Trie Data Structure. Retrieved June, 2022, from https://bioinformatics.cvr.ac.uk/trie-data-structure/ Microsoft. Clustered and Nonclustered Indexes Described. Retrieved June, 2022, from https://docs.microsoft.com/en-us/previous-versions/sql/sql-server-2012/ms190457(v=sql.110) Bayer, R., & McCreight, E. (2002). Organization and maintenance of large ordered indexes. In Software pioneers (pp. 245-262). Springer, Berlin, Heidelberg.
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/85014-
dc.description.abstract  臺大佛學數位圖書館(NTU Digital Library of Buddhist Studies)收錄了大量的佛學書目資料,並且擁有完善的書目檢索系統,提供研究人員做佛學資料的蒐集。基於書目metadata的欄位,臺大佛學數位圖書館的書目檢索系統對檢索結果提供了6種後分類:出版年份、資料類型、出處題名、關鍵詞、著者、語言,這些後分類都是書目匯入時既有的metadata欄位,若是能為書目做佛學類別專門詞彙的標記,並且將標記做為後分類提供給使用者,將更有利於研究人員對於書目資料的篩選及整理。   本研究旨在於為臺大佛學數位圖書館的書目資料進行標記,新增三個標記類別:佛教宗派、佛教人物、佛教經典。事先收集這些類別的專門詞彙進行字串比對實現自動標記,並建立停用詞表,以利為字串比對的專門詞彙進行篩選,搭配人工輔助檢核標記、專門詞彙、停用詞表以進行更新,並為臺大佛學數位圖書館的書目檢索系統新增三種不同的後分類:「提及:佛教宗派」、「提及:佛教人物」、「提及:佛教經典」,隨著專門詞彙及停用詞表的完整,期望能夠帶給使用者較為準確的標記及後分類,為使用者帶來更佳的使用體驗。zh_TW
dc.description.abstract  NTU Digital Library of Buddhist Studies has a large collection of bibliographies of Buddhist studies and a comprehensive bibliographic search system for researchers to access Buddhist materials. Based on bibliographic metadata, the bibliographic search system of NTU Digital Library of Buddhist Studies provides six types of post-categories of query results: publication years, media types, source topics, keywords, authors, and languages. These post-classifications utilize the existing metadata attributes of the bibliographies. If the bibliographies can be tagged with specific vocabularies of new categories, the categories and taggings can also be used for additional post-query classification. This will provide more beneficial for researchers to filter and organize the bibliographic data.   The purpose of this study is to tag the bibliographic data of NTU Digital Library of Buddhist Studies by add three new tag categories: Buddhist sects, Buddhist persons, and Sutras. The terms of each categories are collected in advance for string matching to obtain automatic tagging. A list of stopwords is also created to facilitate the filtering of specific words for string matching and correction of tags. The lists of vocabulary and stopwords can be modified manually. We added three different categories to the bibliographic search system of NTU Digital Library of Buddhist Studies. They are 'Mentions: Buddhist Sect', 'Mentions: Buddhist Person', and 'Mentions: Sutra', each with a specialized vocabulary and a list of stopwords. Through post-query classification using these categories, we hope to provide better user experience.en
dc.description.provenanceMade available in DSpace on 2023-03-19T22:38:12Z (GMT). No. of bitstreams: 1
U0001-1808202215373800.pdf: 4053369 bytes, checksum: 4356169f589ad5a74f563f5789cb936b (MD5)
Previous issue date: 2021
en
dc.description.tableofcontents口試委員會審定書 i 致謝 ii 摘要 iii Abstract iv 圖目錄 vii 表目錄 ix 第一章 緒論 1 1.1 研究背景與動機 1 1.2 研究目的與問題 1 1.3 論文架構 2 第二章 現況探討與相關文獻 3 2.1 臺大佛學數位圖書館 3 2.2 專門詞彙資料收集參考 5 2.2.1 《佛教圖書分類法(2011年版)》 5 2.2.2 DILA人名規範資料庫 5 2.2.3 CBETA 中華電子佛典協會 6 2.3 標記工具參考 7 2.3.1 Markus半自動標記平台 7 2.4 本章小結 8 第三章 研究方法 9 3.1 研究對象與範圍 9 3.2 研究流程與方法 9 第四章 功能設計與實作 14 4.1 架構設計 14 4.2 資料處理 15 4.2.1 書目資料表欄位新增 15 4.2.2 停用詞資料表 18 4.2.3 佛教宗派專門詞彙 18 4.2.4 佛教人物專門詞彙 20 4.2.5 佛教經典專門詞彙 24 4.2.6 資料處理實作 25 4.2.7 小結 26 4.3 自動標記實作 27 4.4 輔助人工檢核 29 第五章 UI功能設計與範例演示 32 5.1 輔助人工檢核範例演示 32 5.2 書目後分類及標記呈現 37 5.3 本章回顧 41 第六章 結論與未來工作 42 6.1 研究結論 42 6.2 未來工作 43 參考文獻 44
dc.language.isozh-TW
dc.subject臺大佛學數位圖書館zh_TW
dc.subject字串比對zh_TW
dc.subject後分類zh_TW
dc.subject停用詞zh_TW
dc.subject標記zh_TW
dc.subjecttaggingen
dc.subjectNTU Digital Library of Buddhist Studiesen
dc.subjectstring matchingen
dc.subjectpost-classificationen
dc.subjectstopwordsen
dc.title佛學書目自動化標記與後分類應用研究zh_TW
dc.titleAutomated Tagging and Post-Classification Analysis of Bibliographies of Buddhist Studiesen
dc.typeThesis
dc.date.schoolyear110-2
dc.description.degree碩士
dc.contributor.oralexamcommittee謝育平(Yuh-Pyng Shieh),胡其瑞(Chi-Jui Hu)
dc.subject.keyword臺大佛學數位圖書館,字串比對,後分類,停用詞,標記,zh_TW
dc.subject.keywordNTU Digital Library of Buddhist Studies,string matching,post-classification,stopwords,tagging,en
dc.relation.page44
dc.identifier.doi10.6342/NTU202202547
dc.rights.note同意授權(限校園內公開)
dc.date.accepted2022-08-19
dc.contributor.author-college電機資訊學院zh_TW
dc.contributor.author-dept資訊工程學研究所zh_TW
dc.date.embargo-lift2022-08-24-
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
U0001-1808202215373800.pdf
授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務)
3.96 MBAdobe PDF
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved