請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67692完整後設資料紀錄
| DC 欄位 | 值 | 語言 |
|---|---|---|
| dc.contributor.advisor | 項潔(Jieh Hsiang) | |
| dc.contributor.author | Ching-Yi Wang | en |
| dc.contributor.author | 王景逸 | zh_TW |
| dc.date.accessioned | 2021-06-17T01:44:27Z | - |
| dc.date.available | 2019-08-03 | |
| dc.date.copyright | 2017-08-03 | |
| dc.date.issued | 2017 | |
| dc.date.submitted | 2017-07-27 | |
| dc.identifier.citation | [1] 臺灣博碩士論文知識加值系統, http://ndltd.ncl.edu.tw/cgi-bin/gs32/gsweb.cgi/ccd=ECxVfb/webmge?switchlang=tw. [Online; accessed 12-June-2017]
[2] Numdam, http://www.numdam.org/. [Online; accessed 12-June-2017] [3] FreeCite, http://freecite.library.brown.edu./ [Online; accessed 12-June-2017] [4] ParsCit, http://wing.comp.nus.edu.sg/parsCit/ [Online; accessed 12-June-2017] [5] Stanford NER, https://nlp.stanford.edu/software/CRF-NER.shtml. [Online; accessed 12-June-2017] [6] Goutorbe, Claude. Document Interlinking in a Digital Math Library. Available at http://dml.cz/bitstream/handle/10338.dmlcz/702560/DML_002-2009-1_10.pdf. [Online; accessed 12-June-2017], 2009 [7] Apache Lucene, https://lucene.apache.org/. [Online; accessed 12-June-2017] | |
| dc.identifier.uri | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67692 | - |
| dc.description.abstract | 文獻引用連結即將引用字串與文獻連結起來,例如論文的參考資料頁面中有條列許多的參考文獻,為字串的形式,將其一一看成引用字串,尋找文獻與其建立連結便是文獻引用連結的目標。
而引用字串與文獻之間的連結並不是那麼容易建立,引用字串中可能有因為書寫者的疏忽或是檔案編碼問題產生的錯誤等,導致與文獻有所差異而難以判斷是否該建立連結,且當資料量成長時需要考慮的資料亦會增加。 本研究在連結建置系統中,提出利用索引來篩選候選文獻或候選引用字串的方法,使得需要考慮的資料量降低至合理的範圍,並且在判斷上考慮作者、標題、時間、出處的相似性,作為是否應該建立連結的基準,也是種對於連結強度的評價。而對系統而言難以判斷的部分亦儲存下來,可交由人工檢查來輔助判斷。 | zh_TW |
| dc.description.abstract | Document Citation Linking is to link the citation string with one document. The references or citations in one paper for example, are string format, viewed as citation strings. The goal is for each citation string, to find one document and link it to the citation string.
The links are not that easy to establish. There exists some error in the citation strings come from the writers’ mistake or encoding problem, etc. Leading to the difference between citation string and document, that is hard to decide whether to establish the links. And the amount of data need to consider also grows when there are more and more documents and citation strings. In this study of document citation linking system, propose a method to filter the candidate citation strings or documents by indexing, reduce the amount of data need to consider to a reasonable range. Considering the similarity of authors, title, time, source as the benchmark for establishing the links, also are the evaluation of the links. The system stores the cases that hard to decide to link or not by the computer, those can check by human beings. | en |
| dc.description.provenance | Made available in DSpace on 2021-06-17T01:44:27Z (GMT). No. of bitstreams: 1 ntu-106-R04922137-1.pdf: 1240046 bytes, checksum: d4460e4c27fdbbc8fa5fa4a6858c164f (MD5) Previous issue date: 2017 | en |
| dc.description.tableofcontents | 目錄
致謝 I ABSTRACT II 摘要 III 目錄 IV 圖目錄 VI 表目錄 VI 第一章 緒論 1 1.1 問題描述 1 1.2 研究動機 2 1.3 論文架構 2 第二章 相關系統與研究介紹 4 2.1 相關系統簡介 4 2.2 相關研究介紹 7 2.3 策略選擇 9 第三章 系統設計與實作 10 3.1 概述 10 3.2 資料 10 3.3 系統架構 10 3.4 策略 11 3.5 分詞 12 3.6 篩選 13 3.7 評估相似性 15 3.8 評估相似性的補正 17 3.9 競爭情形 20 第四章 實驗與效能評估 21 4.1 概述 21 4.2 篩選策略的比較 21 4.3 評估相似性策略的效果 23 4.4 被引用的文獻 24 4.5 可擴展性 26 第五章 結論與未來工作 28 5.1 結論 28 5.2 未來工作 28 參考文獻 29 圖目錄 圖1- 1臺灣博碩士論文加值系統:文獻資料頁面 4 圖1- 2臺灣博碩士論文加值系統:參考文獻連結 5 圖1- 3臺灣博碩士論文加值系統:被引用文獻連結 6 圖1- 4 NUMDAM:文獻資料頁面 6 圖3- 1 系統架構圖 11 圖4- 1系統時間需求實驗圖 27 表目錄 表4- 1篩選方法比較 22 表4- 2連結中考慮各項重要資料是否存在之數量與比例 24 表4- 3被引用次數最多的文獻(前20名) 24 | |
| dc.language.iso | zh-TW | |
| dc.subject | 引用字串剖析 | zh_TW |
| dc.subject | 文獻引用連結 | zh_TW |
| dc.subject | 索引 | zh_TW |
| dc.subject | Citation Parsing | en |
| dc.subject | Index | en |
| dc.subject | Citation Linking | en |
| dc.title | 文獻引用建置系統的設計與實作 | zh_TW |
| dc.title | On The Design and Implementation of a Document Citation Linking System | en |
| dc.type | Thesis | |
| dc.date.schoolyear | 105-2 | |
| dc.description.degree | 碩士 | |
| dc.contributor.oralexamcommittee | 謝育平,蔡宗翰 | |
| dc.subject.keyword | 文獻引用連結,索引,引用字串剖析, | zh_TW |
| dc.subject.keyword | Citation Linking,Index,Citation Parsing, | en |
| dc.relation.page | 29 | |
| dc.identifier.doi | 10.6342/NTU201702150 | |
| dc.rights.note | 有償授權 | |
| dc.date.accepted | 2017-07-27 | |
| dc.contributor.author-college | 電機資訊學院 | zh_TW |
| dc.contributor.author-dept | 資訊工程學研究所 | zh_TW |
| 顯示於系所單位: | 資訊工程學系 | |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-106-1.pdf 未授權公開取用 | 1.21 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
