Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電機工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/30549
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor鄭士康(Shyh-Kang Jeng)
dc.contributor.authorChien-Chih Liaoen
dc.contributor.author廖健志zh_TW
dc.date.accessioned2021-06-13T02:07:51Z-
dc.date.available2007-07-24
dc.date.copyright2007-07-24
dc.date.issued2007
dc.date.submitted2007-06-29
dc.identifier.citation[1] WIPO世界智慧財產權組織,網址:http://www.wipo.int/portal/index.html
.en,查訪日期:2007年4月24日。
[2] 克里斯.安德森,譯者:李明、周宜芳、胡瑋珊、楊美齡,《長尾理論》,天下文化,2006。
[3] A. Kontostathis and W. M. Pottenger, A Framework for Understanding Latent Semantic Indexing (LSI) Performance, Proceedings of ACM SIGIR Workshop on Mathematical/Formal Methods in Information Retrieval, 2004。
[4] 謝宛瑜,《快速深度分析專利文獻》,網址:http://www.patent104.idv.tw/pa
t10.htm,查訪日期:2007年4月24日。
[5] 謝邦昌,《Data mining 演算法- 文字資料採礦》,投影片頁1-6,Microsoft,2005。
[6] S. J. Russell and P. Norvig, Artificial Intelligence: A Modern Approach. 2nd ed. Pearson Education International, Prentice-Hall, 2003。
[7] 陳光華,《資訊檢索的績效評估》,現代資訊組織與檢索研討會,第125至139頁,2004。
[8] 陳達仁、黃慕萱,《專利資訊與專利檢索》,文華圖書館管理資訊股份有限公司,2002。
[9] 維基百科- 「詞語」條目,網址:http://zh.wikipedia.org/wiki/詞語,查訪日期:2007年4月26日。
[10] 維基百科- 「漢語語法」條目,網址:http://zh.wikipedia.org/wiki/漢語語法,查訪日期:2007年4月26日。
[11] 維基百科- 「語素」條目,網址:http://zh.wikipedia.org/wiki/詞素,查訪日期:2007年4月26日。
[12] 黃居仁,《中文詞彙意義的區辨與操作原則》,中央研究院語言學研究所,2004。
[13] 林千翔、張嘉惠,《基於特製隱藏式馬可夫模型之中文斷詞研究》,國立中央大學資訊工程學系,2005。
[14] 馬偉雲,《未知詞擷取作法》,中研院資訊科學所詞庫小組,網址:http://ckip
svr.iis.sinica.edu.tw/,查訪日期:2007年5月3日。
[15] 陳彩雲、李治國,《一種基於SVD和Rough集的信息過濾方法》,南開大學組合數學研究中心,2001。
[16] Brant Alan Olde, Does Latent Semantic Analysis Actually Have a Latent Structure, A Dissertation Presented for the Doctor of Philosophy Degree, The University of Memphis, 2002。
[17] Azar.Y, Fiat. A, Karlin. A, etal, Spectral Analysis for Data Mining, Proceedings of the Thirty-Third Annual ACM Symposium on Theory of Computing, 2001, pp 619-626。
[18] R. A. Johnson and D. W. Wichern, Applied Multivariate Statistical Analysis. 5th ed. Pearson Education International, Prentice-Hall, 2002, Chap. 1。
[19] T. Hofmann, Probabilistic Latent Semantic Analysis, Uncertainity in Artificial Intelligence, UAI’99, Stockholm, 1999。
[20] M. Simina and C. Barbu, Meta Latent Semantic Analysis, IEEE International Conference on Systems, Man and Cybernetics, 2004。
[21] Y. Huang, K. Yu, M. Schubert, S. Yu, V. Tresp and H. Kriegel, Hierarchy-Regularized Latent Semantic Indexing, Proceedings of the Fifth IEEE International Conference on Data Mining, 2005。
[22] J.Sun, Z.Chen, H. Zeng, Y. Lu, C. Shi and W. Ma, Supervised Latent Semantic Indexing for Document Categorization, Proceedings of the Fourth IEEE International Conference on Data Mining, 2004。
[23] T. Liu, Z. Chen, B. Zhang, W. Ma and G. Wu, Improving Text Classification using Local Latent Semantic Indexing, Proceedings of the Fourth IEEE International Conference on Data Mining, 2004。
[24] 專利權所有者,《中華民國專利公報第00015315號》,財團法人亞太智慧財產權發展基金會,1974。
[25] OpenCV(Open Source Computer Vision Library) China,網址:http://www.op
encv.org.cn/,查訪日期:2007年5月10日。
[26] 中華民國專利公報資料庫,網址:http://twp.apipa.org.tw/PatentQuery.a
sp,財團法人亞太智慧財產權發展基金會,查訪日期:2007年5月25日。
[27] 中華民國專利資訊網,網址:http://www.twpat.com/Webpat/Default.a
spx,連穎科技股份有限公司,查訪日期:2007年5月25日。
[28] 陳以理、林蘭綺、吳典松,《自然語言處理技術於專利文件分析之應用》,國立交通大學資訊科學系,2003。
[29] 全國博碩士論文資訊網,網址:http://etds.ncl.edu.tw/theabs/index.jsp
,查訪日期:2007年4月24日。
[30] 920103專利法通過條文,資料來源:經濟部智慧財產局網站。
[31] 專利權所有者,《中華民國專利公報第I276403號》,經濟部智慧財產局中華民國專利公報檢索系統,2007。
[32] 周天、鄭莞鈴、楊盈珊,《大學校園網路法律案例教材研製計畫期末成果報告》,教育部,2005。
[33] 經濟部智慧財產局 專利Q&A,網址:http://www.tipo.gov.tw/patent/paten
t_q_a/patent_q_a.asp,查訪日期:2007年5月3日。
[34] 《IPC第八版使用指南》,World Intellectual Property Organization,2006。
[35] 王世仁,《專利工程導論》,俊傑書局股份有限公司,2002。
[36] 陳達仁,《專利檢索與分析》,經濟部智慧財產局,2006。
[37] 林家聖,《專利檢索系統與分析方法之探討與革新》,國立政治大學智慧財產研究所碩士論文,95學年度。
[38] 周永銘,《應用專利分類號於專利技術叢集化之研究》,國立臺灣大學機械工程學研究所碩士論文,94學年度。
[39] 林蘭綺,《專利文件之自動分類研究》,國立交通大學資訊科學與工程研究所碩士論文,94學年度。
[40] 鄭憲倫,《利用鬆弛演算法分類專利詞彙》,國立清華大學資訊系統與應用研究所碩士論文,94學年度。
[41] 王聖順,《專利文件之專利技術特性及功能知識分析法》,國立台灣科技大學機械工程系碩士論文,94學年度。
[42] 劉芳遠,《使用支持向量機於本國專利自動分類之研究》,輔仁大學資訊管理學系碩士論文,94學年度。
[43] 陳明原,《應用貝氏理論及模糊邏輯進行專利分類及TRIZ方法改善之研究》,國立台灣科技大學自動化及控制研究所碩士論文,94學年度。
[44] 高佐良,《以技術關鍵詞分析專利分類的專利資訊檢索系統》,國立臺北科技大學商業自動化與管理研究所碩士論文,93學年度。
[45] 陳易宏,《導入CMP領域知識之工程專利知識庫與專利分析檢索技術之初步研究》,國立台灣科技大學機械工程系碩士論文,93學年度。
[46] 高志強,《組合自動化文件分類技術之研究-以專利文件分類為例》,中原大學資訊管理研究所碩士論文,92學年度。
[47] 李駿翔,《應用資料探勘分類技術於專利分析之研究》,中原大學資訊管理研究所碩士論文,91學年度。
[48] Google 學術搜尋,網址:http://scholar.google.com.tw/,查訪日期:2007年4月24日。
[49] IEEE Xplore 學術論文搜尋網,網址:http://ieeexplore.ieee.org/Xplore/
dynhome.jsp,查訪日期:2007年5月22日。
[50] TIPA智慧財產培訓學院 培訓單位,網址:http://www.tipa.org.tw/p72.asp
,查訪日期:2007年4月23日。
[51] Google台灣,網址:http://www.google.com.tw/,查訪日期:2007年4月23日。
[52] 教育部高教司 95學年度大學校院一覽表檢索系統,網址:http://reg.aca.n
tu.edu.tw/college/search/?open,查訪日期:2007年4月23日。
[53] 元勤智識網,網址:http://www.ipnavigator.com.tw/member/link.asp,查訪日期:2007年5月3日。
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/30549-
dc.description.abstract本論文目標在於實作出一個非傳統搜尋方法之專利搜尋系統:藉由概念式的中文描述語句,進行輸入查詢,以文意評分,提供使用者判斷及利用,整理混沌的專利資訊。對專利資料及查詢子句預先處理,並利用潛在語意分析(LSA, Latent Semantic Analysis)演算法進行專利文意相關度排序,提供使用者一個便利的檢索環境,並且讓檢索出來的資訊能夠最符合使用者的真切需求。同時利用LSA演算法各項參數調整,針對專利文獻做最佳化,增加結果的準確度與合理性。將專利資料庫發揮出最大的功效,進而幫助智慧財產權以及專利商品化的推廣與實施。
本論文附錄亦針對至目前為止,在專利相關領域上的研究方向及機構,作簡單的分析介紹。提供欲對智慧財產權作進一步了解者,可以更簡易、輕鬆地找到相關研究資源,提升我國人在智慧財產權上面的國際競爭力。
zh_TW
dc.description.abstractThe main goal of this thesis is to implement a patent retrieval system with unconventional searching method. With the conceptual query sentence described in Chinese, it can score the results by similarity of their meanings and use the results to support the users. This system can provide the users a simple and convenient query environment, and let the information retrieved fit what users really want in order to marshalling the chaos patent information. By processing the query sentences and the patent information in advance, we use Latent Semantic Analysis algorithm to classify the information by their real meanings and show their relative degree to the query sentences. By means of adjusting parameters in LSA algorithm, we can optimize the system with patent documents and increase the accuracy and reasonability of results at the same time. This will enable the patent database to bring out most benefit and to help the intellectual property rights and patent commercialization spread and carry out eventually.
This thesis also has a brief introduction on the patent related research areas and organizations at present day in the appendix. It can help people who want to get further understanding about intellectual property rights to find related research resources easily, which can also improve the international competitive ability on intellectual property rights for Taiwan researchers.
en
dc.description.provenanceMade available in DSpace on 2021-06-13T02:07:51Z (GMT). No. of bitstreams: 1
ntu-96-J94921002-1.pdf: 1750663 bytes, checksum: 16132a96fb8df153267c756da14d014c (MD5)
Previous issue date: 2007
en
dc.description.tableofcontents目 錄
口試委員會審定書…………………………………….......…….......... i
誌謝…………………………………………………………………… ii
中文摘要…………………………………………………...….….…... iii
英文摘要……………………………………………………....……… iv
目錄……….……………………..…………………………...…..….… v
圖例目錄……………………………………………………...………. vii
表格目錄……………………………………………..……………….. ix
博碩士論文授權書…………………………………………………… xi

第一章 緒論……………………………………………………… 1
1.1 研究動機…………………...…………………………….. 1
1.2 研究目的………………………………….……………… 2
1.3 文獻回顧……………………………………….………… 3
1.4 論文架構……………………………………….………… 5
第二章 背景知識介紹………………....................................…… 6
2.1 資訊檢索與文字探勘…………….........................……… 6
2.2 中文斷詞……………............................................…..…… 12
2.3 潛在語義分析(Latent Semantic Analysis)……….........… 16
第三章 研究方法與設計……………..............................…..…… 21
3.1 執行環境……………….............................................…… 21
3.2 專利樣本分析與統計………….........................………… 21
3.3 研究方法與步驟…………….................................……… 29
3.3.1 實驗流程…………..................................…….…… 29
3.3.2 實驗步驟……………...................................……… 30
3.3.3 實驗設計………..................................…….....…… 30
3.3.4 實驗問題與解決方法…………............…..……… 31
第四章 實驗結果與討論……………................................……… 34
4.1 實驗結果……………………………………………….… 34
4.2 參數建議………….............................................………… 41
4.3 比較分析…………….............................................……… 42
4.4 結果探討………….....................................................…… 43
4.5 未來發展方向………….............................................…… 47
第五章 結論………....................................................…………… 50
附錄A 淺談專利.............................................................…………… 51
A.1 專利資訊……...............................................……………… 51
A.2 專利分類…………...............................................………… 56
A.3 專利檢索…………...............................................………… 57
A.4 專利分析……………...............................................……… 58
附錄B 專利領域現況分析.................................................……… 59
B.1 專利論文研究現況……………….........................……… 59
B.2 專利研究相關組織與機構.....................................……… 61
B.3 專利搜尋系統及資料庫.........................................……… 64
附錄C 測試專利樣本列表.................................................……… 66
附錄D 論文實驗數據.........................................................……… 69
參考文獻………………………….............................................……… 92

圖 例 目 錄
圖2.1 文字探勘流程圖……………………..........………………… 8
圖2.2 準確率及回收率集合示意圖…………............…….………. 9
圖2.3 「準確率」對「回收率」示意圖……............….................…… 11
圖2.4 SVD矩陣降維運算示意圖…………………..............………. 18
圖3.1 中華民國專利公報分析欄位……………...............…..……. 23
圖3.2 「詞頻」對應「詞彙名」示意圖……................………………. 26
圖3.3 「詞頻」對應「詞頻排名」示意圖……....................…………. 27
圖3.4 「詞彙出現文章數」對應「詞彙名稱」示意圖…................…. 27
圖3.5 「詞彙出現文章數」對應「詞彙出現文章數排名」示意圖…………………………..........……………………..……. 28
圖3.6 中文檢索系統組成示意圖……….................................……. 29
圖3.7 實驗步驟流程圖.............................................................……. 30
圖4.1 K值各範圍關聯性綜合比較圖………………..............……. 34
圖4.2 K值各範圍準確率綜合比較圖………..........................……. 35
圖4.3 不同去除詞頻範圍關聯性綜合比較圖….........................…. 36
圖4.4 不同去除詞頻範圍準確率綜合比較圖…….................……. 36
圖4.5 不同去除出現文章數範圍關聯性綜合比較圖…....………. 37
圖4.6 不同去除出現文章數範圍準確率綜合比較圖…....………. 38
圖4.7 各分類去詞項目關聯性綜合比較圖.................................…. 39
圖4.8 不同去除詞性關聯性綜合比較圖.....................................…. 40
圖4.9 不同去除詞性準確率綜合比較圖.....................................…. 40
圖4.10 全國博碩士論文資訊網各分析欄位..................................…. 49
圖A.1 專利要件金字塔………….........................................………. 52
圖A.2 中華民國專利公報第I276403號首頁…….........…………. 54
圖A.3 中華民國專利公報第I276403號申請專利範圍(部分) ..... 55
圖A.4 中華民國專利公報第I276403號圖示(部分) ................…. 55
圖D.1 K值範圍取90%準確率示意圖....................................………. 70
圖D.2 K值範圍取80%準確率示意圖....................................………. 71
圖D.3 K值範圍取70%準確率示意圖....................................………. 72
圖D.4 K值範圍取60%準確率示意圖....................................………. 73
圖D.5 K值範圍取50%準確率示意圖....................................………. 74
圖D.6 K值範圍取40%準確率示意圖....................................………. 75
圖D.7 K值範圍取30%準確率示意圖....................................………. 76
圖D.8 K值範圍取20%準確率示意圖....................................………. 77
圖D.9 文章去除出現次數超過100000次詞彙準確率示意圖........ 78
圖D.10 文章去除出現次數超過19593(總文章數)次詞彙準確率示意圖..............................................................................………. 79
圖D.11 文章去除出現次數超過10000次詞彙準確率示意圖........ 80
圖D.12 文章去除出現文章數超過15000詞彙準確率示意圖........ 81
圖D.13 文章去除出現文章數超過10000詞彙準確率示意圖........ 82
圖D.14 文章去除出現文章數超過5000詞彙準確率示意圖.......... 83
圖D.15 文章去除時態標記詞彙準確率示意圖................................ 84
圖D.16 文章去除連接詞詞彙準確率示意圖.................................... 85
圖D.17 文章去除定冠詞詞彙準確率示意圖.................................... 86
圖D.18 文章去除數量詞詞彙準確率示意圖.................................... 87
圖D.19 文章去除介系詞詞彙準確率示意圖.................................... 88
圖D.20 文章去除後置詞詞彙準確率示意圖.................................... 89
圖D.21 文章去除語助詞詞彙準確率示意圖.................................... 90
圖D.22 文章去除7種詞性詞彙準確率示意圖................................. 91
表 格 目 錄
表2.1 現代漢語平衡語料庫詞類標記表……….............................. 14
表3.1 APIPA中華民國專利公報資料庫樣本採用分析列表........... 24
表3.2 樣本專利文獻詞性分類統計表……….................................. 24
表3.3 獨立詞素出現頻率前二十大統計表……... .......................... 25
表3.4 獨立詞素出現文章數前三十大統計表…….......................... 25
表3.5 教育部重編國語辭典修訂本統計表……….......................... 28
表B.1 全國博碩士論文網專利相關論文統計表….......................... 59
表B.2 本國專利公私立法人組織列表……...................................... 61
表B.3 95學年度本國大專院校智財法律系所列表…..................... 62
表B.4 本國專利相關法律事務所列表...…....................................... 62
表B.5 中華民國專利公報資料數列表……...................................... 64
表D.1 K值範圍取90%實驗結果......................................................... 70
表D.2 K值範圍取80%實驗結果......................................................... 71
表D.3 K值範圍取70%實驗結果......................................................... 72
表D.4 K值範圍取60%實驗結果......................................................... 73
表D.5 K值範圍取50%實驗結果......................................................... 74
表D.6 K值範圍取40%實驗結果......................................................... 75
表D.7 K值範圍取30%實驗結果......................................................... 76
表D.8 K值範圍取20%實驗結果......................................................... 77
表D.9 文章去除出現次數超過100000次詞彙實驗結果................ 78
表D.10 文章去除出現次數超過19593(總文章數)次詞彙實驗結果........................................................................................... 79
表D.11 文章去除出現次數超過10000次詞彙實驗結果................ 80
表D.12 文章去除出現文章數超過15000詞彙實驗結果................ 81
表D.13 文章去除出現文章數超過10000詞彙實驗結果................ 82
表D.14 文章去除出現文章數超過5000詞彙實驗結果.................. 83
表D.15 文章去除時態標記詞彙實驗結果........................................ 84
表D.16 文章去除連接詞詞彙實驗結果............................................ 85
表D.17 文章去除定冠詞詞彙實驗結果............................................ 86
表D.18 文章去除數量詞詞彙實驗結果............................................ 87
表D.19 文章去除介系詞詞彙實驗結果............................................ 88
表D.20 文章去除後置詞詞彙實驗結果............................................ 89
表D.21 文章去除語助詞詞彙實驗結果............................................ 90
表D.22 文章去除7種詞性詞彙實驗結果......................................... 91
dc.language.isozh-TW
dc.subjectConceptual Retrievalen
dc.subjectPatent Retrievalen
dc.subjectLatent Semantic Analysis(LSA)en
dc.subjectPatent Classificationen
dc.title概念式中文專利搜尋系統之研究zh_TW
dc.titleConceptual Chinese Patent Retrieval Systemen
dc.typeThesis
dc.date.schoolyear95-2
dc.description.degree碩士
dc.contributor.oralexamcommittee李肇林(Tzao-Lin Lee),陳達仁(Dar-Zen Chen),何憲仁(Nick Ho)
dc.subject.keyword專利檢索,潛在語意分析(隱含語意分析),專利分類,概念式檢索,zh_TW
dc.subject.keywordPatent Retrieval,Latent Semantic Analysis(LSA),Patent Classification,Conceptual Retrieval,en
dc.relation.page96
dc.rights.note有償授權
dc.date.accepted2007-07-02
dc.contributor.author-college電機資訊學院zh_TW
dc.contributor.author-dept電機工程學研究所zh_TW
顯示於系所單位:電機工程學系

文件中的檔案:
檔案 大小格式 
ntu-96-1.pdf
  未授權公開取用
1.71 MBAdobe PDF
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved