請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/75943完整後設資料紀錄
| DC 欄位 | 值 | 語言 |
|---|---|---|
| dc.contributor.author | 陳淑美 | zh_TW |
| dc.date.accessioned | 2021-07-01T08:16:38Z | - |
| dc.date.available | 2021-07-01T08:16:38Z | - |
| dc.date.issued | 1992 | |
| dc.identifier.citation | Ⅰ.中日文部份 一、圖書 於光先主編。經濟大辭典。上海:辭書出版社,1983年。 山東大學經濟系資料室編。全國主要報紙經濟資料索引(1977-1980)。山東:編者,1983年。王省吾。圖書分類法導論。臺北:私立中國文化大學,民71年。北京語言學院教學研究所編。現代漢語頻率詞典。北京:編者,1983 行政院研究發展考核委員會編。社會科學分類之研究。臺北:編者,民73年。何光國。圖書資訊組織原理。臺北:三民,民79年。 袁坤祥、馬景賢編。財政論文分類索引。臺北:成文,民56年。袁坤祥、馬景賢編。貨幣金融論文分類索引。臺北:成文,民56年。 袁坤祥、馬景賢編。經濟論文分類索引。臺北:成文,民56年。 許滌新主編。政治經濟學辭典。(北京):人民出版社,1987年。楊士仁。透視經濟新聞。臺北:聯經,民78年。 賴永祥編訂。中國圖書分類法。臺北:編者,民70年。 劉英茂,莊仲仁,王守珍編。常用中文詞的出現次數。臺北:六國,民? 二.期刊論文 王永成,蘇海蘭,莫燕。「中文詞的自動處理」。中文資訊學報第4卷第4期(1990年3月),頁1-11。 王良志等。「以剖析為導向的中文斷詞法」。電子發展月刊163期(民80年7月),頁40-43。 王德進,張社英,劉源。「漢語言的幾個統計規律」中文資訊學報第1卷第4期(1988年1月),頁33-39。 李連揮。「索引典與索引方法」。圖書館學與資訊科學月刊3卷2期(民66年10月),頁46-56。 登田清,熊谷惠理,昄東達夫。「SGMI 文書構造ェティタ」。National Technical Report 36:5 (Oct.1990): 597-603。 豐田清等。「日本語文書の文書型定義入ヵ機能を持つSGML文書構造ェティタ」。1991年畫像電子學會年次大會予稿:131-134。鄭英春統,秦蓓。「漢語處理的基礎工程--現代漢語詞頻統計」中文資訊學報第1卷第1期(1987年2月)頁17-25 劉湧泉。「再讀詞的問題」。中文資訊學報第2卷第2期(1988年4月),頁47-50。 Ⅱ、西文部份 一、Books Craven, Timothy C. String Indexing. Orlando Florida: Academic Press, c1986. Dewey, melvil. Dewey Decimal Classification and Relative Index. New York: Lake Placid Club, 1985. Feihberg, Hilda ed. Indexing Specialized Formats and Subject. Mutuchen, MewJersey and London: Scarecrew Press, 1983. Glichrist, Alan. Classification and Subject Indexing. British Librarianship and Information Science, 1971-1975. Jones, Karen Sparck. Automatic Keyword Classification for Information Retrieval. London: Archon Books, 1971. Milstead, Jessica L. Subject Access Systems: Alternatives in Design. Orlando, Florida: Academic Press, 1984. Salton, Gerard. Automatic Text Processing. New York: Addison Wesley, c1989. Soergel, Dagobert. Indexing Languages and Thesauri: Construction and Maintenance. Calfornia: Melville Pub., c1974. Vickery, B. C. Classification and Indexing in Science. London Butter Worth, c1975. 二、Articles Aitchison, Jean. A Classification as a Source for Thesaurus: the Bibliographic Classification of H. E. Bliss as a Source of Thesaurus Terms and Structure. Journal of Doucmentation 42:3 (Sep.1986) 160-181. Anderson, Barbara E. and Wilson, Carol B. Database Indexing, in Hilda Feihberg ed., Indexing Specialized Formats and Subject. Mutuchen, New Jersey and London: Scarcrew Press (1983): 34-51. Anderson, James D. Essential Decisions in Indexing System Design, in Hilda Feihberg ed., Indexing Specialized Formats and Subject. Mutuchen, New Jersey and London: Scarecrew Press (1983): 1-21. Barnes, C. I., L. Costantini and S. Perschke. Automatic Indexing Using the SLC-Ⅱ System. Information Processing and Management 14 (1978): 107-119. Benjamin, William A. The Design of a Full-text Company Information Database for Multi-vendor Delivery. in National Online Meeting 1983: Proceedings of the Fourth National Online Meeting New York, April 12-14, 1983: 33-37. Edmundson, H. P. and R. E. Wyllys. Automatic Abstracting and Indexing--Survey and Recommendation. Communication of the ACM 4: 5 (May 1961): 226-234. Edmundson, H. P. Problems in Automatic Abstracting. Communication of the ACM 7: 4 (April 1964): 259-263. Feinberg, Hilda. The Thesaurus in Indexing and Searching: A Review. in Hilda Feinberh ed., Indexing Specialized Formats and Subject (Mutuchen, New Jersey and London: Scarecrew Press, 1983): 260-281. Field, B. J. Automatic Indexing for Multilingual Systems. in Third European Congress on Information Systems and Networks (Overcoming the Language Barrier: Luxembourg, 3-6 May 1977, vol.1): 469-472. Field, B. J. Towards Automatic Indexing Automatic Assignment of Controlled-language Indexing and Classification from Free Indexing. Journal of Documentation 31: 4 (Dec.1975): 246-265. Greengress, Alan R. Indexing at the New York Times Information Service. in Hilda Feinberg ed., Indexing Specialized Formats and Subject (Mutuchen, New Jersey and London: Scarecrew Press, 1983): 180-188. Guntzer, V. et al. Automatic Thesaurus Construction by Machine Learning from Retrieval Sessions. Information Processing and Management 25: 3 (1989): 265-273. Guy Louis Gavet. A Mathematical Formulation of Keyword Compression for Thesauri. Information Processing and Management 13: 3 (1977): 189-200. Harter, Stephen P. Statistical Approaches to Automatic Indexing. Drexel Library Quarterly 14: 2 (April 1978) 57-74. Hodges, Pauline R. Keyword in Title Index: Effectiveness of Retrieval in Computer Searches. Special Libraries 74: 1 (Jan. 1983): 56-60. J., Blosseville M., et al. Automatic Document Classification: Natural Language Processing, Statistical Analysis, and Expert System Techniques Used Together. in SIGIR '92: Proceedings of the Fifteenth Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Denmark Copenhagen, June 21-24, 1992: 51-57. Jacobs, Paul S. and Lisa F. Rau. SCISOR: Extracting Information from On-line News. Communication of the ACM 33: 11 (Nov.1990): 88-97. Joana, Kristensen, and Jarvelin-Kalervo. The Effectiveness of a Searching Thesaurus in Free-text Searching in a Full-text Database. International Classification 17: 2 (1990): 77-84. Julie, Denny. McGraw-Hill News: Finding Real-time Information Online. Database 11: 6 (Dec. 1988): 90-92. Kar, Gautam. A Distance Measure for Automatic Document Classification by Sequential Analysis. Information Processing and Management 14: 2 (1978): 57-69. Komorous, Hana. International Aspects of Bibliographic Control of Newspapers. Cataloging and Classification Quarterly 8: 2(1987/1988): 5-13. Lewis, David D. An Evaluation of Phrasal and Clustered Representations on a Text Categorization Task. in SIGIR '92 Processings of the Fifteenth, Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Denmark: Copenhagen, June 21-24, 1992: 37-50. Masand, Brij, Gordon Linoff and David Waltz. Classifying News Stories Using Memory Based Reasoning. in SIGIR '92: Proceedings of the Fifteenth Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Denmark: Copenhagen, June 21-24, 1992: 59-65. Michael, Chinworth. Dipping into the Japanese Information Well: Nikkei Telecom's Japan News and Retrieval. Database 12: 2 (April 1989): 27-32. Milstead, Jessica L. Newspaper Indexing: the Offical Washington Post Index. in Hilda Feihberg ed., Indexing Specialized Formats and Subject (Mutuchen, New Jersey and London: Scarcrew Press, 1983): 189-204. Mischo, William H. A Computer-produced Newspaper Index. Journal of Library Automation 10:1 (May 1977): 41-52. Mischo, William H. An Augemented Keyword Index to Abstracting and Indexing Services. The Journal of Academic Librarianship 3: 3 (July 1977): 141-145. Morris, Jane, Graeme Hirst. Lexical Cohesion Computed by Thesaural Relations as an Indicator of the Structure of Test. Computational Linguistics 17:1 (1990): 21-48. Morrison, Doreen. Documentation Note: Index to the Times. Journal of Documentation 42: 3 (Sep. 1986): 189-195. Morrison, Doreen. Index to the Times of London: an Evaluation and Comparative Analysis. Serials Librarian 13: 1 (Sep. 1987): 89-106. O'leary, Mick. Compuserve and the Source: Databanks for the End-user. Database 8:2 (June 1985): 100-106. O'leary, Mick. Dow Jones News/Retrieval: A Online Design for Business and Finance. Database 8:4 (Dec.1985): 97-103. Pemberton, Jeffery K. DIALOG is Sold ... and The Transaction Draws from Online Users. Online 12:5 (Sep.1988): 6-7. Popovich, Charles J. A Methodology for Categorizing International Business Literature Through Online Bibliographic Searching. Online Review 7: 4 (Aug. 1983): 341-355. Preschel, Barbara M. Indexing Encyclopedia. in Hilda Feihberg ed., Indexing Specialized Formats and Subject (Mutuchen, New Jersey and London: Scarcrew Press, 1983): 205-225. Qiu, Liwen. Applicability of String Indexing to the Chinese Language with Special Reference to NEPBIS. International Classification 16: 2 (1989): 89-94. Roda, Roy. Connecting and Evaluating Thesauri: Issues and Cases. International Classification 14: 2 (1987): 63. Rothman, John. Is Indexing Obsolete Keyword Indexing and Freetexting Searching. in Hilda Feinberg ed., Indexing Specialized Formats and Subject (Mutuchen, New Jersey and London: Scarcrew Press, 1983): 22-33. Rush, J. E., R. Salvador and A. Zamora. Automatic Abstracting and Indexing--Production of Indicative Abstracts by Application of Contextual Inference and Syntactic Conference Criteria. Journal of the ASIS 22: 4 (July-Aug.1964): 260-274. Schulte-Albert, Hans G. Classificatory Thinking from Kinner to Wilkins: Classification and Thesaurus Construction, 1645-1688. Library Quarterly 49:1 (1979): 42-64. Takano, Fumio. The Online Information Service in JICST and the Special Characteristics of the Japanese Language: Implementation of Automation Processing of Japanese. in 5th-International Online Information Meeting (London: 8-10 December, 1981): 74-79. Ward, Edith. Starting from Scratch: the Design of a Periodical Indexing Service. in Hilda Feinberg ed., Indexing Specialized Formats and Subject (Mutuchen, New Jersey and London: Scarcrew Press, 1983): 238-249. Yeh, Ching-Long and Hsi-Jian Lee. Rule-based Word Identification for Mandarin Chinese Sentence--a Unification Approach. Computer Processing of Chinese and Oriental Language 5:2 (March 1991): 97-119. | |
| dc.identifier.uri | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/75943 | - |
| dc.description.abstract | 本研究的目的,乃在於探究利用電腦將財經新聞自動分類之可性。藉由國外發展的各種統計方怯,來瞭解中文新聞資料中,詞彙與新聞及類別之問的關係,及各種統計方式在中文處理上的差異性,以工商時報2870篇財經新聞為實例,分析出各小類專業詞彙的數量、出現頻率、分佈狀態等特性,以支援用專有詞彙作為學習語料(training corpus)的理論基礎。並藉此研究歸納出人工分類與機械分類之問處理邏輯的異同,以提供日後資料庫更新維護的改進方向。 本論文是以工商時報民國80年7月至8l年1月間2870篇見報之相關新聞作為抽樣統計的主體,分類範圍限於產業、商業、電機、機械、資訊等五大類,共46小類,實驗方式是將抽取樣本全部予以人工分類,並劃分為學習組(2583篇)和測試組(287篇)兩大部份,分別進行各項統計分析,最後紅比較各種自動分類方怯的效果;從實驗中發現,採用詞彙標準化頻率統計法的方式較為簡易,就整體而言,電腦自動分類的正確率也較高。 根據研究結果可得到以下結論: 1.從本論文中可以發現,利用電腦儲存新聞,並作自動分類處理,確實是個可行的新作法,只要將學習語料的數量擴充,使詞彙總數趨於穩定,並修改統計缺失,當可使正確率提高,不過人工分類在實驗?看來,仍有其價值存在,如何使機械和人工分類邏輯判斷方式更契合,則有待日後努力。 2.中文資料雖不似英文般有明顯的空白區隔,但藉助發展漸趨成熟的中文斷詞系統,仍可以解決中文詞彙選取的問題。 3.自動分類的方式雖無法百分之百和專家分類的結果相符,但如果有足夠的學習語料,還是能有不錯的成績,且人工分類有因人而有不同的分法,藉由自動分類的精神,也可以減少人為分類的主觀偏差。 | zh_TW |
| dc.description.provenance | Made available in DSpace on 2021-07-01T08:16:38Z (GMT). No. of bitstreams: 0 Previous issue date: 1992 | en |
| dc.description.tableofcontents | 第一章 緒論 第一節 研究綠起……1 第二節 報紙儲存新趨勢……3 第三節 研究動機……4 第四節 研究目的……5 第五節 研究方法與步驟……6 第六節 名詞解釋……7 第二章 文獻分析 第一節 分類學……11 第二節 自動分類和自動索引……14 第三節 資料庫系統發展現況……19 第三章 自動分類法 第一節 基本概念……27 第二節 關鍵詞的選取……28 第三節 實驗程式……29 第四節 詞彙與類別的向量模式……32 第四章 研究設計與方法 第一節 研究對象……38 第二節 抽樣方式與研究方法……39 第三節 實驗範圍……40 第四節 實驗部份……41 第五章 自動分類實驗 第一節實驗(一):電腦自動選取雙連字串..........……44 一、樣本統計...................……44 二、實驗步驟..............…45 三、統計公式............……46 四、實驗結果討論...............................……47 第二節實驗(二):人工建立詞彙檔................……52 一、取樣範圍與限制....................……52 二、詞彙篩選.............……53 (一)、詞彙類別一致性評估(Conformity Consideration) (二)、詞彙集中度評估(Entropy Consideration) 三、統計方怯..................……60 (一)、原始頻率統計.........................……60 (二)、標準化頻率統計.......................……63 (三)、詞彙比重分析.........................……64 (四)、距離計算怯..........................……65 四、實驗結果討論........................………66 (一)、原始頻率統計法...............……67 (二)、標準化頻率統計法.....................……74 (三)、詞彙比重統計怯...................……82 第六章 結論與建議 第一節 研究結論....................……93 第二節 建議....................................……94 第三節 進一步研究之建議...........................……95 參考書目 附件(一)日本經濟新聞分類表 (二)新聞稿樣本 (三)電腦無法分類的學習樣本群 (四)各類詞彙頻率詳表 | |
| dc.language.iso | zh-TW | |
| dc.title | 財經新聞自動分類之研究 | zh_TW |
| dc.date.schoolyear | 81-2 | |
| dc.description.degree | 碩士 | |
| dc.relation.page | 149 | |
| dc.rights.note | 未授權 | |
| dc.contributor.author-dept | 文學院 | zh_TW |
| dc.contributor.author-dept | 圖書館學研究所 | zh_TW |
| 顯示於系所單位: | 圖書資訊學系 | |
文件中的檔案:
沒有與此文件相關的檔案。
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
