Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/51029
標題: Bi-perceptron 分類中文網頁新聞
Bi-perceptron for Chinese Web News Categorization
作者: Jian Pan
潘健
指導教授: 劉長遠(Cheng-Yuan Liou)
關鍵字: bi-perceptron ??法,中文网?新?分?,文本分?,?督??,
bi-perceptron learning,Chinese web news categorization,text classification,supervised learning,
出版年 : 2016
學位: 碩士
摘要: 新闻因为其高频的访问属性,在中国大陆已经成为了各大互联网公司追逐的领 域。而新闻分类一直是新闻自动处理中的一项主要议题。有很多的监督式学习方法 可以应用在这一领域,其中,支持向量机在离散的特征空间上表现尤为出色。本文 中提出 bi-perceptron 的思路去解决基本的二分类问题,希望在某些方面达到甚至 超过支持向量机的效果。
Bi-perceptron 学习法是一种分而治之的思想,本文中提出这种思想,并实现了 一种基本的解决方法。我们将分类转化成数据划分,基本分类,分类合成三个步骤 并比较了不同划分及合成方法。另外,本文从中文网络新闻的基本处理流程出发, 分析了分词方法,关键词提取数量,基本分类器规则化方法,数据划分个数等对分 类结果的影响。最终,我们也给出了在时间和空间上都比较好的 bi-perceptron 学习 方法。
Mobile news, due to its natural attributes of high frequency, has become a popular
area pursued by many commercial companies in China. News categorization is an important technology in news automatic process. Many supervised learning methods can be applied in this area, where Support Vector Machine(SVM) achieves the state-of-art performance with discrete features. This paper provides the idea of bi-perceptron learning to solve the binary-class classification problem in the hope of achieving comparable or even better results than SVM.
Bi-perceptron learning is a divide-and-conquer idea. We proposed this idea in this paper and realized a basic approach of it. We divided the classification problem into three steps: data partition, base classification and aggregation and compared different partition and aggregation methods. Moreover, we analyzed the effect of word segmentation methods, keywords number, the regularization of base classifiers and partition number on the categorization performance. Finally, we find an approach of bi-perceptron learning that is perfect in both time and memory consumption.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/51029
DOI: 10.6342/NTU201600400
全文授權: 有償授權
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-105-1.pdf
  目前未授權公開取用
2.69 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved