請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/3984
標題: | 使用輔助向量的雙邊特徵分群以改善中文新聞的立場偵測分類 Two-side Feature Clustering Using Auxiliary Vector for Improving Stance Classification on Chinese Newspaper |
作者: | Wei-Ming Chen 陳韋銘 |
指導教授: | 林守德(Shou-De Lin) |
關鍵字: | 立場偵測,中文新聞立場偵測,特徵合併,自然語言處理,機器學習, stance classification,stance classification on Chinese newspaper,feature clustering,natural language processing,machine learning, |
出版年 : | 2016 |
學位: | 碩士 |
摘要: | 為了紓解媒體偏頗以及閱聽者選擇性偏好的現象,本篇論文專注於發展一智慧程式,用以分辨中文爭議性議題新聞之立場。我們提出一個簡單且有效率的方法,能夠考量無標記新聞資料庫的資訊、以及訓練資料之資訊,以合併相似的特徵。在我們提出的方法中,特徵會先根據初始訓練過程被分為兩邊,接著使用word2vec工具為每一個特徵產生輔助向量,最後使用高速的社群偵測演算法將意義上相近的特徵合併。實驗結果顯示,在大多數的情況下,我們提出的解決方案比直接使用原始特徵、以及使用常見的降維演算法還要好。 In order to relieve media bias problem and selective preference problem, we aim at developing an intelligent system to classify the stance of Chinese news article on several controversial topics. We proposed a simple and efficient approach which can incorporate the information of unlabeled news corpus and the information of training data to merge similar features. In our approach, features were divided into two sides according to initial training process, and word2vec tool was utilized to produce auxiliary vectors for each feature. Finally, fast community detection algorithm was applied for clustering similar features. Experimental results show that our approach outperforms raw features and common dimensionality reduction techniques in most cases. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/3984 |
全文授權: | 同意授權(全球公開) |
顯示於系所單位: | 資訊工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-105-1.pdf | 1.02 MB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。