Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 工程科學及海洋工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67677
標題: 以文本特徵提升協同過濾推薦系統之準確度
Improve the Precision of Collaborative Filtering Recommender System by Content-Based Features
作者: Yi Ho
何怡
指導教授: 張瑞益(Ray-I Chang)
關鍵字: 推薦系統,協同過濾,資料稀疏性,文本內容,基於內容之特徵,
Recommender System,Collaborative Filtering,Data Sparsity,Contents,Content- Based Features,
出版年 : 2017
學位: 碩士
摘要: 目前大量網站應用都離不開推薦系統,而協同過濾式推薦系統 (CF)則是近年常被業界採用的技術,但在大量使用者或物件的情況下,若樣本資料分布過於分散,則CF將會有稀疏性問題,將難以找到真正有推薦價值的物件,勉強使用則效果不佳甚至造成錯誤。在資料過於稀疏的問題下,各常見推薦演算法的準確度皆不高,而本研究以文本特徵作為CF的額外特徵,透過添加額外特徵來降低CF的資料稀疏程度,以突顯出較值得推薦之物件作為推薦結果,並將此方法命名為CFWCB (Collaborative Filtering With Content-Based features),在時間、空間複雜度不變的情況下,最大化利用可取得之資訊,以降低資料稀疏程度為目標,並比較文本特徵抽取方法在CFWCB下的準確度提升程度及其所需成本。本研究利用痞客邦真實資料集進行實驗,比較各相關推薦演算法在此資料集之準確度,以及CFWCB在利用各種不同特徵抽取方法或特徵來源產生之文本特徵於推薦準確度及推薦結果的影響。實驗發現,基礎CF較其餘方法準確,而CFWCB則是可以再大幅提升準確度,其中利用專家定義特徵結合文章內容有著最多的準確度提升,可將準確度提升至基礎CF的兩倍,而利用機器學習Doc2Vec對文章標題抽取特徵則是可將準確度提升到接近基礎CF的兩倍,除了可以節省專家定義所需的人力消耗外,準確度提升效果也僅略低於專家定義特徵,缺點則是各特徵較無獨立意義,推薦解釋性較不直覺,在近年機器學習技術日益提升的背景下,相信未來可以找到取代專家定義特徵且效果更好的機器學習特徵抽取方法;對於兩種特徵抽取方法的選擇則可視使用情境調整:較高的推薦準確率及推薦解釋性或是以機器取代人力、降低人力消耗,各有其優缺點。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67677
DOI: 10.6342/NTU201702004
全文授權: 有償授權
顯示於系所單位:工程科學及海洋工程學系

文件中的檔案:
檔案 大小格式 
ntu-106-1.pdf
  目前未授權公開取用
1.91 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved