Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 管理學院
  3. 會計學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/97572
標題: 使用機器學習模型預測金融機構業務員舞弊行為-考量型I及型II錯誤機率及舞弊行為造成之損失
Predicting Fraudulent Behavior of Financial Institution Sales Agents Using Machine Learning Models: An Analysis of Type I and Type II Error Probabilities and Fraud-Induced Losses
作者: 劉祖維
Tsu-Wei Liu
指導教授: 蔡彥卿
Yen-Chin Tsai
共同指導教授: 劉心才
Hsin-Tsai Liu
關鍵字: 機器學習,成本分析,隨機森林,XGBoost,VotingClassifier,Boruta,
Machine learning,Cost analysis,Random Forest,XGBoost,VotingClassifier,Boruta,
出版年 : 2025
學位: 碩士
摘要: 近年來機器學習技術運用在金融業偵測舞弊的應用越來越廣泛,目前多數場景在評估模型成效時大多使用Precision、F1-score或PR-AUC等指標,但以上指標並未將型1錯誤和型2錯誤所付出的金錢成本納入考量。因此本文使用金融機構提供的保險業務員舞弊資料集,納入成本分析的觀點,提出一個評估模型成效的新方法,並將該方法套用在隨機森林、XGBoost以及VotingClassifier三種機器學習模型上,比較哪一種模型在偵測業務員舞弊的成效最佳。另外,保險業務員舞弊資料集納入多種面向的特徵,考量特徵維度過大可能對模型預測造成負面影響,本研究使用Boruta演算法進行特徵篩選,並比較特徵篩選前後對於模型預測是否有差異。實驗結果顯示,Random Forest和VotingClassifier的表現非常接近,在使用新方法評估的成效方面皆優於XGBoost,且事前使用Boruta演算法對資料集進行特徵篩選,對於模型的預測表現有提升的效果。
In recent years, the application of machine learning techniques in fraud detection within the financial industry has become increasingly widespread. Model performance is commonly evaluated using metrics such as Precision, F1-score, or PR-AUC. However, these metrics do not take the monetary costs associated with Type I and Type II errors into consideration. Therefore, this study introduces a new evaluation method that incorporates cost analysis to assess model performance using fraud dataset of insurance sales agents provided by financial institution. This method is applied to three machine learning models—Random Forest, XGBoost, and VotingClassifier—to compare which model performs best in detecting insurance sales agent fraud. Additionally, the dataset used for detecting sales agent fraud includes a wide range of features. Considering that high feature dimensionality may negatively impact model performance, this study employs the Boruta algorithm for feature selection and compares the prediction results before and after feature selection. Experimental results show that Random Forest and VotingClassifier perform similarly, both outperforming XGBoost when evaluated using the proposed cost-based method. Moreover, applying the Boruta algorithm for feature selection prior to training improves the performance of the models.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/97572
DOI: 10.6342/NTU202501100
全文授權: 同意授權(全球公開)
電子全文公開日期: 2030-06-10
顯示於系所單位:會計學系

文件中的檔案:
檔案 大小格式 
ntu-113-2.pdf
  此日期後於網路公開 2030-06-10
852.37 kBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved