請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/97572完整後設資料紀錄
| DC 欄位 | 值 | 語言 |
|---|---|---|
| dc.contributor.advisor | 蔡彥卿 | zh_TW |
| dc.contributor.advisor | Yen-Chin Tsai | en |
| dc.contributor.author | 劉祖維 | zh_TW |
| dc.contributor.author | Tsu-Wei Liu | en |
| dc.date.accessioned | 2025-07-02T16:31:18Z | - |
| dc.date.available | 2025-07-03 | - |
| dc.date.copyright | 2025-07-02 | - |
| dc.date.issued | 2025 | - |
| dc.date.submitted | 2025-06-11 | - |
| dc.identifier.citation | Breiman, L. (2001). Random Forests. Machine Learning, 45, 5–32.
林孟萱 (2022),以機器學習建構分類模型應用於財務報表舞弊偵測。東吳大學會計研究所。 何啟聖 (2023),運用Boruta法篩選特徵及考慮匯率的深度學習股價預測研究。國立台北教育大學資訊科學研究所。 Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785–794. 簡佑穎 (2019),運用機器學習與計量分析進行舞弊預測。天主教輔仁大學會計研究所。 陳昆憲 (2022),以機器學習方法建構財務危機之預測模型:以台灣上市櫃公司為例。國立中央大學資訊管理學系研究所。 Kursa, M. B., & Rudnicki, W. R. (2010). Feature Selection with the Boruta Package. Journal of Statistical Software, 36(11), 1–13. | - |
| dc.identifier.uri | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/97572 | - |
| dc.description.abstract | 近年來機器學習技術運用在金融業偵測舞弊的應用越來越廣泛,目前多數場景在評估模型成效時大多使用Precision、F1-score或PR-AUC等指標,但以上指標並未將型1錯誤和型2錯誤所付出的金錢成本納入考量。因此本文使用金融機構提供的保險業務員舞弊資料集,納入成本分析的觀點,提出一個評估模型成效的新方法,並將該方法套用在隨機森林、XGBoost以及VotingClassifier三種機器學習模型上,比較哪一種模型在偵測業務員舞弊的成效最佳。另外,保險業務員舞弊資料集納入多種面向的特徵,考量特徵維度過大可能對模型預測造成負面影響,本研究使用Boruta演算法進行特徵篩選,並比較特徵篩選前後對於模型預測是否有差異。實驗結果顯示,Random Forest和VotingClassifier的表現非常接近,在使用新方法評估的成效方面皆優於XGBoost,且事前使用Boruta演算法對資料集進行特徵篩選,對於模型的預測表現有提升的效果。 | zh_TW |
| dc.description.abstract | In recent years, the application of machine learning techniques in fraud detection within the financial industry has become increasingly widespread. Model performance is commonly evaluated using metrics such as Precision, F1-score, or PR-AUC. However, these metrics do not take the monetary costs associated with Type I and Type II errors into consideration. Therefore, this study introduces a new evaluation method that incorporates cost analysis to assess model performance using fraud dataset of insurance sales agents provided by financial institution. This method is applied to three machine learning models—Random Forest, XGBoost, and VotingClassifier—to compare which model performs best in detecting insurance sales agent fraud. Additionally, the dataset used for detecting sales agent fraud includes a wide range of features. Considering that high feature dimensionality may negatively impact model performance, this study employs the Boruta algorithm for feature selection and compares the prediction results before and after feature selection. Experimental results show that Random Forest and VotingClassifier perform similarly, both outperforming XGBoost when evaluated using the proposed cost-based method. Moreover, applying the Boruta algorithm for feature selection prior to training improves the performance of the models. | en |
| dc.description.provenance | Submitted by admin ntu (admin@lib.ntu.edu.tw) on 2025-07-02T16:31:17Z No. of bitstreams: 0 | en |
| dc.description.provenance | Made available in DSpace on 2025-07-02T16:31:18Z (GMT). No. of bitstreams: 0 | en |
| dc.description.tableofcontents | 謝辭 i
摘要 ii Abstract iii 目次 iv 表次 vi 第一章 緒論 1 第一節 研究背景 1 第二節 研究動機與目的 2 第三節 論文架構 3 第二章 文獻探討 4 第一節 機器學習技術 4 第二節 評估模型成效的指標 6 第三節 特徵篩選 7 第三章 實驗方法 9 第一節 資料介紹 9 第二節 資料前處理 12 第三節 特徵篩選 15 第四節 模型建構與訓練 17 第四章 實驗與結果討論 22 第一節 實驗環境 22 第二節 參數設定 23 第三節 實驗內容 26 第五章 額外實驗 34 第一節 實驗動機 34 第二節 實驗環境 35 第三節 超參數調整 36 第四節 MLP模型參數設定 38 第五節 實驗結果分析 39 參考文獻 42 | - |
| dc.language.iso | zh_TW | - |
| dc.subject | 機器學習 | zh_TW |
| dc.subject | Boruta | zh_TW |
| dc.subject | VotingClassifier | zh_TW |
| dc.subject | XGBoost | zh_TW |
| dc.subject | 隨機森林 | zh_TW |
| dc.subject | 成本分析 | zh_TW |
| dc.subject | Machine learning | en |
| dc.subject | VotingClassifier | en |
| dc.subject | Boruta | en |
| dc.subject | XGBoost | en |
| dc.subject | Random Forest | en |
| dc.subject | Cost analysis | en |
| dc.title | 使用機器學習模型預測金融機構業務員舞弊行為-考量型I及型II錯誤機率及舞弊行為造成之損失 | zh_TW |
| dc.title | Predicting Fraudulent Behavior of Financial Institution Sales Agents Using Machine Learning Models: An Analysis of Type I and Type II Error Probabilities and Fraud-Induced Losses | en |
| dc.type | Thesis | - |
| dc.date.schoolyear | 113-2 | - |
| dc.description.degree | 碩士 | - |
| dc.contributor.coadvisor | 劉心才 | zh_TW |
| dc.contributor.coadvisor | Hsin-Tsai Liu | en |
| dc.contributor.oralexamcommittee | 李淑華;簡雪芳 | zh_TW |
| dc.contributor.oralexamcommittee | Shu-Hua Li;Hsueh-Fang Chien | en |
| dc.subject.keyword | 機器學習,成本分析,隨機森林,XGBoost,VotingClassifier,Boruta, | zh_TW |
| dc.subject.keyword | Machine learning,Cost analysis,Random Forest,XGBoost,VotingClassifier,Boruta, | en |
| dc.relation.page | 42 | - |
| dc.identifier.doi | 10.6342/NTU202501100 | - |
| dc.rights.note | 同意授權(全球公開) | - |
| dc.date.accepted | 2025-06-12 | - |
| dc.contributor.author-college | 管理學院 | - |
| dc.contributor.author-dept | 會計學系 | - |
| dc.date.embargo-lift | 2030-06-10 | - |
| 顯示於系所單位: | 會計學系 | |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-113-2.pdf 此日期後於網路公開 2030-06-10 | 852.37 kB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
