Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 生物資源暨農學院
  3. 農藝學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/60705
標題: 基於不平衡資料進行支援向量機的高斯核函數之參數選擇
Efficient selection of Gaussian kernel SVM parameters for imbalanced datasets
作者: Yu-Jing Chang
張育菁
指導教授: 蔡政安(Chen-An Tsai)
關鍵字: 支援向量機,不平衡資料集,閾值調整,ROC 曲線,偏差調整,參數挑選,
Support Vector Machine (SVM),imbalanced datasets,threshold adjustment,ROC curve,bias adjustment,parameter selection,
出版年 : 2020
學位: 碩士
摘要: 現實中,我們時常看到類別不平衡的資料,即其中一個類別其樣本數相較於其他類別特別低,然而這類型的類別通常也是我們所感興趣的。傳統上的分類器由於未考慮類別不平衡的情況,因此面對這類型的資料,分類器容易把資料歸類於多數量類別 (majority class)。在本次研究中,針對不平衡資料我們採用支援向量機 (support vector machine, SVM ) 並使用高斯核函數 (Gaussian kernel) 進行二元分類,為了改進 SVM 的分類效果與整體效率,我們考慮兩個問題: 不平衡的類別與參數選擇。在第一個問題中,我們基於調整閾值的概念提出兩個新方法,分別為 ROC-SVM 與 b-SVM;而在第二個問題中,我們提出一個快速且簡單的方法來挑選 SVM 的參數,且該方法並未使用交叉驗證。本研究中使用真實資料與模擬資料來評估我們所提出的方法,而結果顯示在大部分的情況下,ROC-SVM與 b-SVM 表現皆優於先前的方法,且整體運算時間也有明顯下降。
Skewed class distributions often occur in a wide variety of real datasets in which at least one of classes has relatively small number of observations, usually the class of interest. A classifier induced by such an imbalanced dataset has typically high accuracy for majority class and poor prediction for the minority class. In this study, we focus on SVM classifier with Gaussian radial basis kernel for a binary classification problem. In order to take advantage of SVM and to achieve the best generalization ability with satisfying prediction power, we will address two important problems: imbalanced datasets and parameters selection. In the first problem, we proposed two novel adjustment methods, ROC-SVM and b-SVM, for adjusting the cutoff threshold of SVMs. In the second problem, we propose a fast and simple approach to optimize model parameters of SVMs without carrying out extensive k-folds cross validation. Extensive comparison with standard SVM and well-known existing methods are carried out to evaluate the performance of our proposed algorithms using simulated datasets and real datasets. The experimental results show that our proposed algorithms outperform over-sampling techniques and existing SVM-based solutions.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/60705
DOI: 10.6342/NTU202001289
全文授權: 有償授權
顯示於系所單位:農藝學系

文件中的檔案:
檔案 大小格式 
U0001-0307202010591500.pdf
  目前未授權公開取用
2.7 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved