Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 工業工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79582
標題: O-SAFE:應用於機器學習之自動化特徵工程建構
Construction of O-SAFE (One-Stop Auto-Feature Engineering) for Machine Learning
作者: Chun-Tai Yen
顏均泰
指導教授: 吳文方(Wen-Fang Wu)
關鍵字: 機器學習,自動化機器學習,特徵工程,工業4.0,數位轉型,
Machine learning,AutoML,Feature Engineering,Industry 4.0,Digital transformation,
出版年 : 2021
學位: 博士
摘要: 2020年起全球COVID-19疫情擴散,迫使工廠實施作業分流,造成生產線上人力的短缺,而製造業供應鏈體系也出現難以預料的趨勢變化,迫使企業必須加速實現數位轉型。數位轉型帶來大量的數據化過程,機器學習儼然成為處理工業數據重要方法之一,其中特徵工程更是決定機器學習結果最關鍵的程序。傳統特徵工程是運用有經驗人員的領域知識來構建數據特徵,其程序作法對企業而言是繁瑣且耗時的,因此發展自動化特徵工程為目前發展主要趨勢。本研究提出One-Stop Auto-Feature Engineering (O-SAFE),以特徵生成、特徵選擇和特徵評估來產生自動化特徵工程架構,不僅能在特徵生成上兼顧數值型及類別型特徵,也能同時包含時間、領域和關聯等特徵資料樣態。在特徵選擇上,則以統計分析方法處理因自動化特徵生成過程所衍生之大量新特徵,增加篩選有效特徵之執行速度。O-SAFE更重要的是以特徵評估方法來解決特徵生成後,過多高度關聯的特徵影響模型產生過度擬合,使得訓練資料集在模型訓練上準確度高、測試資料集於驗證時卻準確度大幅降低的問題。本研究以一組製造設備的實際數據與二組開源數據來驗證所提出之O-SAFE,其結果顯示所生成之有效特徵數量比傳統方法多出近一倍,準確度也比專家人工處理的結果提高8.8%;O-SAFE在特徵選擇與特徵評估做法上,避免特徵訓練產生的過度擬合問題,也比其他自動化特徵工程結果提高準確率10.7%。綜整O-SAFE在特徵生成類別型特徵的數量上、特徵選擇的執行速度與特徵評估解決特徵過度擬合等問題上,皆能顯示其優越性。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79582
DOI: 10.6342/NTU202103196
全文授權: 同意授權(全球公開)
顯示於系所單位:工業工程學研究所

文件中的檔案:
檔案 大小格式 
U0001-1509202117313400.pdf4.79 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved