請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79582| 標題: | O-SAFE:應用於機器學習之自動化特徵工程建構 Construction of O-SAFE (One-Stop Auto-Feature Engineering) for Machine Learning |
| 作者: | Chun-Tai Yen 顏均泰 |
| 指導教授: | 吳文方(Wen-Fang Wu) |
| 關鍵字: | 機器學習,自動化機器學習,特徵工程,工業4.0,數位轉型, Machine learning,AutoML,Feature Engineering,Industry 4.0,Digital transformation, |
| 出版年 : | 2021 |
| 學位: | 博士 |
| 摘要: | 2020年起全球COVID-19疫情擴散,迫使工廠實施作業分流,造成生產線上人力的短缺,而製造業供應鏈體系也出現難以預料的趨勢變化,迫使企業必須加速實現數位轉型。數位轉型帶來大量的數據化過程,機器學習儼然成為處理工業數據重要方法之一,其中特徵工程更是決定機器學習結果最關鍵的程序。傳統特徵工程是運用有經驗人員的領域知識來構建數據特徵,其程序作法對企業而言是繁瑣且耗時的,因此發展自動化特徵工程為目前發展主要趨勢。本研究提出One-Stop Auto-Feature Engineering (O-SAFE),以特徵生成、特徵選擇和特徵評估來產生自動化特徵工程架構,不僅能在特徵生成上兼顧數值型及類別型特徵,也能同時包含時間、領域和關聯等特徵資料樣態。在特徵選擇上,則以統計分析方法處理因自動化特徵生成過程所衍生之大量新特徵,增加篩選有效特徵之執行速度。O-SAFE更重要的是以特徵評估方法來解決特徵生成後,過多高度關聯的特徵影響模型產生過度擬合,使得訓練資料集在模型訓練上準確度高、測試資料集於驗證時卻準確度大幅降低的問題。本研究以一組製造設備的實際數據與二組開源數據來驗證所提出之O-SAFE,其結果顯示所生成之有效特徵數量比傳統方法多出近一倍,準確度也比專家人工處理的結果提高8.8%;O-SAFE在特徵選擇與特徵評估做法上,避免特徵訓練產生的過度擬合問題,也比其他自動化特徵工程結果提高準確率10.7%。綜整O-SAFE在特徵生成類別型特徵的數量上、特徵選擇的執行速度與特徵評估解決特徵過度擬合等問題上,皆能顯示其優越性。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79582 |
| DOI: | 10.6342/NTU202103196 |
| 全文授權: | 同意授權(全球公開) |
| 顯示於系所單位: | 工業工程學研究所 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| U0001-1509202117313400.pdf | 4.79 MB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
