Please use this identifier to cite or link to this item:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79582| Title: | O-SAFE:應用於機器學習之自動化特徵工程建構 Construction of O-SAFE (One-Stop Auto-Feature Engineering) for Machine Learning |
| Authors: | Chun-Tai Yen 顏均泰 |
| Advisor: | 吳文方(Wen-Fang Wu) |
| Keyword: | 機器學習,自動化機器學習,特徵工程,工業4.0,數位轉型, Machine learning,AutoML,Feature Engineering,Industry 4.0,Digital transformation, |
| Publication Year : | 2021 |
| Degree: | 博士 |
| Abstract: | 2020年起全球COVID-19疫情擴散,迫使工廠實施作業分流,造成生產線上人力的短缺,而製造業供應鏈體系也出現難以預料的趨勢變化,迫使企業必須加速實現數位轉型。數位轉型帶來大量的數據化過程,機器學習儼然成為處理工業數據重要方法之一,其中特徵工程更是決定機器學習結果最關鍵的程序。傳統特徵工程是運用有經驗人員的領域知識來構建數據特徵,其程序作法對企業而言是繁瑣且耗時的,因此發展自動化特徵工程為目前發展主要趨勢。本研究提出One-Stop Auto-Feature Engineering (O-SAFE),以特徵生成、特徵選擇和特徵評估來產生自動化特徵工程架構,不僅能在特徵生成上兼顧數值型及類別型特徵,也能同時包含時間、領域和關聯等特徵資料樣態。在特徵選擇上,則以統計分析方法處理因自動化特徵生成過程所衍生之大量新特徵,增加篩選有效特徵之執行速度。O-SAFE更重要的是以特徵評估方法來解決特徵生成後,過多高度關聯的特徵影響模型產生過度擬合,使得訓練資料集在模型訓練上準確度高、測試資料集於驗證時卻準確度大幅降低的問題。本研究以一組製造設備的實際數據與二組開源數據來驗證所提出之O-SAFE,其結果顯示所生成之有效特徵數量比傳統方法多出近一倍,準確度也比專家人工處理的結果提高8.8%;O-SAFE在特徵選擇與特徵評估做法上,避免特徵訓練產生的過度擬合問題,也比其他自動化特徵工程結果提高準確率10.7%。綜整O-SAFE在特徵生成類別型特徵的數量上、特徵選擇的執行速度與特徵評估解決特徵過度擬合等問題上,皆能顯示其優越性。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79582 |
| DOI: | 10.6342/NTU202103196 |
| Fulltext Rights: | 同意授權(全球公開) |
| Appears in Collections: | 工業工程學研究所 |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| U0001-1509202117313400.pdf | 4.79 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
