請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81177| 標題: | 普適型相對重要性分析及其應用 Comprehensive Relative Importance Analysis and Its Applications |
| 作者: | Zixin Shen 沈子欣 f01546034 |
| 指導教授: | 陳正剛(Argon Chen) |
| 關鍵字: | 多重共線性,變數排序,變數選擇,高維數據分析,小樣本問題,非滿秩,相對權重,相對重要性,典型相關分析,多變異分析,多對多分析,半導體良率分析,基因表現型資料分析, Collinearity,Variable ranking,Variable selection,High dimensional data analysis,Small sample size,Singularity,Relative weight,Relative importance,Canonical correlation analysis,Multivariate analysis,Many-to-many analysis,Semiconductor yield analysis,Gene expression data analysis, |
| 出版年 : | 2021 |
| 學位: | 博士 |
| 摘要: | 複回歸模型中某個獨立變數的相對重要性(Relative importance)的定義為,這個獨立變數 (independent variables) 對相依變數 (dependent variable) 變異的相對解釋能力。當各個獨立變數之間互不相關(uncorrelated)時,標準化回歸係數(standardize regression coefficient) 即可代表各變數的相對重要性,而當各獨立變數相關性較大時,即存在多重共線性時,沒有辦法再使用標準化回歸係數來看變數間的相對重要性。針對多重共線性情形,文獻上使用Dominance index [1]和Relative weight [2]來找出各獨立變數之間的相對重要性。另一方面,上述兩種相對重要性指標所針對的是複回歸模型,即一群解釋變數與一個被解釋變數之間的關係,稱之為一對多(one-to-many)關係,現實中往往需要研究一群變數與另一群變數之間的關係,這樣的問題稱為多對多(many-to-many)關係,LeBreton [3]和Hong[4]分別利用典型相關分析 (canical correlation analysis) 建立多對多關係,將Relative weight發展到多對多層面,以考量在多對多相關關係下各個變數的相對重要性,稱為“多對多相對重要性”。 在一對多關係中,Dominance index和Relative weight對資料的前提假設為樣本夠大(樣本量大於獨立變數個數),且獨立變數之間是線性獨立(linear independent)的,這種假設忽視了兩種情況,一是資料是樣本足夠,但獨立變數之間是線性相關(linear dependent)的,另一種情況樣本數 (n) 小於甚至遠小於獨立變數之個數 (p),即高維度資料(n≪p)。同樣的,在多對多關係的分析,LeBreton [3]和Hong [4]也忽略了兩種情形,一是資料雖有足夠大樣本資料,但是兩群變數中至少有一群變數是線性相關的,另一種是兩群變數中至少有一群變數個數小於樣本量。本文即是分別針對一對多和多對多關係中,建構適用於雖樣本夠大卻非滿秩情形及樣本量不夠大的情形下各個變數的普遍型相對重要性指標。也在解決這些問題後,首次將相對重要性方法應用到變數選擇問題的應用領域。 本文使用模擬案例闡明所建構的一對多及多對多普適型相對重要性指標,並利用基因表現及半導體電信測試資料的實際案例分析驗證其在變數選擇上的應用效力,案例結果顯示本文所建構的相對重要性指標具有很好的適用性與準確性。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81177 |
| DOI: | 10.6342/NTU202102080 |
| 全文授權: | 同意授權(限校園內公開) |
| 顯示於系所單位: | 工業工程學研究所 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| U0001-0408202114481800.pdf 授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務) | 1.67 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
