請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/59158
標題: | 自我更新過程之穩健迴歸分析方法 Robust regression by self-updating process |
作者: | Chih-Hsuan Wu 吳芷瑄 |
指導教授: | 陳定立(Ting-Li Chen) |
關鍵字: | 穩健迴歸,疊代過程,均值偏移演算法, robust regression,iterative process,mean-shift, |
出版年 : | 2017 |
學位: | 碩士 |
摘要: | 由Huber (1973)提出的穩健迴歸分析方法及相關研究為現今常見的迴歸分析方法之一,其實作疊代演算法的概念是依據前一次的迴歸線更新權重,作為下一次加權最小平方法的權重。本文提出的穩健迴歸分析方法是受到Chen and Shui (2007)提出的自我更新過程群類分析演算法和Cheng (1995)的均值偏移演算法的啟發,能減少離群值對迴歸分析的影響。此方法亦是一個疊代過程,透過資料間的距離決定局部加權最小平方法的權重,再由更新的資料作為下一步的原始資料,完成自我更新過程。本文透過模擬研究展示了此方法在三種類型資料上的優異表現:有均勻雜訊的資料、重尾誤差的資料、多重迴歸模型資料。除了模擬研究外,最後引用一筆美國職業棒球大聯盟選手的薪水資料作為此方法的實際應用。 Robust regression based on an M-estimator has been developed by Huber since 1973. A common algorithm is to perform weighted least-squares in which the weights are iteratively updated according to the new fitted line. In this paper, we will present an iterative process reducing the effect from outliers. It is an extension of SUP (self-updating process) clustering algorithm (Chen and Shiu 2007) and mean-shift clustering (Cheng 1995). This process updates the weights and moves the data points to a locally fitted line in each iteration. We also provide some estimation protocols after this process converged. Simulation studies were done to show that our proposed method outperforms the traditional approach in some types of data. For example, (i) data with uniform noise, (ii) heavy-tailed noise data, and (iii) multiple linear models. The convergence problem and some simple examples will be discussed. Finally, a real data set about MLB players’ salaries is analyzed to demonstrate our method. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/59158 |
DOI: | 10.6342/NTU201701507 |
全文授權: | 有償授權 |
顯示於系所單位: | 應用數學科學研究所 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-106-1.pdf 目前未授權公開取用 | 2.63 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。