Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 理學院
  3. 數學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/57501
標題: 張量結構數據的降維
Dimension Reduction for Tensor Structure Data
作者: Po-Yao Niu
牛柏堯
指導教授: 陳宏(Hung Chen)
共同指導教授: 杜憶萍(I-Ping Tu)
關鍵字: 主成分分析,多線性主成分分析,結構主成分分析,張量,漸進,效度,
PCA,MPCA,SPCA,tensor data,asymptotic,efficiency,
出版年 : 2014
學位: 碩士
摘要: 隨著科技的進步,資料蒐集的方式進入了另一個新的階段,龐大且複雜的資料也帶給分析師更大的挑戰。而面對大數據時,資料降維在統計推論上就成了一個非常關鍵的步驟。
主成分分析(PCA)該是目前最廣為人知,對向量資料降維方法;其將高維度資料投射至一個較低維度的空間,並且讓資料中的特徵在新的空間中是彼此不相關的,但實際操作上,PCA 會因為較少的樣本數量和較大的特徵空間而變得不穩定,效度變低。多線性主成分分析(MPCA)則常被用來降低像是矩陣形式資料、或是一般擁有張量結構資料的維度;其將資料的空間視為幾組向量的克羅內克爾積(Kronecker product),以有效運用少量的參數,但是他的降維結果並無法保證特徵之間的相關性。
在此篇論文當中,我們提供了一個透過兩階段來對張量結構資料降
維的方法,稱之為結構主成分分析(SPCA),並且希望藉由此方法結
合PCA 和MPCA 各自的優點。SPCA 在第一階段中使用MPCA 降低原
始資料的維度,並且在第二階段中將資料的張量核心值(socres of core tensors)向量化,再做一次PCA。我們比較了SPCA 和PCA 的漸進效度(asymptotic efficiecy),並且證明在某些條件底下,SPCA 將擁有較佳的漸進效度。我們也使用模擬以及實際的資料檢驗了SPCA、MPCA和PCA 對張量結構降維的實作效果,而結果也顯示SPCA 的確是一個很有潛力的方法。
The advances of technologies have created a new era for data collections that the data size and its complexity becomes very challenging to data analysts. Dimension reduction is a key process for statistical inference when
facing huge data set.
Principal component analysis (PCA) may be the most popular dimension reduction method for vector data. PCA projects the data to a lower space and the features become uncorrelated in the new space, but, in reality, it could
be inefficient due to small sample size and large feature dimension. Multilinear principal component analysis (MPCA) has been proposed to reduce the dimension for tensor structure data, including matrix data. MPCA models the space as Kronecker products of vectors to use the parameters in a more efficient way, but it might have correlated scores.
In this thesis, we proposed a two-stage dimension reduction method, called structure PCA (SPCA), aiming to combine the advantages of PCA and MPCA. SPCA employs MPCA on the original data in the first step, and then applies PCA on the vectorized core scores in the second step. The statistical efficiency comparisons between PCA and SPCA are made and SPCA has been proved to have better asymptotic efficiency under some conditions. The performance of PCA, MPCA and SPCA are checked for both simulation and real data and SPCA is shown to be a promising method for huge tensor structure data.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/57501
全文授權: 有償授權
顯示於系所單位:數學系

文件中的檔案:
檔案 大小格式 
ntu-103-1.pdf
  目前未授權公開取用
2.06 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved