請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40212
標題: | 頻繁子空間之資料探勘 Mining Frequent Subspaces |
作者: | Yun-Ru Wang 王韻茹 |
指導教授: | 李瑞庭 |
關鍵字: | 資料探勘,子空間探勘,子空間分群,頻繁子空間,貪婪演算法,品質,涵蓋率, data mining,subspace mining,subspace clustering,frequent subspace,greedy algorithm,quality,coverage, |
出版年 : | 2008 |
學位: | 碩士 |
摘要: | 隨著資料維度以及資料量增加,以全部資料維度為主的分群方法仍有很大的改善空間。因此,近來子空間分群的方法愈來愈受到重視。在本篇論文中,我們提出一個創新的子空間探勘方法,它同時能看到所有頻繁子空間的全貌。我們所提出的方法包括三個步驟。首先,我們將所有的資料點投影到二維空間,並產生許多頻繁子空間;然後,我們將這些頻繁子空間結合,形成更大的頻繁子空間;最後,我們採用貪婪演算法做總結,從所產生的所有頻繁子空間中選出重要的子空間。實驗結果顯示,我們提出的方法在品質和涵蓋率方面,皆優於FIRES和DUSC這兩個方法。 As both the number of dimensions and the amount of data increase, existing clustering methods in the full feature space are not good enough to cluster the data in databases. Thus, the subspace clustering has attracted more and more attention recently. In this thesis, we proposed a novel subspace mining method which can simultaneously consider all frequent subspaces to select the significant subspaces. The proposed method consists of three phases. First, we project all data points onto each pair of dimensions and generate frequent subspaces. Second, we join frequent subspaces to form larger ones. Finally, we adopt a greedy algorithm to summarize the frequent subspaces found and select the significant subspaces. The experimental results show that our proposed method outperforms the FIRES and DUSC methods in terms of quality and coverage. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40212 |
全文授權: | 有償授權 |
顯示於系所單位: | 資訊管理學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-97-1.pdf 目前未授權公開取用 | 440.81 kB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。