Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電機工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28796
標題: 架構於雲端之平行化密度分群演算法
CDBSCAN:Cloud Based DBSCAN Clustering Algorithm
作者: Tze-Yu Chen
陳則諭
指導教授: 陳銘憲(Ming-Syan Chen)
關鍵字: 分群演算法,平行式演算法,分散式演算法,雲端運算,Hadoop,
Clustering Algorithms,Parallel Algorithms,Distributed Algorithms,Cloud Computing,Hadoop,
出版年 : 2011
學位: 碩士
摘要: DBSCAN是一個頗負盛名的密度分群演算法,它的特色是可以在充滿雜訊的環境中找到具有任意形狀的群體。然而當資料的規模愈來愈大時,因為單一的電腦很難在效能上有所提升,DBSCAN無法有效率地處理這大量的資料。雲端運算在近期逐漸發長成熟,他可以幫助我們處理傳統演算法在面對大量資料時效率不佳的問題。
在這篇論文裡,我們提出了CDBSCAN演算法,CDBSCAN代表以雲端(Cloud)為基礎的DBSCAN演算法,它是一個分散式版本的DBSCAN演算法,並且被實施在一個雲端的平台上─Hadoop。我們利用Map/Reduce的工作將在各個區間的資料做分群,並且將這些各自的分群結果做整合,成為最後地分群結果。我們的實驗顯示CDBSCAN是一個高度平行化的演算法,他只需要一個Map/Reduce的工作,並達到趨近於線性的擴展性。
DBSCAN is one of the well-known density-based clustering algorithms which can identify clusters with arbitrary shape in a noisy space. However, when the scales of the data become larger and larger, DBSCAN is unable to process the data efficiently due to the difficulty of a single machine to scale up. Recently, the development of cloud computing is gradually mature which can help us manage the issue of scalability. In this thesis, we propose an algorithm CDBSCAN, standing for cloud based DBSCAN, which is a distributed version of DBSCAN and is implemented on the Hadoop platform. We use Map/Reduce jobs to cluster the partitioned data set and merge the individual clustering results. The experimental evaluations show that CDBSCAN is a highly parallel algorithm that only requires one Map/Reduce job and achieves near-linearly scalability.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28796
全文授權: 有償授權
顯示於系所單位:電機工程學系

文件中的檔案:
檔案 大小格式 
ntu-100-1.pdf
  未授權公開取用
613.87 kBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved