Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電機工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/65151
標題: 基於Cassandra資料庫之雲端資料建模:從SQL到NoSQL
Data Modeling in Cloud with Cassandra: From SQL to NoSQL
作者: Yi-Hsiung Chen
陳義雄
指導教授: 郭斯彥(Sy-Yen Kuo)
關鍵字: 非關聯式資料庫,分散式資料庫,雲端資料處理,資料建模,
NoSQL,Cloud Data Management,Apache Cassandra,Non-relational Database,Distributed Database,
出版年 : 2012
學位: 碩士
摘要: 隨著雲端運算的快速發展,以及社群網站(例如:Facebook、Twitter)的興盛,越來越多的資料儲存在「雲」上。傳統上對於資料儲存及管理的問題主要是透過關聯式資料庫(例如:MySQL)來解決,但是當伺服器的資源不足以應付過於龐大的資料時,我們就必須利用「垂直拓展」來克服,也就是升級伺服器的運算能力,或是加大硬碟儲存空間。垂直拓展的最大問題就是成本昂貴,在雲端運算的時代,資料增加的速度非常驚人,因此伺服器很可能沒過多久就必須再次升級。而「水平拓展」是比較好的方式,在運算叢集中增加伺服器數量,來取代單一機器的升級。可惜的是,傳統的關聯式資料庫由於資料模型的限制,對於水平拓展的支援能力並不好,因此「非關聯式」的資料庫應運而生。
非關聯式資料庫(例如:Cassandra)的特色是分散式以及資料模型的自由度,也因此通常都具備了高可得性、高延展性、高效能、以及不會發生單點故障的問題。有越來越多的企業考慮將傳統的資料庫轉換成非關聯式,但轉換的過程卻不是那麼的容易。第一個問題是資料模型的重建,在關聯式的模型設計時,往往是從資料的實體(entity)以及各個實體間的關聯(relation)著手,但在非關聯式的世界,我們卻應該先思考這個系統要提供哪些查詢功能(query),再進一步設計資料模型來最佳化查詢的速度。第二個問題是資料的轉移,企業在轉移之前,往往已經累積了數以萬計的資料,這些資料要以什麼樣的方式轉移到新的資料庫中,也是個相當值得研究的問題,但非關聯式資料庫的研究尚嫌不足,文獻資料非常缺乏,也提高了實作的難度。
本論文以一個業界的實際案例作為出發點,針對以上兩個問題提出詳細的探討,並對於如何將MySQL資料庫上的資料轉移到Cassandra資料庫,以實作配合效能評估來作為理論的佐證,希望能做為未來在非關聯式資料庫研究人員的參考。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/65151
全文授權: 有償授權
顯示於系所單位:電機工程學系

文件中的檔案:
檔案 大小格式 
ntu-101-1.pdf
  未授權公開取用
3.53 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved