請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/65151
標題: | 基於Cassandra資料庫之雲端資料建模:從SQL到NoSQL Data Modeling in Cloud with Cassandra: From SQL to NoSQL |
作者: | Yi-Hsiung Chen 陳義雄 |
指導教授: | 郭斯彥(Sy-Yen Kuo) |
關鍵字: | 非關聯式資料庫,分散式資料庫,雲端資料處理,資料建模, NoSQL,Cloud Data Management,Apache Cassandra,Non-relational Database,Distributed Database, |
出版年 : | 2012 |
學位: | 碩士 |
摘要: | 隨著雲端運算的快速發展,以及社群網站(例如:Facebook、Twitter)的興盛,越來越多的資料儲存在「雲」上。傳統上對於資料儲存及管理的問題主要是透過關聯式資料庫(例如:MySQL)來解決,但是當伺服器的資源不足以應付過於龐大的資料時,我們就必須利用「垂直拓展」來克服,也就是升級伺服器的運算能力,或是加大硬碟儲存空間。垂直拓展的最大問題就是成本昂貴,在雲端運算的時代,資料增加的速度非常驚人,因此伺服器很可能沒過多久就必須再次升級。而「水平拓展」是比較好的方式,在運算叢集中增加伺服器數量,來取代單一機器的升級。可惜的是,傳統的關聯式資料庫由於資料模型的限制,對於水平拓展的支援能力並不好,因此「非關聯式」的資料庫應運而生。
非關聯式資料庫(例如:Cassandra)的特色是分散式以及資料模型的自由度,也因此通常都具備了高可得性、高延展性、高效能、以及不會發生單點故障的問題。有越來越多的企業考慮將傳統的資料庫轉換成非關聯式,但轉換的過程卻不是那麼的容易。第一個問題是資料模型的重建,在關聯式的模型設計時,往往是從資料的實體(entity)以及各個實體間的關聯(relation)著手,但在非關聯式的世界,我們卻應該先思考這個系統要提供哪些查詢功能(query),再進一步設計資料模型來最佳化查詢的速度。第二個問題是資料的轉移,企業在轉移之前,往往已經累積了數以萬計的資料,這些資料要以什麼樣的方式轉移到新的資料庫中,也是個相當值得研究的問題,但非關聯式資料庫的研究尚嫌不足,文獻資料非常缺乏,也提高了實作的難度。 本論文以一個業界的實際案例作為出發點,針對以上兩個問題提出詳細的探討,並對於如何將MySQL資料庫上的資料轉移到Cassandra資料庫,以實作配合效能評估來作為理論的佐證,希望能做為未來在非關聯式資料庫研究人員的參考。 |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/65151 |
全文授權: | 有償授權 |
顯示於系所單位: | 電機工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-101-1.pdf 目前未授權公開取用 | 3.53 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。