Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/54518
標題: Hadoop系統參數優化
Optimization of Hadoop System Configuration Parameters
作者: Ye-Qi Zhuo
卓也琦
指導教授: 廖世偉
關鍵字: 系統,優化,
tuning,optimization,predictor,
出版年 : 2015
學位: 碩士
摘要: 在當前big data的時代,Hadoop系統對於分析和應用大數據有著至關重要的作用,我們既希望能夠把Hadoop系統參數能夠調節到最佳的狀態又希望能夠在不花費更多在硬體的更新上。因此我的碩論的主題選擇在Hadoop系統參數的優化,在這裡主要針對希望優化的效能是在於減少單一任務的執行時間。我採用的是三段式模型:
(1)是在眾多參數中找到對於系統影響最大的參數,根據map和reduce分開觀察並選出20個參數作為我們主要要調節的參數;
(2)是建立系統時間的預測模型,根據這20個參數去搜集更多的任務執行的時間和相對應的參數作為我們建立模型的基礎,運用機器學習的方法去做建模並且選擇出最適合的三層式模型;
(3)是建立系統的優化模型,每次優化機會在設定的參數範圍內隨機選取出來參數,並且把它放到之前建好的預測的模型去預測其執行的時間,經過我設定好的優化模型最終會找到一個執行時間最短的參數組合。我總共選擇了4個程式,經過以上的方法組合去驗證。
Hadoop system is very popular recent year, which is a software framework with distributed processing large-scale data-sets by using a cluster of machines with MapReduce programming model. However, there are still two essential challenges for Hadoop users to manage the Hadoop system. (1) To tune the parameters appropriately; (2) To deal with dozens of configuration parameters which are involved to its performance. This paper will focus on optimizing the Hadoop MapReduce job performance. Our approach has two key model: Prediction and Optimization. The Prediction model is to estimate execution time of a MapReduce job and the Optimization model is to search the approximately optimal configuration parameters by invoking the prediction part repeatedly. By using an analytical method to choose approximately optimal configuration parameters to improve users’ job performance . Besides the configuration parameter tuning, the relevance of each parameters and the evaluation of our methods will also be discussed in this paper. Our paper may provide users a better method to improve the Hadoop system performance and save the hardware resource.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/54518
全文授權: 有償授權
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-104-1.pdf
  未授權公開取用
1.4 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved