請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/63353
標題: | CPU-GPU混合系統上QR分解的區塊大小調整 Tuning Block Size for QR Factorization on CPU-GPU Hybrid Systems |
作者: | Yaohung Tsai 蔡曜鴻 |
指導教授: | 王偉仲(Weichung Wang) |
共同指導教授: | 陳瑞彬(Ray-Bing Chen) |
關鍵字: | GPU,QR分解,自動調校, GPU,QR Factorization,Auto Tuning, |
出版年 : | 2012 |
學位: | 碩士 |
摘要: | 在CPU-GPU的混合系統中,因為MAGMA的QR分解採用的固定區塊大小造成CPU的閒置。為了增進效能,我們提出了一個自動調校區塊大小的方法。首先,將CPU和GPU上的子程式分別建立各自的迴歸模型。再來,我們使用了一個最佳化方法來決定最好的區塊大小。目標函數的設計是針對降低CPU和GPU閒置造成的效能損失。最後,我們提出了數值結果來展示我們的方法得到的效能提升。 In CPU-GPU hybrid systems, the QR factorization in MAGMA re- sults in CPU idle due to the xed block size. To improve the computa- tional e ciency of MAGMA QR factorization, we propose a dynamic block size auto-tuning scheme on CPU-GPU hybrid systems. Our approach is a data-driven approach. First we model the CPU and GPU costs in MAGMA QR factorization via two independent regression models based on collecting training data. Next, according to these tting models, we propose a block size optimization scheme to tune the block size adaptively and therefore to minimize a cost objective function. The cost objective function is designed to balance the workloads between CPU and GPU based on the performance models. Several numerical results demonstrate the performance gains due to the novel QR factorization algorithm. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/63353 |
全文授權: | 有償授權 |
顯示於系所單位: | 數學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-101-1.pdf 目前未授權公開取用 | 936.06 kB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。