請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/56456
標題: | 以多層次舒爾法在 CPU-GPU 叢集上解大型稀疏線性系統 Hybrid Hierarchical Schur Solvers for Large Sparse Linear Systems on CPU-GPU Cluster |
作者: | Che-Ming Chu 朱哲明 |
指導教授: | 王偉仲 |
關鍵字: | 線性系統,圖形處理器,舒爾法,巢狀分割法,直接法,疊帶法, linear system,GPU,schur complement method,nested dissection method,direct method, |
出版年 : | 2014 |
學位: | 碩士 |
摘要: | 隨著科技的進步,單核心電腦運算速度已經快要達到上限值,所以現在電腦都朝著多核心運算發展,因此科學計算也須跟著發展出平行運算。在科學計算中,大型稀疏線性系統一直以來都扮演了極為重要的角色。我們討論的方法是對一般稀疏矩陣,而我們使用的方法是利用巢狀分割法重排稀疏矩陣,以利於以舒爾法來平行解線性系統。但我們的只完成對稱正定矩陣的程式。
因為BLAS3對全滿矩陣運算在GPU上運算相當的快,也因為舒爾補矩陣幾乎都是全滿矩陣,又因為全滿矩陣通常較適合直接法,所以在本篇文章中,我們全部是以直接法解線性系統,並不會以疊代法解舒爾補矩陣。但這樣就需要計算出完整的舒爾補矩陣,這會帶來三點問題:第一,需要大量記憶體來儲存舒爾補矩陣;第二,分解舒爾補矩陣所需的時間會非常多。所以,我們需發展出一套方法來解決以上二點問題。 巢狀分割法能夠重排矩陣,使矩陣分成一部分可完全平行而另一部分不容易平行分解。而巢狀分割法重排矩陣有著特殊的性質,能夠使得舒爾補矩陣仍然與重排後的矩陣有相同的結構,也就是說舒爾補矩陣也有可以平行的部份(但可平行的效果會越來越差),因此我們想利用此一性質,來增加平行效果。 CPUs have reached their clock rate limits due to physical constrains. Parallel computers are increasingly used to achieve higher computing performances. How computational algorithms and codes can take advantages of parallel computers thus become more and more important. In scientific computing, solving large sparse general linear systems is one of critical problem. The nested dissection recording can reorder a sparse matrix to allow parallelism of triangular factorization on block sub-matrices. The key of this approach is how we solve embedded linear system corresponding to the Schur complement. While existed methods solve this embedded linear system iteratively, we carefully study the hierarchical of the Schur complement so that we can use direct methods to solve the embedded linear system recursively. We demonstrate the advantage of our approach by focusing on an implementation on CPU-GPU hybrid system for symmetric positive definite linear systems. Numerical results suggest the proposed hierarchical Schur method is promising in small or large parallel computer cluster with many-core accelerators. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/56456 |
全文授權: | 有償授權 |
顯示於系所單位: | 數學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-103-1.pdf 目前未授權公開取用 | 5.45 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。