請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/17899
標題: | 應用於立體匹配演算法之稀疏感知卷積神經網路加速器 Sparsity Aware CNN Accelerator for Stereo Matching |
作者: | Tan Huang 黃丹 |
指導教授: | 陳良基(Liang-Gee Chen) |
關鍵字: | 立體匹配,稀疏感知加速器, stereo matching,sparsity aware accelerator, |
出版年 : | 2020 |
學位: | 碩士 |
摘要: | 人類對於擴增實境頭戴式顯示器與自主移動機器人的需求不斷的增加,其中,為了預測深度,立體匹配是在這些應用中很重要的部分。除了準確度以外,高運算效率及高能源效率也是在有限資源下設計立體匹配加速器需要被考慮的重要部分。 在本論文中,我們提出了一個應用於立體匹配演算法之稀疏感知卷積神經網路加速器,我們的硬體架構設計的特色包括一個四層的記憶體映像階層及一條正向傳輸路徑,前者能夠有效率的支援在高稀疏度的立體匹配演算法中常見的運算,後者能夠支援稀疏感知跳躍連接,並減少動態隨機存取記憶體訪問次數。 我們的架構可以在 960×540 的解析度下提供每秒6.9幀的深度預測,與稠密加速器及最先進的稀疏感知加速器相比,分別有15及1.63倍的加速。另外,此架構相較於最先進的稀疏感知加速器可以減少53% 動態隨機存取記憶體訪問次數。 Augmented reality headsets and mobile autonomous robots have increased in demand. Among these applications, stereo matching is one of the most critical component to estimate depth. Besides accuracy, high performance and energy efficiency are also important design considerations for stereo matching accelerators with limited resources. In this thesis, a sparsity aware CNN architecture for stereo matching is proposed. The features of the architecture include a 4-level memory mapping hierarchy for efficiently supporting common operations in stereo matching network with high sparsity and a forwarding path for supporting sparsity aware skip connection with low DRAM access. Our architecture can support videos in resolution 960×540 with a throughput 6.9 fps, which is 15 times and 1.63 times speed up compared to dense accelerator and state-of-the-art sparsity aware accelerator respectively. In addition, our architecture can reduce DRAM access by 53% compared to state-of-the-art sparsity aware accelerator. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/17899 |
DOI: | 10.6342/NTU202003340 |
全文授權: | 未授權 |
顯示於系所單位: | 電子工程學研究所 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
U0001-1308202022453300.pdf 目前未授權公開取用 | 5.3 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。