請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/64209
標題: | 增強人眼觀賞舒適度之三維影像優化高速硬體實現-以可現場程式化邏輯為基礎 High Speed FPGA-based Hardware Implementation of 3D Video Optimization for Human Visual Comfort Enhancement |
作者: | Chi-Ping Lin 林其平 |
指導教授: | 陳中平(Chung-Ping Chen) |
關鍵字: | 立體三維,雙眼視差,視差估計,深度圖繪圖法,可程式化邏輯陣列,同步動態隨機存取記憶體,高解析度多媒體介面, Stereo and 3D,binocular parallax,disparity estimation,depth image base rendering (DIBR),FPGA,SDRAM,HDMI, |
出版年 : | 2012 |
學位: | 碩士 |
摘要: | 雙眼視覺系統同時間能夠顯示兩張不同的影像讓左右兩眼接收,使得使用者有更為真實的觀感。因此如何提供使用者愉快舒適的觀賞經驗將會變成一個重要的主題。
本篇論文中,我們會先由人因實驗的結果分析視覺疲勞產生的原因。其中深度資訊的感受會對人類的視覺系統產生最大的影響,所以必須被控制在適當的範圍內。接下來,我們利用幾何學的模型來推論三維空間(物件存在空間)與二維空間(影像顯示空間)的轉換。並藉此深入探討來進一步的獲得深度(視差)和相機拍攝參數的關係。我們利用視差估計來搜尋兩張畫面間的深度資訊,並且產生深度圖。然後使用基於深度圖繪圖法同時融合視差與參數的關係來回復調整過後的影像。 為了處理伴隨著立體影像所帶來的大量資料,我們所挑選的現場可程式化邏輯陣列版(消費性電子影像套件)包括大容量的同步動態隨機存取記憶體。另一個目的是為了和高解析度多媒體介面傳輸接軌。因此硬體實現的重點會被放在如何設計架構來配合這兩個問題。我們的硬體架構會透過高解析度多媒體介面傳輸來展現出演算法的結果,同時也代表了對於同步動態隨機存取記憶體的成功操作。 此系統在可程式化邏輯陣列板上,可以對於1080逐行掃描的視訊顯示格式達到每秒 1.72 張畫面處理。視差搜尋範圍為[-15,+14]。暫存器數目為6,844個。查找表的數目為9,339個。邏輯數目為8,859個。所使用的靜態隨機存取記憶體為 30,000位元。 Stereo video can make users sense depth perception by showing two frames to each eye simultaneously. It can give users vivid information about the scene structure. However, to provide a comfortable view experience on 3DTV must become the main topic. In this thesis, we analyze the visual fatigue reason by the human factor experiments firstly. The depth information will do major impact on the human visual system. It must be controlled in an appropriate range. Secondly, we utilize the geometry model to obtain the transformation between 3D (object space) and 2D (screen space). Besides, the relation between depth (parallax) and camera parameters was revealed by going deep into the model. We use Disparity Estimation (DE) to search the difference among the two frames. It will export disparity maps for frames rendering. Then, Depth Image Base Rendering (DIBR) which merged the relation is used to reconstruct the modified frames. In order to process the stereo video with the huge amounts of data, the FPGA boards (CVK) we chose includes SDRAMs which are with large capacity. Another reason is to suit the HDMI standard transmission. The point of hardware implementation is the architecture design for the two reasons. The architecture of our system can display algorithm result through HDMI signal. It also represent the SDRAMs are successfully accessed. The system on FPGA board can achieve 1.72 frames per second (fps) in 1080p display format, with DE search range of [-15,+14] in horizontal direction. Registers count is 6.844K. LUTs count is 9.339K. Logic count is 8.859K. The SRAM size is 30K bits. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/64209 |
全文授權: | 有償授權 |
顯示於系所單位: | 電子工程學研究所 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-101-1.pdf 目前未授權公開取用 | 3.1 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。