請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/74777| 標題: | 具有語義引導的特徵學習並應用於視覺化影像生成 Semantics-Guided Representation Learningwith Applications to Visual Synthesis |
| 作者: | Jia-Wei Yan 顏嘉緯 |
| 指導教授: | 王鈺強 |
| 關鍵字: | 影像生成,特徵學習,深度學習,機器學習,電腦視覺, Image generation,Representation learning,Deep learning,Machine learning,Computer vision, |
| 出版年 : | 2019 |
| 學位: | 碩士 |
| 摘要: | 學習可解釋的特徵表示一直是感興趣的主題之一。 大多數現有的研究不能容易地生成或操縱特徵表示,並通過插值生成具有特定語義的圖像。 在本文中,我們提出了一個角度三元組鄰居函數(ATNL),它能夠導出其分佈與語義資訊匹配的潛在特徵表示。 利用ATNL引導的潛在特徵空間,我們進一步利用球面語義內插來生成語義變化的圖像。 我們對MNIST和CMU Multi-PIE數據集的實驗證實了我們的ATNL和球形語義內插對最近的表示學習模型的有效性和強大性。 Learning interpretable representations has been among the topics of interest. Most existing works cannot easily generate or manipulate latent representations which semantically match the images of interest via interpolation. In this paper, we propose an Angular Triplet-Neighbor Loss (ATNL), which is able to derive latent representations whose distribution would match the semantic information. With the latent space guided by ATNL, we further utilize spherical semantic interpolation for generating semantic warping of images. Our experiments on both MNIST and CMU Multi-PIE datasets confirm the effectiveness and robustness of our ATNL and spherical semantic interpolation over recent representation learning models. |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/74777 |
| DOI: | 10.6342/NTU201904354 |
| 全文授權: | 有償授權 |
| 顯示於系所單位: | 電信工程學研究所 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-108-1.pdf 未授權公開取用 | 6.88 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
