Skip navigation

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets

Learn More
DSpace logo
English
中文
  • Browse
    • Communities
      & Collections
    • Publication Year
    • Author
    • Title
    • Subject
    • Advisor
  • Search TDR
  • Rights Q&A
    • My Page
    • Receive email
      updates
    • Edit Profile
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67246
Title: 使用多模態深層自編碼器融合視覺與語音特徵強化個人相片之語意檢索
Semantic Retrieval of Personal Photos Using Multimodal Deep Autoencoder Fusing Visual and Speech Features
Authors: Hung-Tsung Lu
盧宏宗
Advisor: 李琳山
Keyword: 影像檢索,語音標註,分佈式詞彙表示法,段落向量,卷積式類神經網路,深層自編碼器,隨機漫步,融合特徵,
image retrieval,speech annotation,distributed word representation,paragraph vector,convolutional neural network,deep autoencoder,random walk,fused features,
Publication Year : 2017
Degree: 碩士
Abstract: 本論文主要探討的是在加入使用者稀疏語音標註的條件下,進行個人相片語意檢索(semantic retrieval of personal photos)的方法。由於近年數位相機以及智慧型手機等行動裝置十分普及,使用者通常會快速累積大量的個人相片,如何有效率的對數量龐大的相片資料庫進行瀏覽與檢索是一個十分重要的問題。一般使用者通常偏好使用語意式查詢指令(semantic query)來對相片進行搜尋,例如:「母親節聚餐」。但機器基本上沒有能力掌握相片中攜帶的這類語意,除非使用者加以標註,因此我們設定在使用者拍攝相片的同時,可以使用麥克風針對相片進行語音標註;這樣會較鍵盤輸入文字便利許多,但使用者並不會將所有的照片皆加上語音標註。因此本論文將主題設定為使用者輸入稀疏語音標註條件下之個人相片語意檢索,意即僅有少數相片標上語音標註的情境。
本論文選擇使用以主題模型為基礎的實作方式,引入數種以深層學習為基礎的特徵抽取法,利用深層卷積式類神經網路對相片進行影像特徵抽取,同時使用分佈式詞彙表示法及段落向量模型針對相片語音標註的詞圖分別進行語音特徵抽取,最後以多模態深層自編碼器的主題模型,針對影像及語音特徵進行整合,並以此模型訓練出具備「潛藏主題」的瓶頸向量建構檢索模型。
此外,本論文亦將從主題模型檢索出的首次檢索結果(first-pass retrieval results),使用字詞頻率期望值、局部與全域影像特徵、深層卷積式類神經網路影像特徵、段落向量與多模態自編碼器瓶頸特徵分別計算相片之間的相似度,再套用隨機漫步模型(random walk) 演算法,使相似度高的相片獲得相近的相關分數(relevance score),進而達成重新排序的效果,使整體檢索效能更進一步的提
升。
最後,為使後續研究能夠更順利進行,本論文在最後將微軟COCO圖片標題資料庫加以中文化,並且將此中文版語料建檔,做為後續研究之用。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67246
DOI: 10.6342/NTU201700762
Fulltext Rights: 有償授權
Appears in Collections:資訊工程學系

Files in This Item:
File SizeFormat 
ntu-106-1.pdf
  Restricted Access
5.24 MBAdobe PDF
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved