請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/6722
標題: | 個人相片檢索系統之多模式對話使用者介面 Multi-modal Dialogue User Interface for A Personal Photo Retrieval System |
作者: | Hsiu-Wen Hsueh 薛琇文 |
指導教授: | 李琳山 |
關鍵字: | 對話,相片檢索,對話管理員,主動學習,加強學習,馬可夫決策程序模型,部份觀測馬可夫決策程序模型, dialog,photo retrieval,dialog manager,active learning,reinforcement learning,Markov decision process,partially observable Markov decision process, |
出版年 : | 2012 |
學位: | 碩士 |
摘要: | 本論文提出將口語對話系統(Spoken Dialogue System)的觀念技術用在台大語音實驗室的個人相片檢索系統上,目標是利用系統與使用者之間的多模式對話(Multi-modal Dialogue)互動,幫助使用者更方便且快速的找到自己想要的相片。論文中首先嘗試基於規則的對話系統,並參考在主動學習(Active Learning)領域中常用的分數來設計系統規則。接下來用兩種機器學習的方法,第一種是馬可夫決策程序模型(Markov Decision Process),搭配即時動態規劃(Real-time Dynamic Programming)演算法來做模型訓練。實驗比較三種不同主題分類數的系統狀態,分別搭配不同主題分類或相片的系統動作;當使用主題分類作為系統動作時,實驗中還比較隨機挑選相片與用主動學習分數挑選相片兩種方法的結果。第二種是部份觀測馬可夫決策程序模型(Partially Observable Markov Decision Process),並且使用高斯程序(Gaussian Process)來估算策略值函式。實驗也比較三種不同主題分類數的系統狀態與系統動作,並且使用主動學習分數挑選相片。本論文還進一步嘗試增加擴展查詢詞(Query Expansion)的系統動作,並使用在上述兩種方法上,亦即馬可夫決策程序模型和部份觀測馬可夫決策程序模型上。最後我們並實作混合發動(Mixed Initiative)的對話系統,並且發現適當的讓使用者擁有回答問題以外的動作選擇,的確可以讓系統學習得更好。 |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/6722 |
全文授權: | 同意授權(全球公開) |
顯示於系所單位: | 資訊工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-101-1.pdf | 4.41 MB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。