請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/16886
標題: | 針對異質領域適應之線性分辨式映射方法 Linear Discriminative Projections for Heterogeneous Domain Adaptation |
作者: | Wen-Chieh Fang 方文杰 |
指導教授: | 許永真 |
關鍵字: | 資料映射,特徵學習,領域適應,監督式分類,機器學習, data projections,feature learning,domain adaptation,supervised classification,machine learning, |
出版年 : | 2014 |
學位: | 博士 |
摘要: | 通常收集有標記的資料所耗費的成本是高昂的. 而另一方面, 有時候
我們在相關領域會擁有較多的標記資料. 如果沒有足夠的訓練資料, 一 些分類器如最鄰近結點演算法(kNN) 或者支持向量機(SVM) 就不容易 達到較佳的分類效果. 在這一篇論文裡, 我們研究利用少許的目標領域 的標記資料與數量相對較多的來源領域的標記資料, 來提昇對於目標領 域的分類結果. 我們假設來源領域與目標領域擁有不同的特徵空間. 此 外, 這兩個領域也假設沒有明顯的共同特徵, 但擁有相同的標記空間. 利用其他領域資料的一個關鍵技術在於找出兩個映射的函數, 使得 在來源空間與目標空間的資料可以被映射至一個共同的空間. 在這一篇 論文, 我們提出一個簡易又直覺的方法, 稱為線性分辨式映射, 來處理這 個問題. 首先, 我們使用分辨方法如線性判別分析(LDA), 將來源領域的 資料依據標記做分群. 接著使用回歸技術(regression) 將目標領域的標 記資料盡可能地映射到與自己相同標記的來源資料群體的中心. 最後, 我們再一次使用分辨方法將所有的標記資料都依據標記做分群. 實驗結 果顯示, 在重要的資料集中, 我們的方法於少量標記資料的監督式分類 上學習具分辨能力的特徵是有效益的. It is often expensive to collect labeled data and we sometimes have large amounts of labeled data in a related domain. Without enough training data, some classifiers such as k-Nearest Neighbor (kNN) or Support Vector Machine (SVM) may fail to achieve good classification performance. In this thesis, we consider the problem of utilizing few labeled data samples in a target domain and the data samples in a source domain to improve data classification in the target domain. We assume that the source and target domains have different feature spaces. In addition, the two domains are assumed to share no explicit common features but have the same set of class labels. A key technique for leveraging the data from another domain is to find two mapping functions so that the source and target spaces can be projected on a common space. In this thesis, we present a simple and intuitive technique called linear discriminative projections to address the problem. First, we separate the source data of distinct classes by using a discriminative method such as Linear Discriminative Analysis (LDA). We then apply a regression technique to map each labeled target data instance as close as possible to the center of the source data group with the same class label. Finally, we again use a discriminative method to separate all the data of distinct classes. Experimental results on some benchmark datasets clearly demonstrate that our approach is effective for learning discriminative features for supervised classification with few training target data. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/16886 |
全文授權: | 未授權 |
顯示於系所單位: | 資訊工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-103-1.pdf 目前未授權公開取用 | 468.88 kB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。