Please use this identifier to cite or link to this item:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28029
Title: | 查詢獨立與查詢相關排名機制之研究 Ranking Documents by Query Independent and Query Dependent Models |
Authors: | Hsuan-Yu Lin 林軒宇 |
Advisor: | 陳信希(Hsin-Hsi Chen) |
Keyword: | 排序學習,區域排序模型,查詢相關排序,效能評估, learning to rank,local models,query dependent ranking,evaluation, |
Publication Year : | 2011 |
Degree: | 碩士 |
Abstract: | 現今搜尋排序學習 (Learning To Rank) 的技術已被廣泛使用於資訊檢索和網路搜尋系統中。傳統的排序模型常使用單一搜尋排序模型來對所有查詢字串的文件做排名,因為所有查詢字串都使用相同的排序模型,我們稱此為查詢獨立排序模型 (Query independent ranking model); 然而透過這種方式建立的排序模型並未充份利用查詢字串本身的特性,因此我們提出演算法,依據查詢字串的特性來調整排序模型,由此得到查詢相關排序模型 (query dependent ranking models)。
我們提出單一的架構來研究此議題。架構中,首先使用分群演算法將訓練資料集切割成許多子集,再從子集中訓練出不同的子排序模型,我們稱為子排序模型為區域模型 (local model);之後,我們提出四個以區域排序模型為基礎的查詢相關排序模型,使用這些排序模型來整合不同區域排序模型的排序結果,並決定最後的文件排名。 我們的架構著重討論三大議題─查詢表示 (Query Representation)、分群演算法 (Data Clustering)和排名函式 (Ranking Function),其中研究內容包含使用不同的查詢字串表示將查詢字串轉換成一個向量或表示的形式,兩種主要的分群演算法對訓練資料分群以學習區域排序模型,透過排名函式將區域排序模型的排名結果用不同的方式進行分數的合併。 實驗數據說明我們的方法在效能上好於RankSVM與其他查詢獨立排序的方法,特別對於排序前幾筆文件的效能有顯著的提升。另外我們定義了查詢字串的 ”難度”,並分析實驗方法與RankSVM在不同查詢字串難度下的效能比較,在這部分的討論中發現我們方法用於較難或較特殊的查詢字串上效能特別好,也是整體效能優於RankSVM的主要原因。 |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28029 |
Fulltext Rights: | 有償授權 |
Appears in Collections: | 資訊工程學系 |
Files in This Item:
File | Size | Format | |
---|---|---|---|
ntu-100-1.pdf Restricted Access | 1.76 MB | Adobe PDF |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.