查詢獨立與查詢相關排名機制之研究

Hsuan-Yu Lin; 林軒宇

請用此 Handle URI 來引用此文件： http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28029

標題:	查詢獨立與查詢相關排名機制之研究 Ranking Documents by Query Independent and Query Dependent Models
作者:	Hsuan-Yu Lin 林軒宇
指導教授:	陳信希(Hsin-Hsi Chen)
關鍵字:	排序學習,區域排序模型,查詢相關排序,效能評估, learning to rank,local models,query dependent ranking,evaluation,
出版年 :	2011
學位:	碩士
摘要:	現今搜尋排序學習 (Learning To Rank) 的技術已被廣泛使用於資訊檢索和網路搜尋系統中。傳統的排序模型常使用單一搜尋排序模型來對所有查詢字串的文件做排名，因為所有查詢字串都使用相同的排序模型，我們稱此為查詢獨立排序模型 (Query independent ranking model)；然而透過這種方式建立的排序模型並未充份利用查詢字串本身的特性，因此我們提出演算法，依據查詢字串的特性來調整排序模型，由此得到查詢相關排序模型 (query dependent ranking models)。我們提出單一的架構來研究此議題。架構中，首先使用分群演算法將訓練資料集切割成許多子集，再從子集中訓練出不同的子排序模型，我們稱為子排序模型為區域模型 (local model)；之後，我們提出四個以區域排序模型為基礎的查詢相關排序模型，使用這些排序模型來整合不同區域排序模型的排序結果，並決定最後的文件排名。我們的架構著重討論三大議題─查詢表示 (Query Representation)、分群演算法 (Data Clustering)和排名函式 (Ranking Function)，其中研究內容包含使用不同的查詢字串表示將查詢字串轉換成一個向量或表示的形式，兩種主要的分群演算法對訓練資料分群以學習區域排序模型，透過排名函式將區域排序模型的排名結果用不同的方式進行分數的合併。實驗數據說明我們的方法在效能上好於RankSVM與其他查詢獨立排序的方法，特別對於排序前幾筆文件的效能有顯著的提升。另外我們定義了查詢字串的 ”難度”，並分析實驗方法與RankSVM在不同查詢字串難度下的效能比較，在這部分的討論中發現我們方法用於較難或較特殊的查詢字串上效能特別好，也是整體效能優於RankSVM的主要原因。
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28029
全文授權:	有償授權
顯示於系所單位：	資訊工程學系

文件中的檔案：

檔案	大小	格式
ntu-100-1.pdf 目前未授權公開取用	1.76 MB	Adobe PDF

顯示文件完整紀錄

系統中的文件，除了特別指名其著作權條款之外，均受到著作權保護，並且保留所有的權利。

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料（如：文字、圖片、PDF）並使其易於取用。