請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/9174
標題: | 標籤式使用者描述之語意關聯相似度研究 A Comparative Study of Semantic Similarity of Tag-based Profiles |
作者: | Tsung-Chieh Chang 張琮傑 |
指導教授: | 陳文進(Wen-Chin Chen) |
共同指導教授: | 許永真(Jane Yung-jen Hsu) |
關鍵字: | 標籤,使用者描述,語意,語意相似度, tagging,profile,semantic,semantic similarity, |
出版年 : | 2009 |
學位: | 碩士 |
摘要: | 計算相似度(similarity)是研究上的熱門領域。以使用者為例,在計算使用者之間的相似度須先建立使用者描述(user profile)。在現今Web2.0的時代,使用者可以上傳自己的資料並用標籤(tag)管理;由於標籤是使用者對各個資料語意或概念上的描述,因此以標籤建立使用者描述可瞭解各使用者個人化的觀點與感興趣的主題。
目前計算使用者描述之間的相似度方法皆只考慮兩個使用者描述中共有的屬性。以標籤式使用者描述(tag-based user profile)為例,計算相似度時只考慮相同的標籤,字面上不同的標籤則會忽略不計。但是即使兩個標籤不同,以人類的知識會覺得它們之間具有語意相似度(semantic similarity)。因此在本論文中,我們將語意帶進標籤式使用者描述擴展成賦有語意的標籤式使用者描述(semantic tag-based user profile),接著我們訂定衡量賦有語意的標籤式使用者描述之間的相似度方法。 我們的實驗資料來自於Delicious,它是目前資料量最豐富的社群書籤網站。我們共使用20,578位使用者以及80,000個網頁的資料來衡量我們提出的方法的效能。藉由研究上常用的評估方法以及我們設計的使用者調查,兩者皆顯示我們的方法較原本的標籤式使用者描述好。 With the rapidly growing amount of information, especially in the era of Web 2.0, users experience the problem of information overload. Based on an accurate user profile, we can eliminate unwanted items and recommend the items to the user who interests. Though user profiles have been stuidied for a long time, constructing profiles based on tags is a new research topic which emerges in recent three years. Utilizing a user's set of tags to profile the user is reasonable because tagging associates an object with a set of words which represent the semantic concepts activated by the object from the user's perspective. Nowadays, Common similarity measures between profiles just consider the same attributes only. But two tags may have semantic similarity even if they are not the same tag. In this thesis, we propose semantic tag-based profiles to enrich profiles based on tag concepts we proposed. Each tag concept is built from a core tag which connects other tags holding similar semantic meanings with the core tag. Furthermore, we propose an adaptive similarity measure for semantic tag-based profiles which integrates semantic similarity between tags. Our evaluation is based on the data set crawled from Delicious, which is the most popular social bookmarking web site. The data set contains 20,578 users and 80,000 bookmarks after filtering the crawled data. From the results by empirical evaluation and user study, we show semantic tag-based profiles are better than tag-based profiles. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/9174 |
全文授權: | 同意授權(全球公開) |
顯示於系所單位: | 資訊工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-98-1.pdf | 1.15 MB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。