請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28054
標題: | 適用於網路論壇之新事件偵測技術之研究 New Event Detection in the Context of Web Forums |
作者: | Ting-Wei Chuang 莊庭瑋 |
指導教授: | 簡立峰(Lee-Feng Chien) |
共同指導教授: | 王柏堯(Bow-Yaw Wang) |
關鍵字: | 網路論壇,事件偵測與追蹤,新事件偵測,分群技術,網路社群, Web Forum,Topic Detection and Tracking,New Event Detection,Clustering,Web Community, |
出版年 : | 2007 |
學位: | 碩士 |
摘要: | 網路論壇是虛擬社群成員之間的資訊流通平台,允許多位使用者自由發表及回覆關於特定主題的訊息,這些動態產生的大量文字訊息構成極有價值的知識倉儲。為了幫助使用者取用這些文字訊息中的資訊,目前大多數網路論壇僅提供預先定義的分類標籤作為輔助工具,並依照各訊息的標題以線性的方式呈現。由於訊息標題僅包含極少量資訊,使用者無法藉此區分不同訊息內容間的差異,而在缺乏預先知識的情況下,使用者亦無法產生適當的查詢字詞,因此我們需要一個更有效的組織方式幫助使用者快速地了解所有訊息所構成的瀏覽空間。
本研究嘗試將傳統新事件偵測技術應用於網路論壇環境中,利用文件分群技術,以線上的方式依據各訊息內容相關性分群,並自動偵測是否出現新的訊息分群。我們以漸進式分群演算法為基礎,加入包含時間資訊和網路資源在內的外部資源增加論壇訊息包含的字詞特徵,並取用同分群中的其他訊息做為內文資訊,我們總共提出六種不同的模型作為基本分群演算法的延伸。初步的實驗證明了我們的假設,這些外部資訊的加入確實提升訊息分群的效能。 As the emergence of Web forums, tremendous archived messages regarding diverse subjects become valuable knowledge repositories. Unfortunately, the continuously increasing and heterogeneous messages compound the navigation load. The existing human-generated category hierarchies provided by most Web forums are not self-revealing. Besides, the thread structures created according to the subject headers of messages only give limited information about actual contents of messages. Thus, the forum messages are actually lacked for a better organization to guide browsers in the information space. In this work, we employ the conventional incremental clustering algorithm which is well-studied in TDT as the baseline to group together topically related messages in streams of text messages. In order to detect the topic from one single short message, we propose six different models to exploit temporal information and context information obtained from parent messages. We utilize some extern features extracted from Web as well. Our preliminary experiments confirmed our assumption that incorporate features relevant to the Web forum environment can enhance the performance the basic clustering algorithms. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28054 |
全文授權: | 有償授權 |
顯示於系所單位: | 資訊管理學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-96-1.pdf 目前未授權公開取用 | 566.53 kB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。