請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/5497
標題: | 未標記資料之連結發現 Link Discovery with Unlabeled Data |
作者: | Tsung-Ting Kuo 郭宗廷 |
指導教授: | 林守德(Shou-De Lin) |
關鍵字: | 連結發現,連結預測,資料探勘,機器學習,社群網路,機率圖形學習模型,自然語言處理, Link discovery,Link prediction,Data mining,Machine learning,Social network,Probabilistic graphical model,Natural language processing, |
出版年 : | 2014 |
學位: | 博士 |
摘要: | 許多社群,學術,生物,地理及資訊系統可以用網路來做描述。連結發現是一種在社群網路中確認隱藏連結的研究。然而,某些情況下,針對我們想發現的連結,並無法取得已標記的資料。在此論文中,我們研究一個關於連結發現問題的新面向:發現未標記之連結。我們進一步研究兩個子題,來預測兩種未標記之連結:在異質性網路中未標記之關係連結,以及在同質性網路中未標記之傳播連結。此問題之主要挑戰為缺少標記資料,所以無法直接使用傳統的自動分類方法。為解決此問題,我們設計了以機器學習為基礎的架構,來整合各種不同的資訊,並發現未標記資料的連結。我們也在許多真實世界的資料集上進行實驗,以驗證我們所提出的方法。實驗結果除了顯示我們所提出的方法可以解決此問題,也指出未標記資料之連結發現可以應用在許多不同的實務情境之中。 Many social, academic, biological, geographical, and information systems can be described by networks. Link discovery is a kind of task aiming at identifying hidden links in a social network. However, in some cases, the labels of the links to be discovered is not available. In this dissertation, we investigate such a novel aspect of the link discovery task: the problem of discovering unlabeled links. Specifically, we conduct two studies to predict two kinds of unlabeled links respectively: links that represents unlabeled relationship in heterogeneous networks, and links that represents unlabeled diffusion in homogeneous networks. The main challenge of these tasks are the lack of labeled data, thus prevents the direct exploiting of traditional classification approaches. To address this challenge, we design learning-based frameworks to integrate diverse information and solve the corresponding link discovery problems in the two studies. Also, we conduct experiments on various real-world datasets to evaluate our proposed frameworks. The promising experiment results not only demonstrates the usefulness of the proposed models, but also indicates that discovering links without labeled data is feasible in many practical scenarios. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/5497 |
全文授權: | 同意授權(全球公開) |
顯示於系所單位: | 資訊網路與多媒體研究所 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-103-1.pdf | 2.34 MB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。