請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79376| 標題: | 建立連結預測的新評估模型—以生物醫學領域的共字網絡為例 Toward a New Evaluation Model for Link Prediction: A Case Study of Co-word Network in Biomedical Science |
| 作者: | Chia-Wei Chen 陳家薇 |
| 指導教授: | 唐牧群(Muh-Chyun Tang) |
| 關鍵字: | 連結預測,連結預測評估方式,共字網絡,社會網絡分析,網絡迴歸分析,二次指派程序, Link prediction,Link prediction evaluation,Co-word network,Social network analysis,Regression of network,Quadratic assignment procedure, |
| 出版年 : | 2021 |
| 學位: | 碩士 |
| 摘要: | 連結預測能透過演算法針對網絡的特定特性來預測未來連結,在資訊科學領域中,若運用在學術合作網絡可以預測未來可能合作的作者,於共字網絡中能預測字詞間可能產生的新連結,用於發掘特定學科領域的變化以及新興的研究領域。目前既有的連結預測表現評估方法為二元分類,但是當網絡的連結具有權重時,二元分類會將檢驗的預測結果轉為二元的形式,忽略連結權重的數值高低,因此本研究提出以網絡統計檢定中的Quadratic Assignment Procedure(QAP)線性迴歸分析作為新的評估典範。 本研究選擇探討領域為生物醫學領域中的三個主題,分別為發育生物學、神經可塑性、端粒,從PubMed資料庫蒐集文獻形成由關鍵字組成的共字網絡,節點為關鍵字,連結是成對關鍵字出現在同一篇文獻的次數。將2015年至2017年形成的共字網絡視為訓練網絡,而2018年2020年的驗證網絡是為了檢驗預測表現的真實網絡。本研究選擇區域演算法中的Adamic/Adar、Common Neighbours、Cosine Similarity以及Jaccard和全域演算法可以設定參數的Katz,針對訓練網絡進行訓練,預測在2018年2020年間可能產生的連結,並使用二元分類和QAP評估預測結果,比較五種演算法的預測表現。 研究結果發現在三個主題中,二元分類與QAP的結果顯示全域演算法的表現優於區域演算法,Katz預測能力最為優異,最後則是Jaccard。雖然整體而言二元分類和QAP的結果並無莫大的差異,但是QAP對於連結權重數值的敏感度高,更精準地將預測結果反應在評估的數值上,此外QAP即使在全為真陽性連結的檢驗中,仍然能判別不同模型於預測連結權重的表現,相較於二元分類,QAP更具有區辨不同模型預測表現的能力。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79376 |
| DOI: | 10.6342/NTU202104143 |
| 全文授權: | 同意授權(全球公開) |
| 顯示於系所單位: | 圖書資訊學系 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| U0001-2510202114404200.pdf | 4.63 MB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
