請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/80951| 標題: | 基於語義方法和自監督式學習之病例與試驗配對 Towards Semantic Matching and Self-supervised Learning for Patient-trial Matching |
| 作者: | Yi-Chen Lin 林依蓁 |
| 指導教授: | 許永真(Jane Yung-jen Hsu) |
| 關鍵字: | 病例與臨床試驗配對,自然語言處理,語義匹配,自監督式學習, Patient-trial Matching,Natural Language Processing,Semantic Matching,Self-supervised Learning, |
| 出版年 : | 2021 |
| 學位: | 碩士 |
| 摘要: | 建構一個自動化的病例與試驗配對(Patient-Trial Matching)系統,提升病例與試驗配對效率,可以幫助醫療人員節省寶貴時間,更快地取得合適的臨床試驗資訊,作為醫療方案的參考選項。 病例與試驗配對是基於病人狀況(病例)搜尋出符合資格條件(Eligibility Criteria)的臨床試驗。由於資格條件皆是以非結構化的自然語言形式表示,並且包含了臨床醫學知識的複雜語義,過去相關研究大多將其視為資訊自動抽取問題,並以基於規則的方式來解決,近來則以機器學習或神經網路模型來處理。然而,這些方法都需要花費龐大人力或取得大量人工標注資料才能進行。 我們提出一個迭代式工作方法(Iterative Approach)來進行病例與試驗配對。在缺乏標註資料的前期研究階段,以語義相似度進行句級配對(Matching in Sentence Level),並以此作為核心模組,建構一個包含文字預處理、文本向量表示、句對匹配、反義偵測、數值過濾器、整合排序等模組的完整配對流程。取得的配對結果皆交由醫學專家進行人工評量與標註,我們從標註結果的分析中發現,語義相似等於語義相關乃至相符的假設並不完全適用於本研究的文本特性。因此,在後期研究中嘗試以自監督式學習(Self-supervised Learning)的方式解決該問題。 我們將標註資料、病例資料、試驗條件三者進行關聯,針對特定的臨床特徵詞產生虛擬標註資料集,用來訓練語義正反(相符與否)的分類模型,並將分類器導回整體工作流程中。利用上一輪的配對結果進行『標註-生成-訓練』三個步驟產生分類器,再產生下一輪的配對結果,如此反覆迭代,即可逐漸提升整體的配對效能。 我們依序在三批病例上執行兩輪此迭代式工作流程,結果是,導入分類器後皆增加了15%精確率,提升了整體流程的配對效能,驗證了本研究的迭代方法和配對流程是可行而且有效的。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/80951 |
| DOI: | 10.6342/NTU202103105 |
| 全文授權: | 同意授權(限校園內公開) |
| 顯示於系所單位: | 資訊網路與多媒體研究所 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| U0001-1009202113321700.pdf 授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務) | 3.79 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
