請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/61368
標題: | 電子病歷資訊檢索與擷取技術研究 Medical Record Retrieval and Extraction for Professional Information Access |
作者: | Chia-Chun Lee 李佳純 |
指導教授: | 陳信希 |
關鍵字: | 病歷資訊檢索,病歷資訊擷取,排序學習, Medical Record Information Retrieval,Medical Record Information Extraction,Learning to Rank, |
出版年 : | 2013 |
學位: | 碩士 |
摘要: | 本研究以台大醫院病歷為資料集,目的在設計一套病歷檢索系統,幫助醫師
檢索相關病歷或提供治療方法給醫師參考。首先分析病歷的語言現象,包含病歷 平均長度、詞彙量、資訊熵。依據病人掛號科別,病歷可以分為14 類,每個科別 的語言現象也會分別呈現。 第一階段實驗使用五種檢索模型與六種索引策略,第二階段實驗則加入排序 學習技術與三種索引策略。效能評估則分為病歷檢索層次與治療檢索層次,在病 歷檢索層次,主訴視為查詢文字,在治療檢索層次,主訴與簡短病史視為查詢文 字。 第一階段實驗的病歷檢索效能評估中,okapi 模型效能最佳。資訊熵較低的科 別,其效能也比較好。與身體多重器官或人體系統相關的科別,如腫瘤科、神經 科,則低於平均效能。治療檢索效能評估,則沒有一個模型特別優異。 第二階段實驗的病歷檢索效能評估中,tf-idf 模型效能最好。結合多種檢索模 型的檢索分數,反而使得效能下降。運用排序學習技術,能夠顯著優於第一階段 的實驗結果,大部份科別的效能皆有提升。治療檢索效能評估,則五種模型差別 不大。 |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/61368 |
全文授權: | 有償授權 |
顯示於系所單位: | 資訊工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-102-1.pdf 目前未授權公開取用 | 912.6 kB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。