Please use this identifier to cite or link to this item:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/61368
Title: | 電子病歷資訊檢索與擷取技術研究 Medical Record Retrieval and Extraction for Professional Information Access |
Authors: | Chia-Chun Lee 李佳純 |
Advisor: | 陳信希 |
Keyword: | 病歷資訊檢索,病歷資訊擷取,排序學習, Medical Record Information Retrieval,Medical Record Information Extraction,Learning to Rank, |
Publication Year : | 2013 |
Degree: | 碩士 |
Abstract: | 本研究以台大醫院病歷為資料集,目的在設計一套病歷檢索系統,幫助醫師
檢索相關病歷或提供治療方法給醫師參考。首先分析病歷的語言現象,包含病歷 平均長度、詞彙量、資訊熵。依據病人掛號科別,病歷可以分為14 類,每個科別 的語言現象也會分別呈現。 第一階段實驗使用五種檢索模型與六種索引策略,第二階段實驗則加入排序 學習技術與三種索引策略。效能評估則分為病歷檢索層次與治療檢索層次,在病 歷檢索層次,主訴視為查詢文字,在治療檢索層次,主訴與簡短病史視為查詢文 字。 第一階段實驗的病歷檢索效能評估中,okapi 模型效能最佳。資訊熵較低的科 別,其效能也比較好。與身體多重器官或人體系統相關的科別,如腫瘤科、神經 科,則低於平均效能。治療檢索效能評估,則沒有一個模型特別優異。 第二階段實驗的病歷檢索效能評估中,tf-idf 模型效能最好。結合多種檢索模 型的檢索分數,反而使得效能下降。運用排序學習技術,能夠顯著優於第一階段 的實驗結果,大部份科別的效能皆有提升。治療檢索效能評估,則五種模型差別 不大。 |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/61368 |
Fulltext Rights: | 有償授權 |
Appears in Collections: | 資訊工程學系 |
Files in This Item:
File | Size | Format | |
---|---|---|---|
ntu-102-1.pdf Restricted Access | 912.6 kB | Adobe PDF |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.