Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/61368
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor陳信希
dc.contributor.authorChia-Chun Leeen
dc.contributor.author李佳純zh_TW
dc.date.accessioned2021-06-16T13:01:43Z-
dc.date.available2013-08-14
dc.date.copyright2013-08-14
dc.date.issued2013
dc.date.submitted2013-08-07
dc.identifier.citation[1] 行政院衛生署電子病歷推動專區http://emr.doh.gov.tw/introduction.aspx
[2] G. Goth, 'Analyzing medical data'. Communications of the ACM, 2012. 55(6): p.
13-15.
[3] H.-H. Huang, C.-C. Lee, and H.-H. Chen, 'Outpatient Department Recommendation
Based on Medical Summaries', Information Retrieval Technology. 2012, Springer. p.
518-527.
[4] D. A. Hanauer. 'EMERSE: the electronic medical record search engine'. AMIA
Annual Symposium Proceedings. 2006.
[5] L. Yang, Q. Mei, K. Zheng, and D. A. Hanauer. 'Query log analysis of an electronic
health record search engine'. AMIA Annual Symposium Proceedings. 2011.
[6] K. Zheng, Q. Mei, and D. A. Hanauer, 'Collaborative search in electronic health
records'. Journal of the American Medical Informatics Association, 2011. 18(3): p.
282-291.
[7] TREC Medical Track http://trec.nist.gov/data/medical.html
[8] The Lemur Project http://www.lemurproject.org/
[9] S. Kullback and R. A. Leibler, 'On information and sufficiency'. The Annals of
Mathematical Statistics, 1951. 22(1): p. 79-86.
[10] S. E. Robertson and K. S. Jones, 'Relevance weighting of search terms'. Journal of
the American Society for Information science, 1976. 27(3): p. 129-146.
[11] C. E. Shannon, 'Prediction and entropy of printed English'. Bell system technical
journal, 1951. 30(1): p. 50-64.
[12] M. C. Grignetti, 'A note on the entropy of words in printed English'. Information
and Control, 1964. 7(3): p. 304-306.
51
[13] P. Sondhi, V. V. Vydiswaran, and C. Zhai, 'Reliability prediction of webpages in
the medical domain', Advances in Information Retrieval. 2012, Springer. p.
219-231.
[14] D. Mondal, A. Gangopadhyay, and W. Russell. 'Medical decision making using
vector space model'. Proceedings of the 1st ACM International Health Informatics
Symposium. 2010.
[15] B. Koopman, P. Bruza, L. Sitbon, and M. Lawley. 'Evaluating medical information
retrieval'. Proceedings of the 34th international ACM SIGIR conference on
Research and development in Information Retrieval. 2011.
[16] D. Zhu and B. Carterette. 'Improving health records search using multiple query
expansion collections'. Bioinformatics and Biomedicine (BIBM), 2012 IEEE
International Conference on. 2012.
[17] T. Mitchell. 'Machine Learning'. McGraw Hill. ISBN 0070428077, p.2.
[18] T. Strohman, D. Metzler, H. Turtle, and W. B. Croft. 'Indri: A language
model-based search engine for complex queries'. Proceedings of the International
Conference on Intelligent Analysis. 2005.
[19] Indri Retrieval Model Overview.
http://ciir.cs.umass.edu/~metzler/indriretmodel.html
[20] Lemur toolkit: http://www.lemurproject.org/
[21] SVM rank: http://www.cs.cornell.edu/people/tj/svm_light/svm_rank.html
[22] NCBI stopword:
http://www.ncbi.nlm.nih.gov/books/NBK3827/table/pubmedhelp.T43/
[23] H.-B. Chen, H.-H. Huang, C.-T. Tan, J. Tjiu, and H.-H. Chen. 'A statistical medical
summary translation system'. Proceedings of the 2nd ACM SIGHIT International
Health Informatics Symposium. 2012.
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/61368-
dc.description.abstract本研究以台大醫院病歷為資料集,目的在設計一套病歷檢索系統,幫助醫師
檢索相關病歷或提供治療方法給醫師參考。首先分析病歷的語言現象,包含病歷
平均長度、詞彙量、資訊熵。依據病人掛號科別,病歷可以分為14 類,每個科別
的語言現象也會分別呈現。
第一階段實驗使用五種檢索模型與六種索引策略,第二階段實驗則加入排序
學習技術與三種索引策略。效能評估則分為病歷檢索層次與治療檢索層次,在病
歷檢索層次,主訴視為查詢文字,在治療檢索層次,主訴與簡短病史視為查詢文
字。
第一階段實驗的病歷檢索效能評估中,okapi 模型效能最佳。資訊熵較低的科
別,其效能也比較好。與身體多重器官或人體系統相關的科別,如腫瘤科、神經
科,則低於平均效能。治療檢索效能評估,則沒有一個模型特別優異。
第二階段實驗的病歷檢索效能評估中,tf-idf 模型效能最好。結合多種檢索模
型的檢索分數,反而使得效能下降。運用排序學習技術,能夠顯著優於第一階段
的實驗結果,大部份科別的效能皆有提升。治療檢索效能評估,則五種模型差別
不大。
zh_TW
dc.description.provenanceMade available in DSpace on 2021-06-16T13:01:43Z (GMT). No. of bitstreams: 1
ntu-102-R00922081-1.pdf: 934500 bytes, checksum: 2178590476dbb1b207fb5dc4afc10b98 (MD5)
Previous issue date: 2013
en
dc.description.tableofcontents摘要 i
Abstract ii
圖目錄 v
表目錄 vi
第1章 緒論 1
1.1 研究背景 1
1.2 研究動機 1
1.3 研究目的 2
1.4 論文架構 2
第2章 相關研究 3
2.1 病歷資訊檢索 3
2.2 病歷資訊檢索測試集 4
2.3 傳統資訊檢索模型 6
2.3.1 Indri 6
2.3.2 Kullback–Leibler divergence 7
2.3.3 tf-idf 7
2.3.4 Okapi 8
2.3.5 向量空間模型 9
2.4 排序學習 10
第3章 實驗資料集 12
3.1 病歷格式 12
3.2 病歷資料相關統計 14
第4章 實驗方法 19
4.1 實驗設計與效能評估 19
4.2 資料前置處理 21
4.3 醫學術語擷取 23
4.4 第一階段實驗:建立索引與檢索模型 27
4.5第二階段實驗:排序學習 28
第5章 實驗結果 34
5.1 檢索模型實驗結果 34
5.2 排序學習實驗結果 41
第6章 結論與未來研究 49
6.1 結論 49
6.2 未來研究方向 50
dc.language.isozh-TW
dc.subject病歷資訊檢索zh_TW
dc.subject病歷資訊擷取zh_TW
dc.subject排序學習zh_TW
dc.subjectMedical Record Information Retrievalen
dc.subjectMedical Record Information Extractionen
dc.subjectLearning to Ranken
dc.title電子病歷資訊檢索與擷取技術研究zh_TW
dc.titleMedical Record Retrieval and Extraction for Professional Information Accessen
dc.typeThesis
dc.date.schoolyear101-2
dc.description.degree碩士
dc.contributor.oralexamcommittee鄭卜壬,蔡銘峰,郭俊桔
dc.subject.keyword病歷資訊檢索,病歷資訊擷取,排序學習,zh_TW
dc.subject.keywordMedical Record Information Retrieval,Medical Record Information Extraction,Learning to Rank,en
dc.relation.page52
dc.rights.note有償授權
dc.date.accepted2013-08-07
dc.contributor.author-college電機資訊學院zh_TW
dc.contributor.author-dept資訊工程學研究所zh_TW
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-102-1.pdf
  未授權公開取用
912.6 kBAdobe PDF
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved