請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/73336
標題: | 利用機器學習方式自動判讀病歷並產生ICD-10編碼 Automatic ICD-10 classification from free-text data |
作者: | Yu-Hsuan Chang 張宇軒 |
指導教授: | 賴飛羆 |
關鍵字: | 機器學習,神經網路,自然語言處理,文字分類, ICD-10,Machine learning,Neural Network,Natural language processing,text classification, |
出版年 : | 2019 |
學位: | 碩士 |
摘要: | 目前疾病分類主要依靠人力閱讀大量的文字資料作為分類的依據,一位專業的疾病分類員需要長時間的專業訓練才能進行ICD-10分類的複雜作業,而這項工作即便是由專業的疾病分類人員來進行都需要花費大量的時間才能對一個病人做出正確的編碼,像這樣的工作若能由人工智慧做取代,能夠為醫院省下大量的人力,使得醫療體系的工作變得更加完善。
為了達到這樣的目的,我們希望能建立一套ICD-10代碼的自動分類系統,能夠閱讀並處理醫生所寫下的文字資料,由輸入這些文字類型的資料,例如出院診斷,手術紀錄或是病史等等的文字記錄,藉由自然語言處理的技術,配合機器學習的分類方式學習這些代碼的分類規則,最後得到相對應的ICD-10代碼。 在我們的研究中,受試者的資料包含臺大醫院使用 ”國際疾病傷害及死因分類標準第十版” 作為疾病分類標準的所有出院病人的入院診斷、轉出加護病房指示、身體檢查、住院治療經過、併發症、檢驗紀錄、檢查進度、影像報告、病理報告、出院診斷、主訴、病史、手術紀錄,以及疾病分類人員最終的編碼結果,資料中不需要關於病人的個人資料,病人資料的個人隱私與此研究不會有相關聯。 Our study aimed to construct a system for ICD-10 coding system, produced by supervised machine learning techniques, in order to categorize automatically free-text medical data using solely their content. There are numerous machine learning techniques and we use supervised machine learning to learn how to classify the ICD-10 codes from free-text data. At present, the work of classifying diseases mainly relies on manpower to read a large amount of written materials, such as discharge diagnosis, chief complaint, medical history, operation records and so on as the basis for classification. Coding is both laborious and time consuming. A disease coder with professional abilities also takes an average of 20 minutes, if we can provide an automatic code classification system with enough accuracy compared with professional coder, this model can significantly reduce the human labor in the code classification time. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/73336 |
DOI: | 10.6342/NTU201900940 |
全文授權: | 有償授權 |
顯示於系所單位: | 生醫電子與資訊學研究所 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-108-1.pdf 目前未授權公開取用 | 2.92 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。