Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 醫學工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/18544
標題: 於醫學隨機對照試驗結構化摘要中偵測PICO成份:比較首句及全句組
PICO element detection in structured medical abstracts of randomized controlled trial: Compare first sentences and all sentences
作者: Ke-Chun Huang
黃可羣
指導教授: 翁昭旼(Jau-Min Wong)
共同指導教授: 蔣以仁(I-Jen Chiang)
關鍵字: 文字探勘,資訊檢索,自然語言處理,資訊擷取,實證醫學,
Text mining,Information retrieval,Natural language processing,Information extraction,Evidence-based medicine,
出版年 : 2014
學位: 博士
摘要: 本研究基於senetence-level在PubMed結構化文獻摘要中作PICO成份檢測,針對PICO個別成份每個段落的第一個句子是否足夠用來訓練樸素貝葉斯分類器以及支持向量機,抑或是除了段落第一句之外,還需涵蓋段落中除第一句之外的剩餘句子。從醫學資料庫 Pubmed 隨機對照試驗(randomized controlled trials)文獻中,擷取段首符合P/I/O各類別預設標籤的19,854結構化摘要來作樸素貝葉斯分類器以及支持向量機的訓練集。然後經由ten-fold cross-validation對於PICO各類別分別比較由段落第一句訓練出來的分類器(CF)以及整個段落裡所有句子訓練出來的分類器(CA)。採用recall, precision和F-measures作為結果加以比較。結果顯示使用樸素貝葉斯分類器,對於Outcome類別 CF 和 CA 之間並不存在顯著差異(F-measure=0.731±0.009 vs. 0.738±0.010, p=0.123)。然而在recall方面,CA在Intervention類別上表現得更好0.752±0.012 vs. 0.620±0.007, p<0.001),F-measures 0.728±0.006 vs. 0.662±0.007, p<0.001)。對於Patient/Problem類別而言,CF具有更高的precision 0.714±0.009 vs. 0.665±0.010, p<0.001), 但較低的 recall 0.766±0.013 vs. 0.811±0.012, p<0.001)。在sentence-level PICO 成份偵測而言,CF並不總是優於CA,CF 和 CA在檢測不同PICO成份的表現各不相同。當使用線性支持向量機分類器時,P/I/O各類結果和使用樸素貝葉斯分類器並不完全相同,在sentence-level PICO 成份偵測而言,CF也並不總是優於CA,CF和CA在檢測不同PICO成份的表現也有所不同。而當支持向量機分類器使用radial based function時,recall以及F-measure都偏低。
To identify of patient, intervention, comparison, and outcome (PICO) components in medical articles efficiently is helpful in evidence-based medicine. The purpose of this study is to clarify whether first sentences of these components are good enough to train naive Bayes classifiers for sentence-level PICO element detection. We extracted 19,854 structured abstracts of randomized controlled trials with any P/I/O label from PubMed for naive Bayes classifiers training. Performances of classifiers trained by first sentences of each section (CF) and those trained by all sentences (CA) were compared using all sentences by ten-fold cross-validation. The results measured by recall, precision, and F-measures show that there are no significant differences in performance between CF and CA for detection of O-element (F-measure}=0.731±0.009 vs. 0.738±0.010$, p=0.123). However, CA perform better for I-elements, in terms of recall (0.752±0.012 vs. 0.620±0.007, p<0.001) and F-measures (0.728±0.006 vs. 0.662±0.007, p<0.001).
For P-elements, CF have higher precision (0.714±0.009 vs. 0.665±0.010, p<0.001), but lower recall (0.766±0.013 vs. 0.811±0.012, p<0.001). CF are not always better than CA in sentence-level PICO element detection. Their performance varies in detecting different elements. In the study, support vector machines are also used. When comparing the results of CA and CF classifiers trained by Naive Bayesian and support vector machines, differences are obtained.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/18544
全文授權: 未授權
顯示於系所單位:醫學工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-103-1.pdf
  目前未授權公開取用
5.94 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved