Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 工業工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/77716
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor陳正剛
dc.contributor.authorYu-Wei Liuen
dc.contributor.author劉有為zh_TW
dc.date.accessioned2021-07-10T22:17:37Z-
dc.date.available2021-07-10T22:17:37Z-
dc.date.copyright2017-08-31
dc.date.issued2017
dc.date.submitted2017-08-11
dc.identifier.citation Youden, William J. 'Index for rating diagnostic tests.' Cancer 3.1 (1950): 32-35.
 Fisher, Ronald A. 'The use of multiple measurements in taxonomic problems.' Annals of eugenics 7.2 (1936): 179-188.
 Breiman, Leo, et al. Classification and regression trees. CRC press, 1984.
 Altman, Douglas G., and J. Martin Bland. 'Diagnostic tests. 1: Sensitivity and specificity.' BMJ: British Medical Journal 308.6943 (1994): 1552.
 巫信融,2009,多層判別分析及其應用,國立台灣大學工業工程學研究所碩士論文。
 賴淑俐,2010,多層判別分析理論與方法擴張及其於腫瘤診斷上的應用,國立台灣大學工業工程學研究所碩士論文。
 莊曙詮,2012,多階段調適樹群模型建構方法及其於腫瘤分級之應用,國立台灣大學工業工程學研究所碩士論文。
 馬康恆,2013,利用接收者操作特徵曲線建構分類樹之研究與應用,國立台灣大學工業工程學研究所碩士論文。
 王彥龍,2013,概括性相對性重要指標及變數選擇之研究及其於費雪線性區別分析與Cox比例風險迴歸之應用,國立台灣大學工業工程學研究所碩士論文。
 張富皓,2014,利用非參數型接收者操作特徵曲線建構統計分類樹之研究與應用,國立台灣大學工業工程學研究所碩士論文。
 曾煥澤,2015,多層混合分類樹研究及其腫瘤診斷之應用,國立台灣大學工業工程學研究所碩士論文。
 鄧烯文,2016,利用Youden及接收者特徵操作曲線指標之分類樹表現研究,國立台灣大學工業工程學研究所碩士論文。
 蔡博尉,2009,甲狀腺腫瘤超音波影像之輪廓擷取與特徵視覺化,國立台灣大學工業工程學研究所碩士論文。
 劉中維,2009,甲狀腺腫瘤超音波特徵之量化與效力分析,國立台灣大學工業工程學研究所碩士論文。
 楊邵桓,2012,乳房腫瘤超音波特徵之量化與效力分析,國立台灣大學工業工程學研究所碩士論文。
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/77716-
dc.description.abstractCART 為一分類樹中最常見的演算法,其中每一層分類階段都有兩個子節點,透過序列式的二元分割建構整棵樹。多層判別分析為另一種分類樹,有別於CART,多層判別分析每一層可能有二或三個節點,其中一節點為未分類資料,再由這一個未分類節點的資料,繼續利用分類效能最佳的屬性分割,直到到達停止條件。CART和多層判別分析於屬性挑選和變數選擇的方法上,可以透過Gini Index或Youden’s index等方法,選擇每ㄧ個節點所要分割的屬性,以及每一個節點如何去切割。然而,基於CART與多層判別分析演算法的特性,在某些資料型態下,使用Gini Index或Youden’s Index進行切點和變數的選擇皆有其不足的地方。
本研究透過一個二類別兩屬性資料(二維標竿資料)和一個二類別三屬性資料(三維標竿資料),探討CART、多層判別分析使用Gini index及Youden’s Index於變數挑選上之表現。我們證明,於二維標竿資料及三維標竿資料下,CART使用Youden’s Index於變數挑選上之表現會比使用Gini Index於變數挑選上之表現好,有較大的機率得到最佳的分類模型。而多層判別分析使用Gini Index於變數挑選上之表現會比使用Youden’s Index於變數挑選上之表現好,有較大的機率得到最佳的分類模型。
根據二維標竿資料及三維標竿資料理論探討之結論,本研究更進一步提出新的演算法,多層混合指標判別分析,結合Gini Index和Youden’s Index兩種不同的指標,搭配CART及多層判別分析,進行變數挑選及資料分割。本演算法於每一分割階段先藉由CART使用Youden’s Index,和多層判別分析使用Gini Index挑選出最佳變數,透過Wilk’s Lambda之檢定決定每一分類階段該使用CART分類樹搭配Youden’s Index或多層判別分析使用Gini Index之方案,評估八個分割方案,展開新的一層,如此不斷地分割,直到到達停止條件。最後我們使用腫瘤分類的實例來測試,比較多層混合指標判別分析與原始的CART 和多層判別分析的分類效能。
zh_TW
dc.description.abstractClassification and Regression Tree (CART) is the most commonly used classification tree algorithm consisting of a hierarchy of decision nodes. Each decision node in CART can only be split into two child-nodes. The tree construction is then conducted through sequential binary partition. An alternative classification tree, multi-layer classifier (MLC), can be built with each node split into two or three child nodes. Among the child-nodes, there is one node with unclassified data, and will be split further into next layer. The splitting continues until the stopping condition is reached. Both CART and MLC could use Gini Index or Youden's Index as the criterion to select the decision feature and to determine the cutoff point. However, it is yet to be investigated which criterion used by CART and MLC to choose features and cutoff points will achieve better performance.
In this research, we first propose a two-feature classification problem with data arranged in a two-dimentional benchmark plane and then extend this benchmark plane to a benchmark cube for three-feature problem. We will discuss the performance of CART and MLC using Gini Index and Youden's Index on feature selection with data arranged in a two-dimensional benchmark data structure and a three-dimensional benchmark data structure. We will prove that CART performs better using Youden's Index, with which there is a greater probability to yield the best classification model than using Gini Index under both two-dimensional and three-dimensional benchmark data structures. We will further show that MLC has a better performance using Gini Index.
According to the theoretical discussion of our studies of the criteria used by the two classifiers on the two-dimensional and three-dimensional benchmark data structure, we will then propose a novel hybrid classification algorithm switching between the two classifiers, each using the corresponding best-performance Index. The proposed algorithm first simultaneously evaluates CART using Youden's Index and MLC using Gini Index by the Wilk’s Lambda Test and chooses the best method to split a chosen feature at each stage. The classifier is then grown stage-by-stage continuously until the stop condition is reached. Finally, we use a real case to verify and compare the discriminating capabilities of the hybrid algorithm, CART and MLC.
en
dc.description.provenanceMade available in DSpace on 2021-07-10T22:17:37Z (GMT). No. of bitstreams: 1
ntu-106-R04546036-1.pdf: 13314333 bytes, checksum: 009b829f3c85d28057f17246bc5545e7 (MD5)
Previous issue date: 2017
en
dc.description.tableofcontents誌謝 I
中文摘要 II
Abstract III
目錄 IV
圖目錄 VI
表目錄 XIII
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機與目標 2
1.3 論文架構 3
第二章 文獻探討 4
2.1 CART 4
2.2 多層判別分析 (巫信融,2009) 7
2.3 Wilk’s Lambda 12
2.4 標竿資料(賴淑俐,2010) 13
2.4.1 利用Gini Index之CART分類樹標竿資料表現研究(賴淑俐,2010) 19
2.4.2 利用Gini Index之多層判別分析標竿資料表現研究(賴淑俐,2010) 19
2.4.3 利用Youden’s Index之CART分類樹標竿資料表現研究(鄧烯文,2016) 19
2.4.4 利用Youden’s Index之多層判別分析標竿資料表現研究(鄧烯文,2016) 20
2.5 多層混合分類樹(曾煥澤,2015) 20
第三章 標竿資料 21
3.1 二維標竿資料 21
3.1.1 二維標竿資料建構 22
3.1.2 二維標竿資料下之理想分類模型 23
3.2 三維標竿資料 34
3.2.1 三維標竿資料建構 34
3.2.2 三維標竿資料下之理想分類模型 39
第四章 判別分析之理論探討 62
4.1 不同屬性選擇準則之CART分類樹標竿資料表現研究 62
4.1.1 利用Gini Index之CART分類樹分類能力分析 63
4.1.2 利用Youden’s Index之CART分類樹分類能力分析 75
4.1.3 不同屬性選擇準則CART標竿資料表現能力比較 86
4.2 不同屬性選擇準則之多層判別分析標竿資料表現研究 87
4.2.1 利用Gini Index之多層判別分析分類能力分析 87
4.2.2 利用Youden’s Index之多層判別分析分類能力分析 100
4.2.3 不同屬性選擇準則多層判別分析標竿資料表現能力比較 111
第五章 多層混合指標判別分析 112
5.1 模型架構 112
5.2 模型建構完整流程 113
5.2.1 切點選擇 113
5.2.2 屬性及分割方式選擇 114
5.2.3 評估模型效能 116
5.2.4 停止條件 118
5.2.5 模型建構流程 119
第六章 實際案例 120
6.1 資料說明 120
6.2 乳癌實例腫瘤診斷 120
第七章 結論與未來研究方向 136
參考文獻 138



圖目錄
Figure 2-1 模擬案例散布圖(巫信融,2009) 6
Figure 2 2 CART 示意圖(巫信融,2009) 6
Figure 2-3 腫瘤內囊腫所占比例之良惡性散布圖(巫信融,2009) 7
Figure 2-4 腫瘤內鈣化點所占比例之良惡性散布圖(巫信融,2009) 8
Figure 2-5 腫瘤周圍環狀區域血管多寡之良惡性散布圖(巫信融,2009) 8
Figure 2-6 多層判別分析候選切點示意圖 9
Figure2-7 多層判別分析四種分割方案(巫信融,2009) 10
Figure 2-8 多層判別分析範例(巫信融,2009) 11
Figure 2-9 標竿資料型態分佈圖 13
Figure2-10(a) 模型I,一層CART分類樹的建構過程 14
Figure2-10(b) 模型I,兩層CART分類樹的建構過程 14
Figure2-11(a) 模型II,一層CART分類樹的建構過程 15
Figure2-11(b) 模型II,兩層CART分類樹的建構過程 15
Figure2-11(c) 模型II,三層CART分類樹的建構過程 16
Figure2-12(a) 模型III,一層多層判別分析的建構過程 17
Figure2-12(b) 模型III,兩層多層判別分析的建構過程 17
Figure2-13(a) 模型IV,一層分類樹的建構過程 18
Figure2-13(b) 模型IV,兩層多層判別分析的建構過程 18
Figure 3-1(a) 兩類別資料屬性值分布交疊於中間 21
Figure 3-1(b) 兩類別資料屬性值分布交疊於一側 21
Figure 3-1(c) 兩類別資料屬性值分布重疊 21
Figure 3-2二維標竿資料分佈圖 23
Figure 3-3 (a) 模型一,第一層分類樹的建構過程 25
Figure 3-3 (b) 模型一,兩層的分類樹 25
Figure 3-4 (a) 模型二,一層分類樹的建構過程 26
Figure 3-4 (b) 模型二,一層分類樹的建構過程 27
Figure 3-4 (c) 模型二,兩層分類樹的建構過程 27
Figure 3-5 (a) 模型三,三層的分類樹 28
Figure 3-5 (b) 模型三,三層的分類樹 29
Figure 3-5 (c) 模型三,三層的分類樹 29
Figure 3-6 (a) 模型四,多層判別分析於第一層先選擇屬性x1建構過程 31
Figure 3-6 (b) 模型四,兩層多層判別分析的建構過程 31
Figure 3-7 (a) 模型五,多層判別分析於第一層先選擇屬性x2建構過程 32
Figure 3-7 (b) 模型五,多層判別分析仍有誤判之狀況 33
Figure 3-8三維標竿資料分佈圖 35
Figure 3-9 (a) 三維標竿資料於屬性x1<k之截面及其資料分布 36
Figure 3-9 (b) 三維標竿資料於屬性k<x1<h之截面及其資料分布 36
Figure 3-9 (c) 三維標竿資料於屬性h<x1<k之截面及其資料分布 36
Figure 3-10 (a) 三維標竿資料於屬性x2<0.5s之截面資料分布 37
Figure 3-10 (b) 三維標竿資料於屬性0.5s<x2<s之截面資料分布 37
Figure 3-10 (c) 三維標竿資料於屬性s<x2<1之截面資料分布 37
Figure 3-11 (a) 三維標竿資料於屬性x3<0.5之截面資料分布 38
Figure 3-11 (b) 三維標竿資料於屬性0.5s<x3<s之截面資料分布 38
Figure 3-12(a) 模型六,理想狀況下一層的分類樹 40
Figure 3-12(b) 模型六,理想狀況下兩層的分類樹 41
Figure 3-12(c) 模型六,理想狀況下三層的分類樹 41
Figure 3-13(a) 模型七,理想狀況下一層的分類樹 42
Figure 3-13(b) 模型七,理想狀況下二層的分類樹 43
Figure 3-13(c) 模型七,理想狀況下三層的分類樹 43
Figure 3-13(d) 模型七,理想狀況下四層的分類樹 44
Figure 3-14(a) 模型八,理想狀況下一層的分類樹 45
Figure 3-14(b) 模型八,理想狀況下二層的分類樹 46
Figure 3-14(c) 模型八,理想狀況下三層的分類樹 46
Figure 3-14(d) 模型八,理想狀況下四層的分類樹 47
Figure 3-15(a) 模型九,理想狀況下一層的分類樹 48
Figure 3-15(b) 模型九,理想狀況下二層的分類樹 49
Figure 3-15(c) 模型九,理想狀況下三層的分類樹 49
Figure 3-15(d) 模型九,理想狀況下四層的分類樹 50
Figure 3-16(a) 模型十,理想狀況下一層的分類樹 51
Figure 3-16(b) 模型十,理想狀況下二層的分類樹 52
Figure 3-16(c) 模型十,理想狀況下三層的分類樹 52
Figure 3-16(d) 模型十,理想狀況下四層的分類樹 53
Figure 3-17(a) 模型十一,多層判別分析於第一層先選擇屬性x1建構過程 55
Figure 3-17(b) 模型十一,於第一層先選擇屬性x1之兩層多層判別分析建構過程 55
Figure 3-17(c) 模型十一,於第一層先選擇屬性x1之四層的多層判別分析 56
Figure 3-18(a) 模型十二,多層判別分析於第一層先選擇屬性x2建構過程 58
Figure 3-18(b) 模型十二,於第一層先選擇屬性x2之兩層多層判別分析建構過程 58
Figure 3-18(c) 模型十二,於第一層先選擇屬性x2之三層多層判別分析建構過程 59
Figure 3-18(d) 模型十二,於第一層先選擇屬性x2之四層多層判別分析建構過程 59
Figure 3-19(a) 模型十三,多層判別分析於第一層先選擇屬性x3建構過程 60
Figure 3-19(b) 模型十三,於第一層先選擇屬性x3之兩層多層判別分析建構過程 61
Figure 3-19(c) 模型十三,於第一層先選擇屬性x3之三層多層判別分析建構過程 61
Figure 4-1 CART橫向切割資料 64
Figure 4-2 CART縱向切割資料 66
Figure4-3 二維標竿資料下,CART使用Gini Index作為屬性挑選準則, 68
於第一層選擇x2進行分割之條件 68
Figure4-5 二維標竿資料下,,CART使用Gini Index作為屬性挑選準則, 69
於第一層選擇x1=k進行分割之條件 69
Figure4-6 二維標竿資料下, CART使用Gini Index作為屬性挑選準則, 70
於第一層選擇x1=h進行分割之條件 70
Figure4-7 三維標竿資料下, CART使用Gini Index作為屬性挑選準則, 73
於第一層選擇x1進行分割之條件 73
Figure4-7 三維標竿資料下,CART使用Gini Index作為屬性挑選準則, 74
於第一層選擇x2進行分割之條件 74
Figure4-8 二維標竿資料下,CART使用Youden’s Index做為變數挑選準則, 78
於第一層選擇x2進行分割之條件 78
Figure4-9 二維標竿資料下,CART使用Youden’s Index做為變數挑選準則, 79
Figure4-10 二維標竿資料下,CART使用Youden’s Index做為變數挑選準則, 80
Figure4-11 三維標竿資料下,CART使用Youden’s Index做為變數挑選準則, 84
Figure4-12 三維標竿資料下,CART使用Youden’s Index做為變數挑選準則, 85
Figure 4-13 多層判別分析縱向切割資料 88
Figure 4-14 多層判別分析橫向切割資料 91
Figure4-15 二維標竿資料下,多層判別分析使用Gini Index做為變數挑選準則, 93
於第一層選擇x1進行分割之條件 93
Figure4-16 二維標竿資料下,多層判別分析使用Gini Index做為變數挑選準則, 94
於第一層選擇x2進行分割之條件 94
Figure4-17 三維標竿資料下,多層判別分析使用Gini Index做為變數挑選準則, 98
於第一層選擇x1進行分割之條件 98
Figure4-18 三維標竿資料下,多層判別分析使用Gini Index做為變數挑選準則, 98
於第一層選擇x2進行分割之條件 98
Figure4-19 二維標竿資料下,多層判別分析使用Youden’s Index做為變數挑選準則,於第一層選擇x2進行分割之條件 105
Figure4-20 二維標竿資料下,多層判別分析使用Youden’s Index做為變數挑選準則,於第一層選擇x1進行分割之條件 106
Figure4-21 三維標竿資料下,多層判別分析使用Youden’s Index做為變數挑選準則,於第一層選擇x1進行分割之條件 108
Figure4-22 三維標竿資料下,多層判別分析使用Youden’s Index做為變數挑選準則, 109
於第一層選擇x2進行分割之條件 109
Figure4-23 三維標竿資料下,多層判別分析使用Youden’s Index做為變數挑選準則, 110
於第一層選擇x3進行分割之條件 110
Figure5-1 多層判別分析搜尋切點示意圖 114
Figure5-2 多層判別分析切點示意圖 115
Figure5-3 多層判別分析切點示意圖 115
Figure5-4比較CART分類樹分割後加入新屬性進行分類的兩種方案 116
Figure5-5比較多層判別分析分割後加入新屬性進行分類的六個方案 117
Figure5-6建立多層混合指標分類樹之流程圖 119
Figure6-2以Youden’s Index所建立的CART分類樹應用在交叉驗證1的模型 122
Figure6-3以Gini Index Index所建立的多層判別分析應用在交叉驗證1的模型 123
Figure6-4以Youden’s Index Index建立的多層判別分析應用在交叉驗證1的模型 123
Figure6-5多層混合指標判別分析應用在交叉驗證1的模型 124
Figure6-6以Gini Index所建立的CART分類樹應用在交叉驗證2 的模型 125
125
Figure6-7以Youden’s Index所建立的CART分類樹應用在交叉驗證2 的模型 125
Figure6-8以Gini Index Index所建立的多層判別分析應用在交叉驗證2的模型 126
Figure6-9以Youden’s Index Index建立的多層判別分析應用在交叉驗證2的模型 126
Figure6-10多層混合指標判別分析應用在交叉驗證2的模型 127
Figure6-11以Gini Index所建立的CART分類樹應用在交叉驗證3的模型 128
Figure6-12以Youden’s Index所建立的CART分類樹應用在交叉驗證3的模型 128
Figure6-13以Gini Index Index所建立的多層判別分析應用在交叉驗證3的模型 129
Figure6-14以Youden’s Index Index建立的多層判別分析應用在交叉驗證3的模型 129
Figure6-16以Gini Index所建立的CART分類樹應用在交叉驗證4的模型 131
Figure6-17以Youden’s Index所建立的CART分類樹應用在交叉驗證4的模型 131
Figure6-18以Gini Index Index所建立的多層判別分析應用在交叉驗證4的模型 132
Figure6-19以Youden’s Index Index建立的多層判別分析應用在交叉驗證4的模型 132
Figure6-20多層混合指標判別分析應用在交叉驗證4的模型 133

表目錄
表4-1 各屬性選擇準則之CART分類樹於二維標竿資料挑選各變數之機率 86
表4-2 各屬性選擇準則之CART分類樹於三維標竿資料挑選各變數之機率 86
表4-3 各屬性選擇準則之多層判別分析於二維標竿資料挑選各變數之機率 111
表4-4 各屬性選擇準則之多層判別分析於三維標竿資料挑選各變數之機率 111
表6-1 使用各方法應用在交叉驗證訓練樣本的指標值 134
表6-2 使用各方法應用在交叉驗證訓練樣本的指標值之彙整 134
表6-3 使用各方法應用在交叉驗證測試樣本的指標值 135
表6-4 使用各方法應用在交叉驗證測試樣本的指標值之彙整 135
dc.language.isozh-TW
dc.subjectWilk’s Lambda檢定zh_TW
dc.subject分類樹zh_TW
dc.subject多層判別分析zh_TW
dc.subjectGini Indexzh_TW
dc.subjectYouden’s Indexzh_TW
dc.subjectGini Indexen
dc.subjectYouden’s Indexen
dc.subjectClassification Treeen
dc.subjectMultilayer Classifieren
dc.titleCART分類樹及多層判別分析理論研究與改進zh_TW
dc.titleTheories and Enhancement of CART and Multi-layer Classifieren
dc.typeThesis
dc.date.schoolyear105-2
dc.description.degree碩士
dc.contributor.oralexamcommittee洪一薰,藍俊宏
dc.subject.keyword分類樹,多層判別分析,Gini Index,Youden’s Index,Wilk’s Lambda檢定,zh_TW
dc.subject.keywordClassification Tree,Multilayer Classifier,Gini Index,Youden’s Index,en
dc.relation.page139
dc.identifier.doi10.6342/NTU201703106
dc.rights.note未授權
dc.date.accepted2017-08-14
dc.contributor.author-college工學院zh_TW
dc.contributor.author-dept工業工程學研究所zh_TW
顯示於系所單位:工業工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-106-R04546036-1.pdf
  未授權公開取用
13 MBAdobe PDF
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved