Please use this identifier to cite or link to this item:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/82115| Title: | DNA 甲基化插補方法之比較研究 A comparative study on DNA methylation imputation methods |
| Authors: | Wei-Lun Weng 翁偉倫 |
| Advisor: | 林菀俞(WAN-YU LIN) |
| Keyword: | 資料插補,基因甲基化,臺灣人體生物資料庫,K-近鄰演算插補法,鏈式方程多重插補法, Imputation,DNA methylation,Taiwan Biobank,K Nearest Neighbors impute algorithm,Multiple Imputation by Chained Equations, |
| Publication Year : | 2021 |
| Degree: | 碩士 |
| Abstract: | DNA 甲基化是表觀遺傳學中十分重要的生物標記,且已被許多研究證實 DNA 甲基化與人體生物功能如老化、癌症、過敏及糖尿病等具有高相關性。然而透過甲基化分析晶片收集得的甲基化數據卻可能因為包含許多遺失值而增加後續甲基化資料分析之困難度,因此甲基化研究必須經過插補方法得出替換值進行資料插補的動作。本研究使用了三類插補方法分別為單位插補法、K-近鄰演算插補法及鏈式方程多重插補法,考慮了方法中許多參數組合並且加入了位點與位點之間的相關程度進入本研究的方法中。 於實際資料中本研究使用臺灣人體生物資料庫全基因體甲基化晶片資料的 2091 位參與者,根據不同的缺失機制製作出相對應得模擬資料集,並且針對不同的模擬資料集比對出三類插補方法中最為適合的插補方法。最終本研究測定出的結果在遺失比例小的完全隨機缺失機制及隨機缺失機制下,使用均方根誤差作為最終評價指標時使用 K-近鄰演算插補法並且考慮甲基化位點之間相關性可以得到最好的預測插補值,而使用平均絕對誤差作為最終評價指標則使用鏈式方程多重插補法可以得到最好的預測插補值。但是遺失比例較大的資料集則本研究會建議不論最終評價指標為何,使用 K-近鄰演算插補法均可以得到最好的插補結果。 本研究之結果指出,評價指標、遺失比例及缺失機制等要素均會影響插補結果的好壞,並且加入甲基化位點之間相關性的插補方法可以顯著的減少插補誤差。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/82115 |
| DOI: | 10.6342/NTU202103931 |
| Fulltext Rights: | 同意授權(限校園內公開) |
| metadata.dc.date.embargo-lift: | 2024-09-01 |
| Appears in Collections: | 流行病學與預防醫學研究所 |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| U0001-2010202115270900.pdf Access limited in NTU ip range | 2.35 MB | Adobe PDF |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
