Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 公共衛生學院
  3. 流行病學與預防醫學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/82115
標題: DNA 甲基化插補方法之比較研究
A comparative study on DNA methylation imputation methods
作者: Wei-Lun Weng
翁偉倫
指導教授: 林菀俞(WAN-YU LIN)
關鍵字: 資料插補,基因甲基化,臺灣人體生物資料庫,K-近鄰演算插補法,鏈式方程多重插補法,
Imputation,DNA methylation,Taiwan Biobank,K Nearest Neighbors impute algorithm,Multiple Imputation by Chained Equations,
出版年 : 2021
學位: 碩士
摘要: DNA 甲基化是表觀遺傳學中十分重要的生物標記,且已被許多研究證實 DNA 甲基化與人體生物功能如老化、癌症、過敏及糖尿病等具有高相關性。然而透過甲基化分析晶片收集得的甲基化數據卻可能因為包含許多遺失值而增加後續甲基化資料分析之困難度,因此甲基化研究必須經過插補方法得出替換值進行資料插補的動作。本研究使用了三類插補方法分別為單位插補法、K-近鄰演算插補法及鏈式方程多重插補法,考慮了方法中許多參數組合並且加入了位點與位點之間的相關程度進入本研究的方法中。 於實際資料中本研究使用臺灣人體生物資料庫全基因體甲基化晶片資料的 2091 位參與者,根據不同的缺失機制製作出相對應得模擬資料集,並且針對不同的模擬資料集比對出三類插補方法中最為適合的插補方法。最終本研究測定出的結果在遺失比例小的完全隨機缺失機制及隨機缺失機制下,使用均方根誤差作為最終評價指標時使用 K-近鄰演算插補法並且考慮甲基化位點之間相關性可以得到最好的預測插補值,而使用平均絕對誤差作為最終評價指標則使用鏈式方程多重插補法可以得到最好的預測插補值。但是遺失比例較大的資料集則本研究會建議不論最終評價指標為何,使用 K-近鄰演算插補法均可以得到最好的插補結果。 本研究之結果指出,評價指標、遺失比例及缺失機制等要素均會影響插補結果的好壞,並且加入甲基化位點之間相關性的插補方法可以顯著的減少插補誤差。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/82115
DOI: 10.6342/NTU202103931
全文授權: 同意授權(限校園內公開)
電子全文公開日期: 2024-09-01
顯示於系所單位:流行病學與預防醫學研究所

文件中的檔案:
檔案 大小格式 
U0001-2010202115270900.pdf
授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務)
2.35 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved