Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/93368
標題: 透過機器學習結合多重基因風險指數預測心肌病變
Machine Learning Aggregates Polygenic Risk Scores for Cardiomyopathy Disease Prediction
作者: 許紅媛
Hung-Yuan Hsu
指導教授: 賴飛羆
Feipei Lai
共同指導教授: 莊志明
Jyh-Ming Jimmy Juang
關鍵字: 心肌病,臺灣生物資料庫,單核苷酸多態性,多基因風險分數,全基因組關聯研究,機器學習,
cardiomyopathy,Taiwan Biobank,single nucleotide polymorphisms,genome-wide association studies,polygenic risk scores,machine learning,
出版年 : 2023
學位: 碩士
摘要: 本研究旨在運用機器學習技術,結合多基因風險分數,預測心肌病的發生。我們採用臺灣大學醫學院附設醫院(NTUH)和臺灣生物資料庫(TWB)的資料集,首先進行全基因組關聯研究(GWAS),以確定單核苷酸多態性(SNPs)、二元特徵和年齡之間的相關性。隨後在多基因風險分數(PRS)分析中,我們從發現性GWAS中獲取具體權重(連續特徵的β值和二元特徵的對數比率)。計算目標樣本中所有個體的PRS後,這些分數可以應用於邏輯回歸分析中,預測與感興趣特徵有遺傳重疊的特徵。我們使用先進的機器學習模型和交叉驗證技術,評估NTUH和TWB數據集中預測心肌病發展的準確性。在評估中,我們考慮了多種心肌病特徵和預測因素,包括PRS、作為潛在危險因素的臨床參數和ICD-10以及ICD-10-CM。
The main goal of this study is to utilize machine learning techniques to combine polygenic risk scores and predict the occurrence of cardiomyopathy disease. To achieve this, we employ datasets from the National Taiwan University Hospital and Taiwan Biobank and conduct initial genome-wide association studies to identify correlations between single nucleotide polymorphisms and phenotype [4].
Afterwards, for the analysis of polygenic risk scores, specific weights are derived from discovery genome-wide association studies. These weights are then used to calculate the polygenic risk scores for all individuals in the target sample. These scores can be utilized in a firth regression analysis to predict phenotype that are expected to have genetic overlap with the specific trait of interest, i.e., cardiomyopathy [4].
To evaluate the accuracy of predicting cardiomyopathy development, we use cutting-edge machine learning models and cross-validation techniques on both the National Taiwan University Hospital and Taiwan Biobank datasets. In our evaluation, we take into account various cardiomyopathy features and predictors, including polygenic risk scores, clinical parameters as potential risk factors, as well as ICD-10 and ICD-10-CM codes [9].
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/93368
DOI: 10.6342/NTU202401923
全文授權: 同意授權(全球公開)
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-112-2.pdf1.19 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved