Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/34098
標題: 選擇標籤單核苷酸多型性的改良演算法
Improved Algorithms for the Selection of Tag SNPs
作者: Chia-Jung Chang
張家榮
指導教授: 趙坤茂
關鍵字: 單核&#33527,酸多型性,連鎖不平衡,單體型,
Single Nucleotide Polymorphism,Linkage Disequilibrium,Haplotype,
出版年 : 2005
學位: 碩士
摘要: 近期研究顯示,觀察人類族群的連鎖不平衡(Linkage Disequilibrium ; LD)形式可發現其形成類似區塊的結構。整條染色體可被切割成高連鎖不平衡區和低連鎖不平衡區互為間隔。 其中高連鎖不平衡區被稱為單體型區塊(haplotype block)。在單體型區塊中,單體型的樣式數量有限。因此,只需要少量的單核苷酸多型性(Single Nucleotide Polymorphism ;SNP)就足以辨別出各種單體型樣式。而這些少量的SNPs稱為標籤SNPs
為了尋找最少量的標籤SNPs,我們提出一個結合分支設限演算法(branch-and-bound)和貪婪演算法 (greedy algorithm) 的方法。該方法探索更大的解空間,以得到比傳統的貪婪演算法更好的解。它還允許使用者在效率和最佳解之間做取捨。這個演算法經由我們實做已經在各種模擬和生物的數據做測試。實驗結果指出, 比起之前的方法, 我們的方法能找到更少量的標籤SNPs。這個方法還可以相當普遍地被應用在其他貪婪演算法可解的問題上面。
另外,藉由結合一條染色體上任兩兩SNPs的關連性的資料,我們可以減少標籤 SNPs的數量。某些標籤SNPs 和其他標籤SNPs擁有完全的關連性。如此,可從完全關連性推斷其值的標籤SNPs可以從原先找到的標籤SNPs中刪除。依這個觀念, 我們提出了兩個方法以減少標籤SNPs的數量。 第一個方法是對現有的演算法所找到的標籤SNPs做後製處理。第二個方法則是一開始找標籤SNPs的時候就考慮SNPs間的關連性。實驗結果顯示,兩種方法都可以減少標籤SNPs的數量而不會損害原有標籤SNPs所包含的資訊。
Recent studies have shown that the patterns of Linkage Disequilibrium (LD) observed
in the human population reveal a block-like structure. The entire chromosome can be
partitioned into high LD regions interspersed by low LD regions. The high LD regions
are usually called “haplotype blocks”. Within a haplotype block, there are only few
haplotype patterns and only a small subset of SNPs (called tag SNPs) are sufficient to
distinguish these patterns.
To solve the problem of finding tag SNPs, we propose a hybrid method that combines
the ideas of the branch-and-bound method and the greedy algorithm. This method
explores larger solution space to obtain a better solution than a traditional greedy algorithm.
It also allows the user to adjust the efficiency of the program and quality of
solutions. This algorithm has been implemented and tested on a variety of simulated
and biological data. The experimental results indicate that our program can find better
solutions than previous methods. This approach is quite general since it can be used to
adapt other greedy algorithms to solving their corresponding problems.
In addition, we can reduce the number of tag SNPs even more by considering the
extent of linkage disequilibrium in the human genome. We show that the extent of LD
can be also used to boost the heavy computation of computation of pairwise LD by giving
a faster algorithm. We propose two methods of which the first is a posterior approach
based one existing algorithms and the second identifies tag SNPs by considering the
correlation between SNPs from the beginning. The experimental results show that our
methods can reduce the number of tags SNPs in comparison with previous methods and the efficiency is significantly improved.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/34098
全文授權: 有償授權
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-94-1.pdf
  未授權公開取用
709.32 kBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved