請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/32280
標題: | 運用D-Separation性質與淨相關建構連續狀態的貝氏網路 Construction of Continuous-State Bayesian Networks Using D-Separation Property and Partial Correlations |
作者: | Chia-Yi Chien 簡佳怡 |
指導教授: | 陳正剛 |
關鍵字: | 貝氏網路,淨相關,節點順序,連,續變數, Bayesian network,d-separation,partial correlation,node ordering,continuous states, |
出版年 : | 2006 |
學位: | 碩士 |
摘要: | 由於生物晶片技術發展,一次的實驗即可提供我們大量的基因表現資料,利用這些資料可以幫助我們了解整個基因機制。目前已經發展許多方法用來分析生物晶片的資料,例如:集群分析法、因子分析法與貝氏網路。貝氏網路可以幫助生物學家了解更多潛藏在生物晶片資料後的生物資訊。一般來說,建立貝氏網路的方法可以分為兩類:搜尋與分數方法(search-and-score)和條件限制方法(constraint-based). 如何快速有效地建立基因網路對生物技術方法的研究者來說是一個極大的挑戰。
在建立基因網路之前,第一個會遇到的問題就是節點的先後順序,而且現實生活中真正的順序通常是不知道的。所以在本研究中,我們發展一個方法用來尋找可能的節點順序藉由d-separation的性質,我們的方法包含三種分配節點的作法,當應用我們的方法來可以尋找到三種可能的節點順序。我們也提出一個建立基因網路的方法藉由d-separation的性質與淨相關來分析連續變數。我們的方法是屬於條件限制的方法。最後,我們運用提出的方法來分析兩個實際的例子; 一個是酵母菌細胞週期的資料,另外一個是細胞凋亡的資料。 The development of microarray technology is capable of generating a huge amount of gene expression data at once to help us analyze the whole genome mechanism. Many analysis methods have been developed and applied to analyze the microarray data, such as Clustering analysis, Factor analysis and Bayesian networks. Bayesian networks can better help biologists to understand the biological meanings behind the microarray data. In general, algorithms of Bayesian network construction can be divided into two categories: the search-and-score approach and the constraint-based approach. How to construct Bayesian networks rapidly and efficiently become a challenge to biotechnology researches. Before constructing a Bayesian network, the node ordering is the first difficulty and the actual node ordering is usually unknown. In this research, we develop a method to search for possible node orderings based on the d-separation property. There are three assigning procedures in the node ordering algorithm. With the proposed ordering procedures, we produce three possible node sequences. We also propose an algorithm of Bayesian network construction by using d-separation property and partial correlation to analyze variables with continuous states. Our algorithm is one of to the constraint-based approaches. Finally, we apply our algorithm to two real-word cases; one is the Saccharomyces cerevisiae cell cycle gene expression data collected by Spellman et al., and the other is the caspases data. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/32280 |
全文授權: | 有償授權 |
顯示於系所單位: | 工業工程學研究所 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-95-1.pdf 目前未授權公開取用 | 694.27 kB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。