請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/48009
標題: | 二維氣相層析質譜圖之滯留時間校準演算法 Alignment Algorithm for Comprehensive Two-dimensional Gas Chromatography-Mass Spectrometry |
作者: | Tze-Feng Tian 田士鋒 |
指導教授: | 曾宇鳳(Y. Jane Tseng) |
關鍵字: | 二維氣相層析質譜圖滯留時間校正,2DGCMS-aligner,系統生物學的網路視覺化工具,人類代謝本體資料庫,代謝體學, 2DGC alignment,2DGCMS-aligner,Systems Biology Visualization,Human Metabolome Ontology,Metabolomics, |
出版年 : | 2011 |
學位: | 碩士 |
摘要: | 這篇論文包含了三個主題,第一個主題是二維氣相層析質譜圖的滯留時間校準演算法,第二個主題是3Omics:整合轉錄體學,蛋白質體學與代謝體學之系統生物學網路視覺化工具,第三個主題是人類代謝本體資料庫。
二維氣相層析質譜圖 (GCxGC-MS) 在代謝體實驗分析上帶來了更佳的分離能力,選擇性與靈敏度。在分析過程中,隨著時間或無法控制的環境因素如溫度,壓力,基質效應,或靜相降解將會造成分批注入的同樣樣品或不同樣品上的同個訊號在層析圖滯留時間上有所偏移。本篇開發的滯留時間校正演算法-2DGCMS-aligner,能夠直接使用由儀器產生的netCDF格式,偵測層析質譜圖上的訊號並使用歐式距離與Pearson相關係數來校正偏移的訊號。這個演算法已被實作成一套完整的GCxGC-MS數據分析軟體。這個軟體的功能包含了基線校正,波峰偵測,滯留時間校正與數據視覺化,可用在常規的分析上。此滯留時間演算法使用了在不同實驗條件下產生的數據作為展示並有效的矯正了滯留時間的偏移,在計算的準確度上勝於現有的滯留時間校正演算法。 3Omics 是一個能夠整合系統生物學的網路視覺化工具。它能快速整合人體的轉錄體,蛋白質體與代謝體的實驗數據以分析其關聯性並將結果視覺化。一個生化反應的上中下游之分析經整合轉錄體,蛋白質體與代謝體數據,可在3Omics透過相關網路分析 (Correlation Network),共同表現分析 (Co-expression),表現型分析 (Phenotyping),KEGG生物途徑集分析 (KEGG Pathway Enrichment) 與基因本體集 (GO enrichment) 分析而理解人體系統如何行使功能。3Omics透過相關網路來顯示在時間序列或不同實驗條件上的生物組學之間的關係。若三種生物組學的數據中缺少一種,3Omics會使用PubMed文獻資料庫中的轉錄體,蛋白質體與代謝體資訊來填補。共同表現分析能夠協助探索生物組學間的共同功能。表現型分析整合了人類孟德爾遺傳學資料庫的資料。KEGG生物途徑富集分析使用代謝體的數據並在KEGG資料庫中探索富集的生物途徑。基因本體富集分析幫助使用者找出顯著表現的轉錄數據所對應的基因本體。3Omics將現有的軟體之優點與功能納入其中,簡化了數據分析的程序並讓使用者只需要簡單的操作就能夠得到分析的結果。視覺化與分析結果也可讓使用者下載作為後續的分析使用。使用者可以到http://cmdd.csie.ntu.edu.tw/~3omics免費取得並使用。 在最後的章節中,我們建立了人類代謝本體資料庫 (Human Metabolome Ontology)。目前在代謝體的分析流程中,對於代謝體的生物意義進行評估與解釋需要手動收集各種零散的文獻如Gene Ontology,BRENDA,KEGG Brite,KEGG Pathway,人類代謝體資料庫,OMIM等等工程繁瑣。我們開發了人類代謝本體資料庫 (HMO) 來加速整合各種代謝體功能,代謝體化學結構分類以及代謝體與其交互作用的目標,藉此能夠為後續的計算分析提供穩健的基礎生醫知識架構。HMO提供了三個獨立的本體:生物功能,化學結構分類與代謝體目標。生物功能是指代謝體所涉及的代謝途徑。化學性質分類闡述了代謝體的來源如內生性或衍生性,以及其化學結構分類如碳水化合物,脂質。代謝體目標提供了代謝體作用的目標物,其代謝體組成與其他代謝體之交互作用,以及目標在組織或細胞的所在位置。HMO以Open Biomedical Ontology (OBO) 的格式架設在擁有友善介面的網路應用程式上。目前的HMO版本包含了16120個代謝物,1840個代謝體目標以及161個與代謝體相關的疾病。HMO的名詞包含了408個生物功能,129個化學性質分類,以及22837個代謝體目標。HMO在本體領域上建立了詳盡的代謝體資源資料庫中心,讓使用者能夠利用與共享資源。使用者可以到http://cmdd.csie.ntu.edu.tw/~hmo免費取得並使用。 Three works are included in this thesis including 1) an algorithm for Comprehensive two-dimensional gas chromatography mass spectrometry alignment, 2) 3Omics: a web based systems biology visualization tool for integrating human transcriptomic, proteomic and metabolomic data, and 3) HMO: a tool for understanding the human metabolome. A novel peak alignment algorithm, 2DGCMS-aligner, has been developed for two-dimensional gas chromatography time-of-flight mass spectrometry (GCxGC/TOF-MS) data. 2DGCMS-aligner uses the netCDF data generated from the instrument as input directly. It detects blobs, clusters of pixels that are brighter or darker than their surround in a chromatogram, of each GCxGC/TOF-MS raw data to generate blob tables instead of peak tables to perform alignment. 2DGCMS-aligner correlates the blobs with Euclidean distance of the first- and second retention times in the blob tables and the mass spectra with Pearson’s correlation coefficient. This alignment algorithm in 2DGCMS-aligner can be applied to GCxGC-MS data generated by either consistent or inconsistent instrument environment to adjust retention time shifts along both chromatographic dimensions caused by uncontrollable fluctuations in temperature and pressure, matrix effects and stationary phase degradation. 2DGCMS-aligner also includes an option to correct baseline on raw data directly. The performance of 2DGCMS-aligner peak alignment algorithm was compared and demonstrated with three existing alignment methods on the two sets of GCxGC-MS data sets acquired in different experiment conditions and a mixture of standard metabolites. 3Omics: a web based systems biology visualization tool for integrating human transcriptomic, proteomic and metabolomic data was developed to visualize and rapidly integrate multiple inter- or intra-transcriptomic, proteomic, and metabolomic human data. A biochemical cascade is generated through consolidation of transcript, protein, and metabolite data and implements via the application of five commonly used analyses of correlation network, co-expression, phenotyping, KEGG pathway enrichment, and GO enrichment. 3Omics incorporates the advantages and operations of existing software into a single platform, therefore simplifying the data analysis procedure and enabling the user to perform a one-click integrated analysis for free. Visualization and analysis results are downloadable for further user customization and analysis. The 3Omics software can be freely accessed at http://cmdd.csie.ntu.edu.tw/~3omics. Last part of this thesis work is the construction of Human Metabolome Ontology (HMO). Final step in current metabolomics studies involves assessment and biological interpretation of metabolome. It often requires tedious manual collections of literature or linking information scattered in Gene Ontology, BRENDA, KEGG Brite, KEGG Pathway, Human Metabolome Database, OMIM and so on. We developed the HMO to facilitate integration of biological functions, and chemical classification of metabolome and comprehensive understanding of metabolome and its target interactions as the common language and knowledge framework allowing further computational analysis. HMO consists of three independent ontologies: biological functions, chemical taxonomies and metabolome targets. It provides a comprehensive metabolome centered resource that enables the sharing and reuse of the know-ledge across domains of ontologies. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/48009 |
全文授權: | 有償授權 |
顯示於系所單位: | 電機工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-100-1.pdf 目前未授權公開取用 | 5.48 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。