Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 生物資源暨農學院
  3. 生物機電工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/7838
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor陳倩瑜
dc.contributor.authorPing-Cheng Wuen
dc.contributor.author吳秉承zh_TW
dc.date.accessioned2021-05-19T17:55:28Z-
dc.date.available2021-08-25
dc.date.available2021-05-19T17:55:28Z-
dc.date.copyright2016-08-25
dc.date.issued2016
dc.date.submitted2016-08-21
dc.identifier.citation1. American Society for the Control of Cancer, A. American Cancer Society | Information and Resources. 12 October 2015. Available at: http://www.cancer.org/.
2. Siegel, R., et al. 2014. Cancer statistics, 2014. CA: a cancer journal for clinicians. 64(1). 9-29.
3. Basseres, D.S., et al. 2012. Frequent downregulation of the transcription factor Foxa2 in lung cancer through epigenetic silencing. Lung cancer. 77(1). 31-37.
4. Cheung, W.K., et al. 2013. Control of alveolar differentiation by the lineage transcription factors GATA6 and HOPX inhibits lung adenocarcinoma metastasis. Cancer cell. 23(6). 725-738.
5. Fujita, J., et al. 2003. Expression of thyroid transcription factor-1 in 16 human lung cancer cell lines. Lung Cancer. 39(1). 31-36.
6. Ishii, J., et al. 2014. Class III/IV POU transcription factors expressed in small cell lung cancer cells are involved in proneural/neuroendocrine differentiation. Pathology international. 64(9). 415-422.
7. Crick, F.H., J.S. Griffith, and L.E. Orgel. 1957. Codes without commas. Proceedings of the National Academy of Sciences of the United States of America. 43(5). 416.
8. Crick, F. 1970. Central dogma of molecular biology. Nature. 227(5258). 561-563.
9. Valouev, A., et al. 2008. Genome-wide analysis of transcription factor binding sites based on ChIP-Seq data. Nature methods. 5(9). 829-834.
10. Jkwchui. 2012. ChIP-sequencing workflow. 13 October 2015. Available at: https://en.wikipedia.org/wiki/ChIP-sequencing#/media/File:Chromatin_immunoprecipitation_sequencing.svg.
11. Zhang, Y., et al. 2008. Model-based analysis of ChIP-Seq (MACS). Genome biology. 9(9). R137.
12. Institute, N.H.G.R. 2011. ENCODE: Encyclopedia of DNA Elements – ENCODE. 12 October 2015. Available at: https://www.encodeproject.org/.
13. Chien-Yu Chen , Huai-Kuang Tsai , Chen-Ming Hsu , Mei-Ju May Chen, Hao-Geng Hung ,Grace Tzu-Wei Huang , and Wen-Hsiung Li .2007 Discovering gapped binding sites of yeast transcription factors
14 Ben Langmead,Steven L Salzberg .2012 Fast gapped-read alignment with Bowtie 2
15 Ronald J. Evans, J. Boersma, N. M. Blachman, A. A. Jagers. The Entropy of a Poisson Distribution: Problem 87-6. SIAM Review. 1988
16 Andy Bunn,Mikko Korpela, Processed with dplR 1.6.4 in R version 3.2.4 (2016-03-10) on March 15, 2016Time Series Analysis in dplR
17 Teemu D Laajala, Sunil Raghav, Soile Tuomela, Riitta Lahesmaa, Tero Aittokallio and Laura L Elo BMC Genomics2009. A practical comparison of methods for detecting transcription factor binding sites in ChIP-seq experiments
18 Team, J.W.2013. The JASPAR database. 12 October 2015. Available at: http://jaspar.binf.ku.dk/.
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/7838-
dc.description.abstract染色質免疫沉澱定序技術,是用來尋找特定蛋白,例如轉錄因子,與其調控的基因一種方法,藉由這種技術我們可以大略的知道轉錄因子在人體DNA片段上的位置,然而這些被找到的轉錄因子結合位點的準確率尚未曾有研究做過系統性的討論。因此,本論文裡用TRANSFAC資料庫提供之已知的轉錄因子結合位點,針對染色質免疫沉澱技術鑑定之不同信心程度(FDR)下的轉錄因子結合位點進行整體性的預測表現評估,並輔以序列特徵資訊,增進其預測準確度。本論文使用了ENCODE資料庫的染色免疫沉澱資料來進行分析,且挑選了擁有不同細胞株的轉錄因子來做比較,整體而言,各個細胞株的結果顯示,經由ChIP-seq鑑定出的峰值區中,約六成會包含至少一個該特定轉錄因子的轉錄因子結合位。此外,本論文發現利用模序探勘所得之序列特徵結合ChIP-seq峰值區的資訊去預測轉錄因子結合位,經觀察確實可增加預測轉錄因子結合位的準確率,然而,使用不同FDR信心程度與不同的序列特徵,將會影響轉錄因子結合位的準確率。本論文之研究結果點出單純使用染色質免疫沉澱技術預測轉錄因子結合位點的缺陷,並提出序列特徵有助於改善預測結果,而可作為未來相關生物資訊預測方法之重要基礎。zh_TW
dc.description.abstractTranscription factors (TF) regulate gene expression in living organisms and influence multiple biological processes. Chromatin immunoprecipitation sequencing (ChIP-seq) is a technology that have been widely used to find transcription factor binding sites (TFBSs) of a specific TF among the DNA sequences of a genome. However, the accuracy of the TFBSs identified by ChIP-seq has not been systematically evaluated. In this regard, this thesis utilized TFBS information provided by the TRANSFAC database to validate the TFBSs identified by using ChIP-seq only with multiple false discovery rate (FDR). Moreover, in this thesis, a method incorporating de novo motif discovery was proposed to improve the performance of the predicted TFBSs. ChIP-seq data sampled from different cell lines was collected from ENCODE database. In general, ~60% of the peak regions identified by using the ChIP-seq only with a strict FDR cutoff (FDR = 0) contained at least one TFBS of the specific TF across multiple cell lines. In addition, by our proposed method, the prediction accuracy was improved and better than the results using ChIP-seq alone, though it was observed that the improved levels were affected by the used FDR cutoffs and discovered motifs. In conclusion, this thesis identified the accuracy problem of the ChIP-seq platform by observing from the data in a large scale, and address this issue by proposing a method incorporating de novo motif discovery. The observed results can serve as an important foundation for developing bioinformatics tools on TFBS prediction in future.en
dc.description.provenanceMade available in DSpace on 2021-05-19T17:55:28Z (GMT). No. of bitstreams: 1
ntu-105-R03631048-1.pdf: 1973664 bytes, checksum: cb17ff5aa1352f9320cf2181e78788fd (MD5)
Previous issue date: 2016
en
dc.description.tableofcontents目錄
論文口試委員審定書 i
誌謝 ii
中文摘要 iii
ABSTRACT iv
目錄 v
圖目錄 vii
表目錄 ix
第一章 研究目的 1
第二章 文獻探討 3
2.1 分子生物學中心法則 3
2.2 染色質免疫沉澱定序技術(ChIP-seq) 3
2.3.1 轉錄因子(Transcription factor) 4
2.3.2 轉錄因子結合位(Transcription Factor Binding Sites) 4
2.3.3 峰值(peak) 4
2.3.4 啟動子(Promoter) 5
2.4 細胞株與細胞系(Cell strain and cell line) 5
2.4.1 A549 細胞株 7
2.4.2 HeLa-S3 細胞株 8
2.4.3 GM12878 8
2.4.4 K562 9
2.4.5 Ishikawa 9
2.4.6 MCF-7 10
2.5 使用的工具 10
2.5.1 Bowtie2 10
2.5.2 MACS 11
2.5.3 泊松分佈(Poisson distribution) 11
2.5.4 位置頻率矩陣(position frequency matrix,PFM) 12
第三章 研究方法 13
3.1 ENCODE 資料庫 13
3.2 TRANSFAC 資料庫 14
3.3 參考基因組資料(Reference Genome) 14
3.4 實驗流程 15
3.4.1 序列回貼 19
3.4.2 求出峰值 19
3.4.3 篩選FDR 21
3.4.4 結合位特徵(Consensus, annotated motifs) 23
3.4.5 TOP500模序探勘 (De novo Motif Discovery) 25
第四章 結果與討論 26
4.1效果評估的參考數值 26
4.2 探討只使用ChIP-seq平台鑑定轉錄因子結合位的效果 27
4.3 透過整合各細胞株資料可增進預測之敏感度 28
4.4 利用已知的序列特徵資訊確信染色質免疫沉澱定序技術與增加準確度 32
4.5 利用模序探勘得到的序列特徵資訊可進一步增加準確度 35
第五章 結論 41
參考文獻 42
附件(一) CEBPB 44
附件(二) NR3C1 46
附件(三) MAFK 47

圖目錄
圖1.1 美國2014年癌症統計圖 Cancer Statistics, 2014,摘自文獻[2] 1
圖2.1 ATCC肺癌相關細胞株 7
圖3.1 ENCODE資料庫,摘自文獻[12] 13
圖3.2 實驗流程圖 15
圖3.3 ENCODE資料庫下載資料頁面 16
圖3.4 為MACS輸出的bed檔格式 20
圖3.5 TRANSFAC資料庫紀錄的位置與其對應的基因 21
圖3.6 CEBPB在TRANSFAC資料庫被記載的位置 22
圖3.7 為TRANSFAC資料庫中紀錄的的CEBPB結合位特徵 23
圖3.8 峰值被抽取出來的序列 24
圖3.9 結合位特徵找到的峰值與其找到的特徵 25
圖4.1 CEBPB轉錄因子的各細胞株不同FDR值的Sensitivity與Precision比較圖,單一條線上由左至右的點分別為FDR0、FDR0.5、FDR1、FDR5與No_filter。 27
圖4.2 CEBPB轉錄因子在A549細胞株下不同FDR值對於Sensitivity的影響 29
圖4.3 CEBPB轉錄因子在不同細胞株下不同FDR值對於Sensitivity的影響 30
圖4.4 CEBPB轉錄因子在所有的細胞株下不同FDR值對於Sensitivity影響的比較圖 31
圖4.5 A549細胞株對到TRANSFAC的未致數目的Precision與存在著TRANSFAC consensus的Precision比較 34
圖4.6 CEBPB在Ishikawa細胞株中,ChIP-seq平台與De novo method方法的Precision比較圖 38
圖4.7 CEBPB在MCF-7細胞株中,ChIP-seq平台與De novo method方法的Precision比較圖 38
圖4.8 TRANSFAC資料庫中CEBPB被紀錄的motif 39
圖4.9 為Ishikawa和MCF-7中Precision最高的motif 39
圖4.10 為A549細胞株與K562細胞株其中eTFBS找到的motif 40

表目錄
表2-1 A549細胞株資訊 7
表2-2 HeLa-S3細胞株資訊 8
表2-3 GM12878細胞株資訊 8
表2-4 K562細胞株資訊 9
表2-5 Ishikawa細胞株資訊 9
表2-6 MCF-7細胞株資訊 10
表3-1 轉錄因子與其對應的細胞株 17
表3-2 各個細胞株所代表的疾病 18
表3-3 為本實驗使用的細胞株和轉錄因子的免疫沉澱資料 19
表4-1 TRANSFAC資料庫中CEBPB的位置在不同細胞株中被對到的位置數目 28
表4-2 TRANSFAC資料庫中CEBPB的位置在不同細胞株中被對到的峰值數目 32
表4-3 TRANSFAC資料庫中CEBPB的consensus對到不同細胞株的峰值數目 33
表4-4 為CEBPB在A549細胞株中與De novo method的Precision 35
表4-5 為CEBPB在HeLa-S3細胞株中與De novo method的Precision 36
表4-6 為CEBPB在Ishikawa細胞株中與De novo method的Precision 36
表4-7 為CEBPB在MCF-7細胞株中與De novo method的Precision 37
表4-8 為CEBPB在K562細胞株中與De novo method的Precision 37
dc.language.isozh-TW
dc.title利用序列特徵提升使用染色質免疫沉澱定序平台預測轉錄因子結合位點之準確度zh_TW
dc.titleIncorporating sequence motifs to improve accuracy of predicting transcription factor binding sites using ChIP-seq dataen
dc.typeThesis
dc.date.schoolyear104-2
dc.description.degree碩士
dc.contributor.oralexamcommittee陳沛隆,蘇中才,吳君泰
dc.subject.keyword轉錄因子,轉錄因子結合位,模序探勘,染色質免疫沉澱,結合位特徵,zh_TW
dc.subject.keywordTranscription factor,transcription factor binding site,motif discovery,Chromatin immunoprecipitation sequencing,en
dc.relation.page47
dc.identifier.doi10.6342/NTU201603094
dc.rights.note同意授權(全球公開)
dc.date.accepted2016-08-22
dc.contributor.author-college生物資源暨農學院zh_TW
dc.contributor.author-dept生物產業機電工程學研究所zh_TW
顯示於系所單位:生物機電工程學系

文件中的檔案:
檔案 大小格式 
ntu-105-1.pdf1.93 MBAdobe PDF檢視/開啟
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved