Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 生物資源暨農學院
  3. 生物機電工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/78404
標題: 以深度學習預測跨物種基因轉錄起始點位
predicting cross-species gene transcription start site using deep learning
作者: WEI LUN KAO
高偉倫
指導教授: 陳倩瑜(Chien Yu Chen)
關鍵字: 轉錄起始點位,機器學習,深度學習,卷積神經網路,
transcription start site,machine learning,deep learning,convolution neural network,
出版年 : 2020
學位: 碩士
摘要: 基因轉錄的研究有廣泛的生物學意義,是發生 在 遺傳學和分子遺傳學的重要研究領域。 基因調控結果,造就了 不同 組織或不同類型細胞 之間的差異,也可以說是 生物體內控制基因表達的機制 。 基因調控可分為很多部分,其中 轉錄 起始點位(Transcription Start Site 簡稱 TSS)便是基因進行轉錄的 起始點,其後方便開始 基因轉錄的 表現 本論文透過深度學習架構, 評估其應用於預測 基因 轉錄 起始點位 之可行性 ,並且嘗試做出跨物種的基因轉錄起始點位預測模型,調整適合的參數並且增進其預測精準度,嘗試建立一套可用於跨物種預測的工具 。 本 論文使用 NCBI所提供的 資料庫資料進行分析,且挑選 數種不同的物種取出其轉錄起始點位序列片段將其組合 進行預測, 透過 NCBI上的 GFF檔案,加上 FASTA檔案所提供的序列,我們可以 知道轉錄 起始點位在各物種 DNA片段上的位置,並且將資料處理過後建立多套深度學習之 卷積神經網路 (CNN)的預測 模型, 試圖 評估在不同物種的DNA序列上 預測出轉錄起始點位 的準確度 。 此工具的開發能有助於未來再發現到新物種的時候能夠對其基因所在的位置快速做預測,提供初步的評估考量,而非每次總需要 重新訓練出一套神經網路 ,省下許多重新評估的時間。 未來能透過本論文所建立的神經網路模型進行轉錄起始點位預測,省下大量的時間和金錢在不必要的地方上,而作為未來相關生物資訊對於轉錄相關研究造成影響的基礎。
The studies of gene transcription are very important science they are meaningful to a creature. The regulations of the genes make the cells and the tissues unique and different. There are many parts in gene regulation. One of them is Transcription Start Site(TSS). The subsequences after TSS play roles in transcription. In this study, we try to use convolution neural network to make a model to predict cross-species TSS, and then evaluate the performance of the model. We try to improve the performance and make it a useful tool.In this study, we use the database from NCBI. We pick up some species’ gene sequences as our data. We could know the sequence which content TSS through the GFF files and the FASTA files on the NCBI website. After the data processing, we built many deep learning models and evaluated the performance on different species’ TSS. The development of the tool would help to identify the gene location after finding a new species in the future, giving a suggestion of possible locations of TSSs, so people don’t have to train a new model for a specific species which waste a lot of time. This would give a positive effect on the researches of biology.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/78404
DOI: 10.6342/NTU202001021
全文授權: 有償授權
電子全文公開日期: 2025-06-23
顯示於系所單位:生物機電工程學系

文件中的檔案:
檔案 大小格式 
U0001-1806202009280300.pdf
  未授權公開取用
2.43 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved