Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資料科學學位學程
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/66127
標題: 專為旋律提取設計的流線型編碼器/解碼器架構
A streamlined encoder/decoder architecture for melody
extraction
作者: Tsung-Han Hsieh
謝宗翰
指導教授: 李琳山(Lin-shan Lee)
共同指導教授: 楊奕軒(Yi-Hsuan Yang)
關鍵字: 旋律提取,編碼/解碼器,
melody extraction,encoder/decoder,
出版年 : 2019
學位: 碩士
摘要: 在音樂信號處理的領域中,旋律提取一直是很重要的任務。在本論文中,我們提出了一個專為此設計的流線型編碼/解碼器網路模型。我們有兩項技術貢獻。首先,啟發於一個最先進的語意像素分割模型,我們通過向下池化層和向上池化層之間的池化索引來定位旋律頻率。我們用更少的卷機層與更簡單的卷積模塊就可以達到接近最先進水平的結果。第二,我們提出了一種使用神經網路中瓶頸層來預測每ㄧ楨中旋律是否存在的方法,並且使得我們不需要取闕值,可以用簡單的arg-max函數來獲得最終結果。我們的實驗在人聲旋律提取及主旋律旋律提取上,兩者都驗證了模型的有效性。
Melody extraction in polyphonic musical audio is important for music signal processing. In this paper, we propose a novel streamlined encoder/decoder network that is designed for the task. We make two technical contributions. First, drawing inspiration from a state-of-the-art model for semantic pixelwise segmentation, we pass through the pooling indices between pooling and un-pooling layers to localize the melody in frequency. We can achieve result close to the state-of-the-art with much fewer convolutional layers and simpler convolution modules. Second, we propose a way to use the bottleneck layer of the network to estimate the existence of a melody line for each time frame, and make it possible to use a simple argmax function instead of ad-hoc thresholding to get the final estimation of the melody line. Our experiments on both vocal melody extraction and general melody extraction validate the effectiveness of the proposed model.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/66127
DOI: 10.6342/NTU202000419
全文授權: 有償授權
顯示於系所單位:資料科學學位學程

文件中的檔案:
檔案 大小格式 
ntu-108-1.pdf
  目前未授權公開取用
2.07 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved