Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98383
標題: Vocal2Fail:演奏不佳程度可控的人聲至破音直笛風格轉換
Vocal2Fail: Controllable Timbre Transfer and Evaluation for Failed Recorder Style
作者: 鍾乙綾
I-Ling Chung
指導教授: 吳沛遠
Pei-Yuan Wu
關鍵字: 失敗音樂,音色風格轉換,屬性向量,客觀指標,哼唱選歌,
failed music,timbre transfer,attribute vector,objective metrics,query by singing/humming,
出版年 : 2025
學位: 碩士
摘要: 音色轉換的目標是在保留輸入音訊內容的同時,改變其音色。在本研究中,我們深入探討「失敗音樂音色風格轉換」(failed music timbre transfer)任務,並開發一套能夠進行歌聲轉換為「破音直笛」的音色轉換系統,藉由屬性向量(attribute vector)實現對演奏失敗程度的可控調節。為了解決音色轉換領域中,特別是在「失敗音樂」情境下缺乏客觀評估標準的問題,我們引入一組客觀評估指標:用以捕捉病態聲音特徵的諧波噪音比(Harmonics-to-Noise Ratio, HNR)、用以衡量音高輪廓一致性的動態時間校正距離(Dynamic Time Warping, DTW),以及根據哼唱選歌(Query by Singing/Humming, QbSH)設計的旋律辨識度指標。實驗結果顯示,這些指標與人類感知高度一致,能有效反映可控的演奏失敗程度。我們的研究為音色轉換任務中的表現劣化評估與控制提供了穩健的基礎。
The goal of timbre transfer is to modify the timbre of an input audio while preserving its content. In this work, we conduct an in-depth investigation into the failed music timbre transfer by developing a vocal-to-failed-recorder timbre transfer system with an attribute vector for poor performance controllability. To address the lack of objective evaluation criteria in timbre transfer, particularly for failed music, we introduce a set of objective metrics: Harmonics-to-Noise Ratio (HNR) for capturing pathological sound traits, Dynamic Time Warping (DTW) distance for assessing pitch contour consistency, and Query by Singing/Humming (QbSH)-based metrics for quantifying melodic identity preservation. Experiments show these metrics align well with human perception and effectively reflect controllable poor performance. Our work offers a robust foundation for evaluating and controlling performance degradation in timbre transfer tasks.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98383
DOI: 10.6342/NTU202502619
全文授權: 同意授權(全球公開)
電子全文公開日期: 2025-08-06
顯示於系所單位:電信工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-113-2.pdf4.21 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved