請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/80912| 標題: | 自動和弦辨識針對大詞彙集改善之研究 A Study for Improving Large-vocabulary Automatic Chord Recognition |
| 作者: | Chia-Hsin Lee 李嘉欣 |
| 指導教授: | 黃乾綱(Chien-Kang Huang) |
| 關鍵字: | 自動和弦辨識,深度學習,卷積神經網路,雙向長短期記憶神經網路,條件隨機域, Automatic Chord Recognition(ACR),Convolutional Neural Network(CNN),Bi-directional Long Short Term Memory(BLSTM),Conditional Random Fields(CRF), |
| 出版年 : | 2021 |
| 學位: | 碩士 |
| 摘要: | 和弦辨識的能力在於音樂作曲、音樂彈奏演唱的領域皆是十分重要的技術之一,過去人們多以手工標註的方式來完成,但這樣的方式除了需要耗費大量的勞力和時間外,更需要具備相當的專業音樂知識。因此,本研究提出一自動和弦辨識模型(Automatic Chord Recognition System),通用於辨識小詞彙集及大詞彙集和弦,在提升小詞彙集辨識分數的同時,亦改善在大詞彙集和弦上之表現,其中包括增加辨識的和弦種類以及評估分數之提升。 在現今的自動和弦辨識研究中,使用深度學習的神經網路架構已成為主流,人們可以針對不同的需求,去建立不同的模型。我們在實驗中利用三個流通資料集作為訓練及測試資料,設計了一個以卷積神經網路為基礎的特徵萃取器,加上以雙向長短期記憶神經網路 (bi-directional long short term memory)及條件隨機域 (conditional random fields)設計之解碼模型,分別對於小詞彙集和弦以及大詞彙集和弦進行實驗。其中,在小詞彙集的實驗中,WCSR(Weighted Chord Symbol Recall)分數平均可達到84.3%,與同為使用深度學習架構的模型相比,最高可提升8.8%,顯示了我們所設計模型中的之特徵萃取器,能夠有效地學習到更精準的特徵,且與解碼模型配合時能有效地達到提升辨識率之目的。接著,在大詞彙集的實驗中,我們將評估指標由原本的一個增加到六個,且在擴增可辨識和弦種類的同時,維持原本小詞彙集和弦的辨識率,且在七和弦評估標籤中WCSR分數獲得71.5%,四重音評估標籤中WCSR分數獲得66.1%,與其他模型相比提升約1-2%。 為了達到改善大詞彙集辨識率的目的,我們更加入兩種方法以提升分數。首先,我們針對稀缺的七和弦,加入新的訓練資料,試圖解決在現有資料集中和弦分佈不均的問題,並在七和弦評估標籤中獲得WCSR分數72.1%,較原先提升0.6%。再來,我們撇除掉現今大部分研究所使用的扁平分類概念,回歸到和弦原始的精確定義,針對決定和弦種類的關鍵音符設計一個閾值規制決策法,並用以評估這些複雜的擴展和弦,並在七和弦評估標籤中WCSR分數獲得74.5%,共提升3%,四重音評估標籤中WCSR分數獲得68.4%,共提升2.3%,且同時可辨認轉位和弦,可辨識和弦量提升為原先之三倍。藉由這兩大部分的實驗,有效地驗證了此模型之通用性,並改善大詞彙集和弦之辨識率以及增加可辨識和弦的數量。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/80912 |
| DOI: | 10.6342/NTU202103229 |
| 全文授權: | 同意授權(限校園內公開) |
| 顯示於系所單位: | 工程科學及海洋工程學系 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| U0001-1709202105281000.pdf 授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務) | 8.65 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
