Please use this identifier to cite or link to this item:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/80912| Title: | 自動和弦辨識針對大詞彙集改善之研究 A Study for Improving Large-vocabulary Automatic Chord Recognition |
| Authors: | Chia-Hsin Lee 李嘉欣 |
| Advisor: | 黃乾綱(Chien-Kang Huang) |
| Keyword: | 自動和弦辨識,深度學習,卷積神經網路,雙向長短期記憶神經網路,條件隨機域, Automatic Chord Recognition(ACR),Convolutional Neural Network(CNN),Bi-directional Long Short Term Memory(BLSTM),Conditional Random Fields(CRF), |
| Publication Year : | 2021 |
| Degree: | 碩士 |
| Abstract: | 和弦辨識的能力在於音樂作曲、音樂彈奏演唱的領域皆是十分重要的技術之一,過去人們多以手工標註的方式來完成,但這樣的方式除了需要耗費大量的勞力和時間外,更需要具備相當的專業音樂知識。因此,本研究提出一自動和弦辨識模型(Automatic Chord Recognition System),通用於辨識小詞彙集及大詞彙集和弦,在提升小詞彙集辨識分數的同時,亦改善在大詞彙集和弦上之表現,其中包括增加辨識的和弦種類以及評估分數之提升。 在現今的自動和弦辨識研究中,使用深度學習的神經網路架構已成為主流,人們可以針對不同的需求,去建立不同的模型。我們在實驗中利用三個流通資料集作為訓練及測試資料,設計了一個以卷積神經網路為基礎的特徵萃取器,加上以雙向長短期記憶神經網路 (bi-directional long short term memory)及條件隨機域 (conditional random fields)設計之解碼模型,分別對於小詞彙集和弦以及大詞彙集和弦進行實驗。其中,在小詞彙集的實驗中,WCSR(Weighted Chord Symbol Recall)分數平均可達到84.3%,與同為使用深度學習架構的模型相比,最高可提升8.8%,顯示了我們所設計模型中的之特徵萃取器,能夠有效地學習到更精準的特徵,且與解碼模型配合時能有效地達到提升辨識率之目的。接著,在大詞彙集的實驗中,我們將評估指標由原本的一個增加到六個,且在擴增可辨識和弦種類的同時,維持原本小詞彙集和弦的辨識率,且在七和弦評估標籤中WCSR分數獲得71.5%,四重音評估標籤中WCSR分數獲得66.1%,與其他模型相比提升約1-2%。 為了達到改善大詞彙集辨識率的目的,我們更加入兩種方法以提升分數。首先,我們針對稀缺的七和弦,加入新的訓練資料,試圖解決在現有資料集中和弦分佈不均的問題,並在七和弦評估標籤中獲得WCSR分數72.1%,較原先提升0.6%。再來,我們撇除掉現今大部分研究所使用的扁平分類概念,回歸到和弦原始的精確定義,針對決定和弦種類的關鍵音符設計一個閾值規制決策法,並用以評估這些複雜的擴展和弦,並在七和弦評估標籤中WCSR分數獲得74.5%,共提升3%,四重音評估標籤中WCSR分數獲得68.4%,共提升2.3%,且同時可辨認轉位和弦,可辨識和弦量提升為原先之三倍。藉由這兩大部分的實驗,有效地驗證了此模型之通用性,並改善大詞彙集和弦之辨識率以及增加可辨識和弦的數量。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/80912 |
| DOI: | 10.6342/NTU202103229 |
| Fulltext Rights: | 同意授權(限校園內公開) |
| Appears in Collections: | 工程科學及海洋工程學系 |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| U0001-1709202105281000.pdf Access limited in NTU ip range | 8.65 MB | Adobe PDF |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
