自動和弦辨識針對大詞彙集改善之研究

Chia-Hsin Lee; 李嘉欣

Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/80912

Title:	自動和弦辨識針對大詞彙集改善之研究 A Study for Improving Large-vocabulary Automatic Chord Recognition
Authors:	Chia-Hsin Lee 李嘉欣
Advisor:	黃乾綱(Chien-Kang Huang)
Keyword:	自動和弦辨識,深度學習,卷積神經網路,雙向長短期記憶神經網路,條件隨機域, Automatic Chord Recognition(ACR),Convolutional Neural Network(CNN),Bi-directional Long Short Term Memory(BLSTM),Conditional Random Fields(CRF),
Publication Year :	2021
Degree:	碩士
Abstract:	和弦辨識的能力在於音樂作曲、音樂彈奏演唱的領域皆是十分重要的技術之一，過去人們多以手工標註的方式來完成，但這樣的方式除了需要耗費大量的勞力和時間外，更需要具備相當的專業音樂知識。因此，本研究提出一自動和弦辨識模型（Automatic Chord Recognition System），通用於辨識小詞彙集及大詞彙集和弦，在提升小詞彙集辨識分數的同時，亦改善在大詞彙集和弦上之表現，其中包括增加辨識的和弦種類以及評估分數之提升。在現今的自動和弦辨識研究中，使用深度學習的神經網路架構已成為主流，人們可以針對不同的需求，去建立不同的模型。我們在實驗中利用三個流通資料集作為訓練及測試資料，設計了一個以卷積神經網路為基礎的特徵萃取器，加上以雙向長短期記憶神經網路 (bi-directional long short term memory)及條件隨機域 (conditional random fields)設計之解碼模型，分別對於小詞彙集和弦以及大詞彙集和弦進行實驗。其中，在小詞彙集的實驗中，WCSR（Weighted Chord Symbol Recall）分數平均可達到84.3%，與同為使用深度學習架構的模型相比，最高可提升8.8%，顯示了我們所設計模型中的之特徵萃取器，能夠有效地學習到更精準的特徵，且與解碼模型配合時能有效地達到提升辨識率之目的。接著，在大詞彙集的實驗中，我們將評估指標由原本的一個增加到六個，且在擴增可辨識和弦種類的同時，維持原本小詞彙集和弦的辨識率，且在七和弦評估標籤中WCSR分數獲得71.5%，四重音評估標籤中WCSR分數獲得66.1%，與其他模型相比提升約1-2%。為了達到改善大詞彙集辨識率的目的，我們更加入兩種方法以提升分數。首先，我們針對稀缺的七和弦，加入新的訓練資料，試圖解決在現有資料集中和弦分佈不均的問題，並在七和弦評估標籤中獲得WCSR分數72.1%，較原先提升0.6%。再來，我們撇除掉現今大部分研究所使用的扁平分類概念，回歸到和弦原始的精確定義，針對決定和弦種類的關鍵音符設計一個閾值規制決策法，並用以評估這些複雜的擴展和弦，並在七和弦評估標籤中WCSR分數獲得74.5%，共提升3%，四重音評估標籤中WCSR分數獲得68.4%，共提升2.3%，且同時可辨認轉位和弦，可辨識和弦量提升為原先之三倍。藉由這兩大部分的實驗，有效地驗證了此模型之通用性，並改善大詞彙集和弦之辨識率以及增加可辨識和弦的數量。
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/80912
DOI:	10.6342/NTU202103229
Fulltext Rights:	同意授權(限校園內公開)
Appears in Collections:	工程科學及海洋工程學系

Files in This Item:

File	Size	Format
U0001-1709202105281000.pdf Access limited in NTU ip range	8.65 MB	Adobe PDF

Show full item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets