Skip navigation

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets

Learn More
DSpace logo
English
中文
  • Browse
    • Communities
      & Collections
    • Publication Year
    • Author
    • Title
    • Subject
    • Advisor
  • Search TDR
  • Rights Q&A
    • My Page
    • Receive email
      updates
    • Edit Profile
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79450
Title: 改善基於神經網路與地標法的音訊指紋
Improvement of Neural Network- and Landmark-based Audio Fingerprinting
Authors: Yi-Feng Chen
陳羿豐
Advisor: 張智星(Jyh-Shing Roger Jang)
Keyword: 音樂檢索,音訊指紋,地標法,對比學習,二階段洗牌,資料擴增,支援向量機,
music retrieval,audio fingerprinting,landmark method,contrastive learning,two-phase shuffling,data augmentation,SVM,
Publication Year : 2021
Degree: 碩士
Abstract: "音訊指紋是一種音樂檢索方式,可用來快速的從錄音中辨識出相符的音樂,其作法是從錄音檔抽取顯著的特徵,並將此特徵和資料庫中的音樂特徵做比對。由於錄音經常會受到雜訊干擾,因此音訊指紋需要有抵抗環境噪音的能力。過去音訊指紋的做法主要是傳統演算法,如Avery Wang提出的地標法,近年來基於深度學習的音訊指紋做法已逐漸成為主流,如Google提出的Now Playing。此篇研究主要聚焦在Sungkyun Chang等人提出的神經網路法音訊指紋。本論文首先以MIREX音訊指紋資料集來評估神經網路法和地標法,顯示出神經網路法在以現實世界的錄音來測試時,精準度仍然不如傳統演算法。因此本論文提出了三種方法來改進神經網路法:二階段洗牌、資料擴增改良以及對查詢做多次時間位移,並在最後以支援向量機(Support Vector Machine, SVM)來整合地標法和神經網路法的結果。為了方便重現,實驗使用公開的Free Music Archive資料集,透過加入雜訊的方式生成查詢音檔,並依照雜訊的強度分別計算檢索精準度。實驗結果顯示本論文提出的改進方式能夠顯著的提升神經網路在強雜訊下的精準度,並使得神經網路法在現實世界錄音查詢的表現超越地標法。"
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79450
DOI: 10.6342/NTU202103716
Fulltext Rights: 同意授權(全球公開)
Appears in Collections:資訊工程學系

Files in This Item:
File SizeFormat 
U0001-1410202111220200.pdf4.2 MBAdobe PDFView/Open
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved