Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96330
標題: 使用顯著軟標籤的動態混合以應對長尾骨架動作識別
Dynamic Mixup with Salient Soft Labels for Long-tailed Skeleton-based Action Recognition
作者: 呂兆凱
Zhao-Kai Lu
指導教授: 許永真
Jane Yung-jen Hsu
共同指導教授: 傅立成
Li-Chen Fu
關鍵字: 動作識別,長尾學習,骨架資料,資料增強,資料混合,
Action Recognition,Long-tailed Learning,Skeleton Data,Data Augmentation,Mixup,
出版年 : 2024
學位: 碩士
摘要: 基於骨架資料的動作辨識由於其計算效率高以及在動態環境中的穩定表現,近年來逐漸受到關注。然而,現有大部分方法仍依賴於平衡的資料集,即每個類別都擁有相近數量的樣本,卻忽視了現實生活中的資料分佈往往是不均衡的現象,這樣的長尾分佈問題會顯著降低模型的效能。本論文針對長尾分佈的骨架動作辨識提出了新的解決方案,旨在強化代表性不足的樣本類別的表現,從而克服資料不平衡導致的模型偏差問題。
為此,我們提出了一種結合動態混合技術與新型軟標籤計算的資料增強方法,專注於提升尾部類別的辨識準確率。我們的方法包含一個專為少數類別設計的選擇策略,並透過新型軟標籤計算,確保混合樣本與其對應混合標籤之間的關聯性,進一步提高增強資料的品質。
我們在長尾的 NTU RGB+D 資料集、N-UCLA 資料集,以及我們實驗室收集的長尾 AIMS 嬰兒動作資料集上進行了實驗,結果顯示我們的方法在整體動作辨識表現上優於當前最先進的方法,特別是在尾部類別的辨識上取得了顯著的提升,展現了其應對現實世界資料集的潛力。
Skeleton-based action recognition has gained increasing attention in recent years due to its computational efficiency and robust performance in dynamic environments. However, most existing methods still rely on balanced datasets, where each class has a similar number of samples, ignoring the fact that data in real-world scenarios is often imbalanced. This long-tailed distribution significantly reduces the model’s effectiveness. In this paper, we propose a novel solution to address the challenge of long-tailed skeleton-based action recognition by enhancing the performance of underrepresented classes, thereby mitigating the bias introduced by data imbalance.
To this end, we introduce a data augmentation approach that combines dynamic mixup techniques with a new soft label calculation method, specifically focused on improving the recognition accuracy of tailed classes. Our method includes a selection strategy designed for minority classes, and the soft label calculation ensures the correlation between mixed samples and their corresponding mixed labels, further enhancing the quality of the augmented data.
We conducted experiments on the long-tailed NTU RGB+D dataset, N-UCLA dataset, and the long-tailed AIMS infant action dataset collected in our lab. The results demonstrate that our method outperforms state-of-the-art approaches in overall action recognition performance, with particularly significant improvements in the recognition of tailed classes, demonstrating its potential in tackling real-world datasets.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96330
DOI: 10.6342/NTU202404430
全文授權: 同意授權(全球公開)
電子全文公開日期: 2029-11-25
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-113-1.pdf
  此日期後於網路公開 2029-11-25
3.18 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved