Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊網路與多媒體研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/101014
標題: 透過標籤分組與專屬模型提升不平衡多標籤影像分類表現
Improving Imbalanced Multi-Label Image Classification Performance via Label Grouping and Dedicated Models
作者: 賴冠瑜
Guan-Yu Lai
指導教授: 周承復
Cheng-Fu Chou
關鍵字: 深度學習,多標籤模型多標籤分類醫學眼底影像不平衡多標籤數據集疾病分類圖片標記
Deep Learning,Multi-Label ModelMulti-Label ClassificationMedical Fundus ImagesImbalanced Multi-label DatasetsDisease ClassificationImage Tagging
出版年 : 2025
學位: 碩士
摘要: 本研究針對多標籤影像分類中的標籤不平衡問題提出解法。在此問題中,不 同標籤的出現頻率差異極大,導致模型偏向多數標籤,忽略重要的稀有標籤,例 如在影像標註與醫療診斷等應用中。現有方法多採用損失重加權、資料重取樣或 視覺-語言模型來改善稀有標籤表現,但可能需要大量超參數調整,或依賴額外訓 練資料,且未必適用於特定領域。
為了提高不平衡多標籤影像分類的表現,本研究提有別於以往的解決方法, 我們將標籤依頻率分組並為每組訓練專屬模型,以提升模型訓練的穩定性與專注 度,同時保留標籤關聯資訊。我們設計了兩個演算法:一是動態規劃分組演算法, 確保分組內部平衡並最小化分組數;二是輔助標籤擴展演算法,以平衡指標引入 輔助標籤一起訓練。本方法於 COCO-MLT、VOC-MLT 及 MuReD 三個資料集上 驗證,並在不同分佈標籤表現皆顯著提升。
This study addresses the problem of label imbalance in multi-label image classification. In such tasks, the frequency of label occurrences varies significantly, causing models to favor frequent labels while neglecting important rare ones, a common challenge in applications such as image tagging and medical diagnosis. Existing methods often rely on loss reweighting, data resampling, or vision-language models to improve the performance on rare labels. However, these approaches typically require extensive hyperparameter tuning, additional training data, or may not generalize well to specific domains.
To enhance performance in imbalanced multi-label image classification, we propose a novel approach that groups labels based on their frequencies and trains dedicated models for each group. This strategy improves training stability and allows the model to focus more effectively while preserving inter-label dependencies. We introduce two algorithms: (1) a dynamic programming-based label grouping algorithm that ensures intra-group balance and minimizes the number of groups, and (2) an auxiliary label expansion algorithm that incorporates additional labels during training based on a balancing metric.
Our method is evaluated on three datasets, including COCO-MLT, VOC-MLT, and MuReD. Experiments show that our method significantly improves performance across head, mid-frequency, and tail labels.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/101014
DOI: 10.6342/NTU202504480
全文授權: 未授權
電子全文公開日期: N/A
顯示於系所單位:資訊網路與多媒體研究所

文件中的檔案:
檔案 大小格式 
ntu-114-1.pdf
  未授權公開取用
4.89 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved