Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊網路與多媒體研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96069
標題: 循序漸進:用分階段訓練提升半監督學習方法在領域自適應姿態估計中的適用性
Phase2Phase: Enhancing the Applicability of Semi-Supervised Learning Methods in Domain Adaptive Pose Estimation through Phased Training
作者: 蕭昀豪
Yun-Hao Hsiao
指導教授: 許永真
Yung-Jen Hsu
共同指導教授: 鄭文皇
Wen-Huang Cheng
關鍵字: 領域自適應,姿態估計,關鍵點檢測,半監督式學習,
Domain Adaptation,Pose Estimation,Keypoint Detection,Semi-supervised Learning,
出版年 : 2024
學位: 碩士
摘要: 近幾年,領域自適應姿態估計 (DAPE) 受到越來越多的關注。在解決該任務的方法中,半監督式學習 (SSL) 的方法因為與無監督領域自適應 (UDA) 有相似的目標而被廣泛使用。然而,雖然 SSL 和 UDA 同樣都旨在用未標記的數據增強已在標記數據上訓練的模型,兩個任務對於資料分布的不同期望依然讓 SSL 方法無法完美地契合於 UDA 中。有鑑於此,我們提出了 Phase2Phase,這一策略整合了三種方法:Adaptive Mean Teacher、T-VAT-based UniMatch,以及 Mixup Augmentation。
傳統的 Mean Teacher 方法通常採用較大的平滑係數,但在 UDA 任務中,較大的平滑細數容易阻礙教師模型迅速達到學生模型的性能。為了克服這一問題,我們提出 Adaptive Mean Teacher。藉由在領域自適應初期加入緩衝階段,並在該緩衝階段使用較低的平滑係數,我們使教師模型在保持 Mean Teacher 穩定性特點的同時,使其在初期就能快速追上學生模型的表現。
Mean Teacher 已經被證實在 UDA 的情境下有效,而除了如 Mean Teacher 這樣以模型為中心出發,用不同模型生成兩個輸出以進行一致性調節的方法,SSL 中同樣存在像 FixMatch 和 UniMatch 這樣在輸入和特徵層面引入干擾項的方法。儘管這些策略理論上能相輔相成,但實驗卻顯示生硬地結合兩個方法會導致效能下降。為此,我們提出的 Phase2Phase 在採用傳統 Mean Teacher 的訓練階段後又引入了一個額外階段,在該階段利用 T-VAT-based UniMatch 讓模型校能進一步提升。最後,我們還在訓練全程都引入 Mixup 技術,以提升模型的穩健性和整體性能。
實驗結果顯示,我們提出的方法確實有益於提升 DAPE 的表現。值得注意的是,Phase2Phase 超越了能使用標記資料的其他 DAPE 方法,同時他的表現也逼近當前最先進、在不使用標記資料的情況下依然表現優異 DAPE 方法,SFDAHPE。這凸顯了 Phase2Phase 在實際情境中的實用性。
Domain Adaptive Pose Estimation (DAPE) has received increasing attention recently. Many methods commonly used in semi-supervised learning (SSL) tasks are now applied to DAPE tasks because SSL shares a similar goal with unsupervised domain adaptation (UDA). Although both SSL and UDA aim to enhance a model trained on labeled data with unlabeled data, the differences in data distribution expectations present a challenge, preventing these SSL methods from seamlessly adapting to DAPE. With an awareness of inconsistent expectations in the data, we introduce Phase2Phase, a novel approach that integrates three core strategies: Adaptive Mean Teacher, T-VAT-based UniMatch, and Mixup augmentation.
In traditional Mean Teacher methods, a significant smoothing coefficient is typically employed. However, in UDA tasks, a large smoothing coefficient can hinder the teacher model from quickly achieving the performance of the student model. To overcome this issue, we propose the Adaptive Mean Teacher. By introducing a ramp-up phase during the initial stages of domain adaptation, where a reduced smoothing coefficient is applied, we enable the teacher model to rapidly align with the performance of the student model, while preserving the stability inherent in the traditional Mean Teacher framework.
Mean Teacher has been proven effective in UDA, and in addition to model-centered approaches like Mean Teacher, which generate two outputs from different models for consistency regularization, SSL also includes methods like FixMatch and UniMatch that introduce disturbances at the input and feature levels. Although these strategies theoretically complement each other, their direct combination can lead to degraded effectiveness. Our thesis introduces an additional phase for T-VAT-based UniMatch to facilitate integration. Finally, we incorporate Mixup augmentation to boost the model's robustness, further elevating the overall performance.
The experimental results show that all the proposed methods enhance the performance of DAPE. Notably, Phase2Phase surpasses previous source-dependent DAPE approaches and achieves comparable results to the current state of the art in source-free DAPE, SFDAHPE. This underscores Phase2Phase’s practical effectiveness in the real-world scenarios.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96069
DOI: 10.6342/NTU202404439
全文授權: 同意授權(全球公開)
電子全文公開日期: 2025-03-06
顯示於系所單位:資訊網路與多媒體研究所

文件中的檔案:
檔案 大小格式 
ntu-113-1.pdf5.24 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved