Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96282
標題: 基於任務整合與分割策略的YOLOv7全景分割系統
Panoptic Segmentation via Tasks Integration and Segmentation-based Strategies on YOLOv7
作者: 郭毅遠
I-Yuan Kuo
指導教授: 李明穗
Ming-Sui Lee
共同指導教授: 廖弘源
Hong-Yuan Liao
關鍵字: 全景分割,任務整合,反事實注意力,深度學習,圖像分割,
Panoptic Segmentation,Tasks Integration,Counterfactual Attention,Deep Learning,Segmentation,
出版年 : 2024
學位: 碩士
摘要: 本研究針對全景分割任務提出了一種新穎且高效的方法,全景分割任務旨在精確區分圖像中的所有前景與背景類別,並辨識同類別中的不同個體。現有方法在邊界預測精度不佳與重複預測問題上仍存在諸多挑戰,且許多先進方法依賴於龐大的網路架構,需大量運算資源,難以滿足實際應用需求。基於YOLOv7與FastInst的架構,本研究提出三項核心改進策略:(1) Tasks Integration,透過整合多任務的方法,解決傳統CNN-based方法邊界預測不精確問題;(2) Segmentation-based Proposal Strategy,有效避免Query-based架構中因冗餘proposals導致的重複預測;(3) Segmentation-based Intra and Counterfactual Loss,提升特徵的一致性與鑑別性,同時排除潛在誤導性特徵的影響。實驗結果表明,提出的方法顯著提升了模型的預測品質,為全景分割任務提供了一種兼具精度與效率的解決方案。
This study presents a novel and efficient framework for panoptic segmentation, a task aimed at accurately delineating all foreground and background categories in an image while distinguishing individual instances within the same category. Current approaches face persistent challenges, including imprecise boundary predictions and redundant proposals resulting in duplicate predictions. Moreover, many state-of-the-art methods rely on resource-intensive network architectures, making them less practical for real-world applications. Building on the architectures of YOLOv7 and FastInst, this research introduces three core advancements: (1) Tasks Integration, which unifies multi-task learning to address boundary prediction inaccuracies inherent to traditional CNN-based methods; (2) Segmentation-based Proposal Strategy, which effectively mitigates duplicate predictions by addressing redundancy in Query-based architectures; and (3) Segmentation-based Intra and Counterfactual Loss, which enhances feature consistency and discriminability while suppressing the influence of misleading features. Experimental evaluations demonstrate that the proposed methodology achieves substantial improvements in prediction quality, offering a robust and efficient solution for panoptic segmentation tasks.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96282
DOI: 10.6342/NTU202404744
全文授權: 同意授權(全球公開)
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-113-1.pdf4.84 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved