Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 機械工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98058
標題: 基於語意分割以及權重損失函數的車道線偵測
Segmentation Based Lane Detection with custom weighted loss
作者: 蔡侑哲
Yu-Che Tsai
指導教授: 李綱
Kang Li
關鍵字: 車道線偵測,權重二元交叉熵損失函數,語意分割,情境,
lane detection,weighted binary cross-entropy loss,semantic segmentation,scenario,
出版年 : 2025
學位: 碩士
摘要: 車道線偵測一直是自動駕駛與電腦視覺領域中的重要任務,並且多年來已有大量的研究推動其成長與進步。近期多數新提出的研究大多採用座標點偵測或曲線偵測的方法。本研究提出了一種不同於現有常見模型的車道檢測方法。本研究利用了 Vision Transformer (ViT),透過基於語意分割的模型來解決現實車道檢測中常見的困難場景,例如彎曲的車道標記與有陰影的環境。為了解決正負樣本極度不平均的問題,本研究提出使用權重二元交叉熵損失函數。實驗結果顯示,在廣泛使用的 TuSimple 數據集上,本研究所提出的模型在加入權重二元交叉熵損失函數的調整後從原先的64.2%進步到了 96.45% 的準確率,與目前的一線模型並駕齊驅。本研究所提出的損失函數不但在 DeepLabV3+ 模型上也提升 18% 的準確率,同時在更為複雜的道路環境如陰影遮蔽、大車流量等,也展現出顯著的表現。 本研究的模型更能順利偵測分岔車道線和斷裂車道線等,是其餘基於點偵測和基於曲線偵測模型容易出現誤偵測的困難情境。
Lane detection has long been a critical task in the fields of autonomous driving and computer vision, with extensive research and development contributing to its progress over the years. With most of the recently proposed models adopting point-based and curve-based methods, the study presents an alternative method of lane detection that differs from other state-of-the-art models. Taking advantage of the powerful vision transformer (ViT), this research aims to utilize a segmentation-based model to address challenging scenarios often encountered in real-world lane detection, such as curved lane markings and environments with shadows. To solve the problem of extreme class imbalance, a custom weighted binary cross-entropy loss is proposed. Experimental results of the widely adopted TuSimple dataset showed that the proposed model improved from 64.2% accuracy to achieving a favorable accuracy of 96.45%, on par with many recent models, The loss function also provided 18% accuracy improvement on DeepLabV3+, while simultaneously exhibiting substantial performance in more complex scenarios such as crowded and shadowed lanes. The proposed model also has the ability to predict forked lanes and disconnected lanes, which other point-based and curve-based methods fail to predict.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98058
DOI: 10.6342/NTU202501973
全文授權: 同意授權(全球公開)
電子全文公開日期: 2025-07-24
顯示於系所單位:機械工程學系

文件中的檔案:
檔案 大小格式 
ntu-113-2.pdf21.12 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved