Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/94839
標題: 使用多線索交互和部位感知監督增強之輕量級深度卷積網路應用於面部資訊偵測
A Lightweight Deep Convolutional Network for Face Information Detection Enhanced by Multi-Clue Interaction and Part-Aware Supervision
作者: 劉璟鴻
Jing-Hong Liu
指導教授: 傅立成
Li-Chen Fu
關鍵字: 深度學習,頭部姿態估計,視線注視估計,開閉眼狀態檢測,輕量化模型,
Deep Learning,Head Pose Estimation,Gaze Estimation,Eye State Detection,Lightweight Model,
出版年 : 2024
學位: 碩士
摘要: 近年來,智慧車輛相關技術正迅速發展,其中設計能在車輛上運行的駕駛者監控系統成為一項重要課題。這類系統透過分析駕駛者的面部資訊來判斷其當前的注意力狀態,幫助評估駕駛者控制車輛的能力。
在本論文中,我們提出了一種輕量級的多任務深度學習模型,該模型利用面部圖像同時檢測頭部姿態、注視方向和眼睛狀態,專為整合到駕駛者監控系統而設計,旨在判斷駕駛者是否專注於道路。為了使模型能夠部署於車輛上的嵌入式裝置,我們採用多任務學習並設計了合適的任務分支,創建一個高效且輕量級的系統。每個任務由專門的分支支持,以確保提取必要的特徵,並通過部位感知監督增強對相關面部區域的關注。此外,我們引入線索特徵來編碼各部位特定的隱式知識,提供更佳的任務特定特徵初始化並提升整體模型性能。我們在AFLW2000、BIWI、Gaze360 和 CEW 數據集上對我們的模型進行評估,結果顯示我們的方法在減少參數成本的同時,達到了具競爭力的性能,並在相似的輕量級條件下表現更佳,展示了我們的方法在實際應用中的有效性。
In recent years, technologies related to intelligent vehicles have seen rapid devel-opment, making the design of driver monitoring systems that can operate on vehicles acritical area of focus. These systems analyze facial information of drivers to determinetheir current attention status, helping assess the driver’s ability to control the vehicle.
In this thesis, we propose a lightweight, multi-task deep learning model designed to simultaneously detect head pose, gaze direction, and eye state from facial images. This model is specifically designed for integration into driver monitoring systems, aiming to determine whether the driver is focused on the road. To facilitate deployment on embedded vehicle devices, our approach leverages multi-task learning with carefully designed task branches to create an efficient and lightweight system. Each task is supported by dedicated branches to ensure the extraction of necessary features, with part-aware supervision enhancing the focus on relevant facial regions. Furthermore, we introduce clue features to encode part-specific implicit knowledge, providing improved initialization for task-specific features and enhancing overall model performance.We evaluate our model using the AFLW2000, BIWI, Gaze360, and CEW datasets, demonstrating that our method achieves competitive performance with reduced parameter costs. Our results show superior performance under lightweight conditions compared to existing methods, demonstrating the effectiveness of our approach in real-world applications.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/94839
DOI: 10.6342/NTU202403315
全文授權: 同意授權(限校園內公開)
電子全文公開日期: 2029-08-05
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-112-2.pdf
  未授權公開取用
12.11 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved