Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 土木工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98540
標題: 建築工地多層次群體活動辨識
Multi-Granular Crew Activity Recognition for Construction Monitoring
作者: 蔡承耘
Cheng-Yun Tsai
指導教授: 林之謙
Jacob J. Lin
關鍵字: 影像理解,深度學習,工地監測,多層次活動辨識,
Image Understanding,Deep Learning,Construction Monitoring,Multi-Level Activity Recognition,
出版年 : 2025
學位: 碩士
摘要: 勞動力是專案中至關重要的資源。為了確保有效的管理,管理者必須了解當前進行中的工項以及參與工人的組成情況。傳統工程中,現場建築工人生產力的分析依賴於人工取樣與記錄,不僅耗時且容易出錯。隨著電腦視覺與深度學習技術的進步,許多研究嘗試透過自動化辨識方法來解決傳統人工方法中的低效率與主觀性問題。然而,大多數現有研究僅專注於低層級的姿態辨識,忽略了建設工地協作性與動態性的特質。本研究提出了一個多層次的工班活動辨識框架,目標不僅是辨識個別工人的動作,並包括將協作的工人分組並辨識其特定的工作項目。透過運用基於圖形的表示法與自注意力機制,此框架能有效整合空間與上下文資訊,從而實現準確的辨識結果。在實驗階段,我們建立了一個涵蓋鋼筋、模板和混凝土施工作業的工地數據集,並使用多層次的指標來評估模型的性能。結果顯示,我們的框架整體 F1 分數達到 73.41%,此外,結果還顯示,即使在空間距離極為接近的情況下,模型仍能有效學習並區分不同群體。在進一步的實驗與討論中顯示,視覺特徵相似性與空間鄰近性對於準確辨識至關重要,而當這兩個要素的比重相同時,模型的性能最佳。本研究為動態施工現場監測提供了一種可擴展且高效的解決方案,同時為未來在時間建模與人-物互動分析等領域的研究奠定了基礎。
The labor force is a critical resource in construction projects. To ensure effective management, it is essential for managers to understand ongoing tasks and the composition of workers involved. Traditionally, analyzing the productivity of on-site construction workers has relied on manual sampling and recording, which is both time-consuming and prone to errors. With advancements in computer vision and deep learning, many studies have explored automated recognition methods to address the inefficiencies and subjectivity of traditional manual approaches. However, most existing studies focus on low-level pose recognition, overlooking the collaborative and dynamic nature of construction sites. This study proposes a multi-granular crew activity recognition framework aimed at not only recognizing individual workers' actions but also grouping collaborating workers and identifying their specific work items. By leveraging graph-based representations and self-attention mechanisms, the framework effectively integrates spatial and contextual information to achieve accurate recognition results. In the experimental phase, we create a construction site dataset covering rebar, formwork, and concrete operations, and used multi-level metrics to evaluate the model's performance. The results show that our framework achieves an overall F1 Score of 73.41%, moreover, the results demonstrate that the model can effectively learn to differentiate between different groups, even when their spatial proximity is extremely close. Further experiments and discussions reveal that both visual feature similarity and spatial proximity are essential for accurate recognition, with the model performing best when both factors are given equal weight. This study provides a scalable and efficient solution for dynamic construction site monitoring while laying a foundation for future research in areas such as temporal modeling and human-object interaction analysis.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98540
DOI: 10.6342/NTU202502586
全文授權: 同意授權(限校園內公開)
電子全文公開日期: 2030-08-03
顯示於系所單位:土木工程學系

文件中的檔案:
檔案 大小格式 
ntu-113-2.pdf
  未授權公開取用
11.6 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved