Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/94700
標題: 基於大型語言模型的五項程式碼生成組件及其評估
Proposition and Evaluation of Five Constructive Components for Code Generation via Large Language Models
作者: 林育辰
Yu-Chen Lin
指導教授: 張智星
Jyh-Shing Roger Jang
關鍵字: 自然語言處理,大型語言模型,程式碼生成,資料嵌入,資料前處理,語義分割,資料翻新,腳本擴增,提示技術,
Natural Language Processing (NLP),Large Language Models (LLMs),Code Generation,Data Embedding,Data Preprocessing,Semantic Splitter,Data Renovation,Script Augmentation,Prompt Techniques,
出版年 : 2024
學位: 碩士
摘要: 本文提出五項基於大型語言模型的程式碼生成組件,用於特定領域的腳本生成,並評估其有效性。貢獻:(i) 基於大型語言模型的語義分割 (Semantic Splitter) 以及資料翻新 (Data Renovation) 組件 以改進資料語義的表示;(ii) 運用大型語言模型重構以產生高品質程式碼的組件 Script Augmentation;(iii) 提出提示技術 隱形知識擴展與思考 (Implicit Knowledge Expansion and Contemplation, IKEC) 組件;(iv) 提出程式碼生成的流程,以五項組件漸進式生成工程模擬軟體 RedHawk-SC 的程式碼;(v) 評估不同參考資料型態之於程式碼生成的有效性。零樣本連鎖思維 (Zero-shot Chain-of-Thought, ZCoT) 為有效的提示技術,包括在五項建設性組件中,以利評估其餘組件之有效性。我們邀請 28 位領域專家透過競技場式評估蒐集 187 份成對比較結果以驗證前述組件之有效性,其中最佳組件於工程軟體 RedHawk-SC 上 MapReduce 程式碼生成表現達到 21.26% 的勝率提升,相較零樣本連鎖思維 6.68% 勝率提升顯著許多。
We propose five constructive components based on Large Language Models (LLMs) for domain-specific code generation and evaluate their effectiveness. The contributions are (i) Semantic splitter and data renovation for improved data semantic representation; (ii) Script augmentation for enhanced code quality; (iii) Implicit Knowledge Expansion and Contemplation (IKEC) prompting technique; (iv) A workflow using hierarchical generation for scripts in the engineering software RedHawk-SC; (v) An evaluation of different reference data types for code generation. We invited 28 domain experts to conduct an arena-style evaluation, collecting 187 paired comparisons to validate the effectiveness of those components. The best component achieved a 21.26% win rate improvement in MapReduce code generation performance for RedHawk-SC, significantly outperforming the 6.68% win rate improvement of the Zero-shot Chain-of-Thought (ZCoT).
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/94700
DOI: 10.6342/NTU202402417
全文授權: 同意授權(全球公開)
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-112-2.pdf3.89 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved