Skip navigation

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets

Learn More
DSpace logo
English
中文
  • Browse
    • Communities
      & Collections
    • Publication Year
    • Author
    • Title
    • Subject
    • Advisor
  • Search TDR
  • Rights Q&A
    • My Page
    • Receive email
      updates
    • Edit Profile
  1. NTU Theses and Dissertations Repository
  2. 管理學院
  3. 資訊管理學系
Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81609
Title: 以自然語言處理方法分析年度報表中的管理層討論與分析的修改
A Novel Natural Language Processing Framework for Analyzing Management's Discussion and Analysis Modifications in 10-K Reports
Authors: Yu-Hsuan Chuang
莊于萱
Advisor: 盧信銘(Hsin-Min Lu)
Keyword: 10-K報表,管理層討論與分析,管理層討論與分析的修改,自然語言處理,CRF,Bi-LSTM,BERT,
10-K Reports,MD A,MD A Modifications,Natural Language Processing,CRF,Bi-LSTM,BERT,
Publication Year : 2021
Degree: 碩士
Abstract: "目的:管理層討論與分析(MD A)是10-K年度報表中重要的項目之一,而每年MD A文字內容的修改,被用在許多研究上,包含評估公司的表現,股價預測等。然而,MD A 修改的前處理步驟,包含從10-K報表中擷取MD A,以及從擷取出的MD A中移除不想要的文字,仍然使用一些傳統的文字分析方法,而對MD A 修改的分析造成負面影響。除此之外,MD A 修改的呈現,無法完整考量文字語意,且經常以數值形式呈現,鮮少呈現實際上MD A修改的內容。 方法:本研究運用建立一個自然語言處理框架(EPSC)去分析MD A 的修改,包含項目擷取(Item Extraction)、項目修飾(Item Prettification)、基於文字語意的句子層級文件比較(SDDSC),以及運用分群方法(Clustering)探索MD A修改的傾向。我們的EPSC能解決先前研究在項目擷取、項目修飾和MD A修改呈現上的研究限制,並運用進階的自然語言處理技術,改善MD A修改的分析。我們的EPSC包含四個步驟,第一步是使用條件隨機場(Conditional Random Field, CRF)做10-K年度報表的項目擷取,第二步是用雙向長短期記憶模型(Bi-directional Long Short-Term Memory, Bi-LSTM)做10-K年度報表的項目修飾,第三步使用我們所設計的基於文字語意的句子層級文件比較的演算法(SDDSC),呈現每年詳細的MD A修改,而第四步使用K-平均演算法(K-Means Clustering)識別產業中MD A修改的傾向。 結果:我們的實驗結果顯示出,使用Bi-LSTM做項目修飾的表現比其他模型還要好。我們設計的SDDSC能夠基於不同的文字語意相似度之閥值,呈現詳細的MD A修改的資訊。除此之外,使用K-平均演算法能成功的識別產業內的MD A修改的傾向,並以離群中心相似度最高的前五個句子呈現此傾向。 結論:本研究採用進階的自然語言處理技術,改善MD A修改的分析。此外,我們的EPSC可以提供更詳細的MD A文字內容修改的內容,提供研究者和投資者有價值的資訊。未來,我們希望能增加項目擷取的人工標註資料以提升模型的表現,也希望將我們的SDDSC修改成非遞迴演算法,解決遞迴演算法的深度限制,並提升演算法的執行效率。"
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81609
DOI: 10.6342/NTU202102680
Fulltext Rights: 未授權
metadata.dc.date.embargo-lift: 2022-10-23
Appears in Collections:資訊管理學系

Files in This Item:
File SizeFormat 
U0001-2408202115393500.pdf
  Restricted Access
2.12 MBAdobe PDF
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved