Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊網路與多媒體研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/56659
標題: 中文顯性和隱性語篇關係分析之研究
Chinese Explicit and Implicit Discourse Analysis
作者: Wan-Shan Liao
廖婉珊
指導教授: 陳信希(Hsin-Hsi Chen)
關鍵字: 中文語篇關係,顯隱性關係,跨語料庫,語篇標記,Discourse Relation,
Chinese discourse relation,discourse markers,implicit discourse,explicit discourse,cross corpus,
出版年 : 2014
學位: 碩士
摘要: 近年來自然語言處理的研究,隨著字、詞層面的研究日益成熟,以及PDTB、RST-DT等大規模語篇關係語料庫的出現,對於語篇關係的研究日益增加。若是能正確預測篇章的關係,將有助於理解通篇的語義關係,在自然語言處理的相關應用如QA系統、自動摘要也都有很大的幫助。
  然而,由於中文缺乏了語料庫的資源,目前對於中文語篇關係的研究還是不多。
  在本文中,我們先針對哈爾濱工業大學在2013年發布的HIT-CIR中文語篇關係語料庫進行初步的分析。在研究過程中,因為資料集的稀疏,我們轉以另一個大規模的虛擬資料集做為訓練集。實驗的結果顯示使用大規模的語料訓練模型,有利於預測不同來源的文本。
  最後,我們進一步的分析,顯隱性語篇關係的分類性能,並分析了語篇單位周遭的非主要語篇標記是否和句子本身的語篇關係相關。
In recent years, research in natural language processing, with the study words, phrases levels become more sophisticated. Since the large-scale manually annotated corpus of discourse relations such as PDTB and RST-DT have been released, the study of discourse relation is increasing. If we could correctly predict the relationship between discourse, it will help to understand the semantic understanding. The related applications in natural language processing, such as QA systems, automatic summaries are also of great help.
 However, due to the lack of a corpus of Chinese resources, the study in Chinese discourse relations are still little currently.
 In this work, we first make a preliminary analysis for HIT-CIR Chinese Discourse Relations Corpus, Harbin Institute of Technology released in 2013. Because of small-scale of datasets, we turn to treat another large-scale pseudo dataset as the training set. Experimental results show that this large-scale corpus training model promote to predict the discourse relation of text from different sources.
 Finally, we were further analyzed to the classification performance of implicit and explicit discourse relations, and analyzed whether the non-primary Markers is relevance to its discourse relation.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/56659
全文授權: 有償授權
顯示於系所單位:資訊網路與多媒體研究所

文件中的檔案:
檔案 大小格式 
ntu-103-1.pdf
  目前未授權公開取用
876.65 kBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved