請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/77869
標題: | 歷史文本上的語意角色辨識:以《明實錄》中之朝貢事件為例 Semantic Role Labeling on Chinese Classic Historical Texts: A Case Study of Tributary Events in Ming Shilu |
作者: | Yi-Hsuan Lu 呂翊瑄 |
指導教授: | 許永真(Jane Yung-jen Hsu) |
共同指導教授: | 蔡宗翰(Richard Tzong-Han Tsai) |
關鍵字: | 事件擷取,語意角色辨識,明實錄,朝貢事件,古漢語自然語言處理, Event Extraction,Semantic Role Labeling,Ming Shilu,Tributary Events,Classical Chinese NLP, |
出版年 : | 2017 |
學位: | 碩士 |
摘要: | 自然語言處理在英文領域發展已久,在中文上的研究也越趨成熟,其各個子領域皆有不錯的研究發表及工具可以使用,然而古代漢文上的相關研究仍較缺乏。從文本中擷取事件一直是資訊擷取的重要目標,若能將事件擷取應用在歷史文本上,用來擷取歷史事件,對人文領域學者的研究將有相當大的幫助。
現有的事件擷取技術皆需要於事前定義事件模板,但現有的事件模板並不符合歷史文本的需求,因此我們改以 Predicate Argument Structure(PAS) 的形式來表達一個歷史事件。現有的研究已可完成歷史事件的分類,其將有相似主題的事件分類到同一類別,由此我們發現在編年體的歷史文本上,同一事件類別裡的事件甚至還具有相似的句型。我們以事件類別作為基礎,建立與 Chinese Proposition Bank 相容的 PAS 資料庫與制定 PAS 的標準流程,並且使用監督學習的方法去建立語意角色辨識系統,讓語意角色辨識系統能自動將已制定好的 PAS 標記在文本上。 本研究初步建立了標注歷史文本的語意角色時需要使用到的 PAS,實現了自動化標注語意角色的系統,並且實際應用在《明實錄》上。我們使用此語意角色標注系統擷取「貢賞」類別裡的事件。因擷取出來的事件帶有語意角色標籤,根據這些資訊,我們能夠在「貢賞」事件類別裡完成更多有趣的統計或分析,比如說:貢品的趨勢。本研究一方面希望能提供人文學者一個新的研究方法,另一方面也希望為古漢語文字探勘提出一個新的研究方向,期待這樣的方法能夠為人文研究帶來更多可能性。 Natural language processing in English is well developed and mature. In addition, there are many researches in natural language processing in Chinese, it provides remarkable research results and tools to be leveraged. That is useful if the historical events can be extracted from history texts in classical Chinese (i.e., event extraction). Unfortunately, little research has been done on natural language processing in classical Chinese. Currently, predefined event type is necessary to extract event, but exist event type is not applicable to historical texts. Therefore, predicate argument structure is adopted to describe a historical event. State of the art researches have been able to classify the events which have similar topic into the same event category. According to it, we observe that each event in the same event category might have similar sentence pattern. Base on it, this thesis establishes predicate argument structure vocabulary which is compatible to Chinese Proposition Bank and a process to define predicate argument structure, and applies supervised learning method to establish a semantic role label system which can label defined predicate argument structure on raw texts in classical Chinese automatically. In this research, the proposed system is used to label semantic roles about tributary events in extit{Ming Shilu}. With it, the tributary events can be extracted. Furthermore, according to these information, the more interesting statistics and analysis in historical text are able to done, for example, the popular tribute in different period. The purpose of this paper is to provide new research methods for digital humanities researchers, and propose a new field of research for classical Chinese. I am looking forward to that it is able to bring variety research in digital humanities field. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/77869 |
DOI: | 10.6342/NTU201702838 |
全文授權: | 有償授權 |
顯示於系所單位: | 資訊網路與多媒體研究所 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-106-R02944029-1.pdf 目前未授權公開取用 | 2.97 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。