請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96197| 標題: | 基於中文社群平台的情緒原因對擷取 Emotion Cause Pair Extraction for Chinese Social Media Platform |
| 作者: | 江岳憫 Yueh-Min Chiang |
| 指導教授: | 盧信銘 Hsin-Min Lu |
| 關鍵字: | 情緒原因分析,情緒與原因組合擷取,大型語言模型,輕量化學習,社群媒體平台, Emotion Cause Analysis,Emotion Cause Pair Extraction,Large Language Model,Parameter-Efficient Fine-tuning,Social Media Platform, |
| 出版年 : | 2024 |
| 學位: | 碩士 |
| 摘要: | 人類的行為,通常與其情緒息息相關,深深地影響著人們生活中 的種種決策,關於情緒的分析,多年以來一直是學者們非常注重的領 域,而近年來,除了對於情緒本身的發現與分析,挖掘產生情緒的原 因,也成為能夠更深入了解使用者行為的重要因素。目前與情緒原因 分析相關的研究,主要致力於提高模型的精準度。然而,過去研究中 所使用的資料集,多半使用以新聞為來源的文章,主要皆使用情緒較 中立且重複性較高的詞彙,忽略了較主觀的表達,同時也限縮了模型 應用的可能性。
了可以使情緒原因擷取擁有更廣泛的應用,本研究建立一個全新的 情緒原因對擷取之資料集,資料來源基於使用者可以自由發表的社群 媒體平台 Dcard,使得資料集包含更多元的字彙及情緒強度更強烈的 表達,也配合更多與時俱進的現代用語,使得任務能夠更貼近現實社 會上的應用。因應資料集多元化可能降低模型的表現能力,不同於過 去傳統的預測流程,我們也提出了新的預測框架,應用大型語言模型 以及輕量化學習的方式來進行模型的訓練,不僅保留大型語言模型的 文字理解能力,同時也讓模型能夠符合任務的需求。 最終的實驗結果顯示我們在過去研究所使用的資料集中擁有相當的 表現,也在我們建立的資料集中達到最好的表現,說明了我們所提出 的模型框架能夠有效地理解文章中包含的情緒及對應原因,且更能配 適于多元的資料來源,除此之外,透過實驗的結果與模型的應用,我 們也能夠分析模型的錯誤來修正未來研究的方向以及社群媒體文章的 傾向來探討使用者行為。 Human behavior is often closely linked to emotions, significantly influencing various life decisions. Emotion analysis has long been a critical focus for scholars. In recent years, beyond discovering and analyzing emotions, identifying the causes of emotions has become vital for understanding user behavior more deeply. Current research related to emotion cause analysis primarily aims to enhance model accuracy. However, most of the datasets used in previous studies consist of news articles, which generally employ neutral and repetitive vocabulary, neglecting more subjective expressions and limiting the models’ applicability. To broaden the application of emotion cause extraction, this study introduces a novel dataset about Emotion Cause Pair Extraction sourced from the social media platform Dcard, where users can freely post content. This dataset includes a more diverse vocabulary and more intense emotional expressions, incorporating modern terminology to align the task more closely with real-world applications. To address the potential performance decline due to dataset diversity, we propose a new predictive framework. This framework leverages Large Language Models and Parameter-Efficient Fine-Tuning techniques for training, retaining the language comprehension capabilities of large models while meeting task-specific requirements. The final experimental results demonstrate that our approach performs comparably on traditional datasets and achieves superior performance on our proposed dataset. This confirms that our model framework can effectively understand the emotions and corresponding causes within texts and better adapt to diverse data sources. Furthermore, through experimental outcomes and model applications, we can analyze errors to refine future research directions and explore user behavior tendencies in social media posts. |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96197 |
| DOI: | 10.6342/NTU202404363 |
| 全文授權: | 未授權 |
| 顯示於系所單位: | 資訊管理學系 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-113-1.pdf 未授權公開取用 | 7.43 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
