Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 社會科學院
  3. 國家發展研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/84796
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor唐代彪(De-Piao Tang)
dc.contributor.authorTing-Yu Liuen
dc.contributor.author劉庭羽zh_TW
dc.date.accessioned2023-03-19T22:26:05Z-
dc.date.copyright2022-09-30
dc.date.issued2022
dc.date.submitted2022-09-28
dc.identifier.citation尹鈦 (2020)。〈當代中國政治中領導核心制之研究〉, 《二十一世紀》,(178):86-104。 文宏 (2014)。〈中國政府推進基本公共服務的注意力測量——基於中央政府工作報告 (1954—2013) 的文本分析〉,《吉林大學社會科學學報》, 54(2):20-26。 林宜歆、林嶔、葉釋仁、 蘇遂龍 (2018)。〈利用文字探勘建立醫學主題詞與基因名稱之關聯性〉,《台灣公共衛生雜誌》,37(1):12。 許治、張建超 (2020)。〈新中國成立以来政府對科技人才注意力研究——基於國務院政府工作報告 (1954—2019 年) 文本分析〉,《科學學與科學技術管理》, 41(2):19-32。 狄艷華、杨忠 (2010)。〈基於語料庫的中國政府工作報告核心主題詞研究〉,《外語學刊》,(6): 69-72。 柯華葳、陳冠銘 (2004)。〈文章結構標示與閱讀理解-以低年級學生為例〉,《教育心理學報》,36(2): 185-200。 胡鞍鋼 (2018)。〈政府工作報告:了解中國的最好窗口〉。《今日中國》。http://www.bjinforma.com/zw2018/sp/201804/t20180402_800125391.html 梁棟、张兆靜、彭木根 (2020)。《大數據、數據挖掘與智慧運營》。清华大学出版社 (崧博)。 梁淑媛、莊宇慧、吳淑芳 (2012)。〈內容分析技巧在護理質性資料之初步應用〉,《護理雜誌》,59(5): 84-90。 陳尹容 (2019)。〈主要央行社群媒體溝通之分析及對我國之啟示〉,《中央銀行季刊》,42(3):5-40。 陳文華、徐聖訓、施人英、吳壽山 (2003)。〈應用主題地圖於知識整理〉,《圖書資訊學刊》,1(1): 37–58。 陳世榮 (2015)。〈社會科學研究中的文字探勘應用: 以文意為基礎的文件分類及其問題〉,《人文及社會科學集刊》,27(4):683-718。 陳宗權、陳俊育(2016) 。〈運用文本探勘技術探索未來科技〉,《科技部105年度自行研究計畫成果告》。 劉小燕 (2018)。〈歷年「 政府工作報告」話語中的社會變遷〉,《重慶交通大学學報 (社會科學版) 》,18(3):143。 魏偉、郭崇慧、陳静鋒 (2018)。 〈国务院政府工作报告 (1954—2017) 文本挖掘及社会变迁研究〉。《情报学报》,37(4) : 406-421. Aggarwal, C. C., & Zhai, C. (2012). A survey of text classification algorithms. In Mining text data (pp. 163-222). Springer, Boston, MA. Berelson, B. (1952). Content analysis in communication research. Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of machine Learning research, 3(Jan), 993-1022. Chen, K. J., & Liu, S. H. (1992). Word identification for Mandarin Chinese sentences. In COLING 1992 Volume 1: The 14th International Conference on Computational Linguistics. Creswell, J. W., & Creswell, J. (2003). Research design (pp. 155-179). Thousand Oaks, CA: Sage publications. Dey, L., Rastogi, A. C., & Kumar, S. (2006, December). Generating concept ontologies through text mining. In 2006 IEEE/WIC/ACM International Conference on Web Intelligence (WI 2006 Main Conference Proceedings)(WI'06) (pp. 23-32). IEEE. Elhamifar, E., & Vidal, R. (2013). Sparse subspace clustering: Algorithm, theory, and applications. IEEE transactions on pattern analysis and machine intelligence, 35(11), 2765-2781. Feldman, R., & Dagan, I. (1995, August). Knowledge Discovery in Textual Databases (KDT). In KDD (Vol. 95, pp. 112-117). Grimmer, J., & Stewart, B. M. (2013). Text as data: The promise and pitfalls of automatic content analysis methods for political texts. Political analysis, 21(3), 267-297. Hearst, M. A. (1999, June). Untangling text data mining. In Proceedings of the 37th Annual meeting of the Association for Computational Linguistics (pp. 3-10). Hofmann, T. (1999, August). Probabilistic latent semantic indexing. In Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval (pp. 50-57). Jiang, Y. (2021, April). Diachronic Lexical Features of Chinese Government Work Reports: A Text Mining Approach. In 2021 6th International Conference on Social Sciences and Economic Development (ICSSED 2021) (pp. 735-738). Atlantis Press. Jones, K. S. (1972). A statistical interpretation of term specificity and its application in retrieval. Journal of documentation. Kao, A., & Poteet, S. R. (Eds.). (2007). Natural language processing and text mining. Springer Science & Business Media. Krippendorff, K. (2018). Content analysis: An introduction to its methodology. Sage publications. Kwartler, T. (2017). Text mining in practice with R. John Wiley & Sons. Lasswell, H. D. (1948). The structure and function of communication in society. The communication of ideas, 37(1), 136-139. Liang, N. Y. (1987). CDWS: An automatic word segmentation system for written Chinese texts. Journal of Chinese Information Processing, 1(2), 44-52. Nahm, U. Y., & Mooney, R. J. (2002, March). Text mining with information extraction. In Proceedings of the AAAI 2002 Spring Symposium on Mining Answers from Texts and Knowledge Bases (pp. 60-67). Stanford CA. Papadimitriou, C. H., Tamaki, H., Raghavan, P., & Vempala, S. (1998, May). Latent semantic indexing: A probabilistic analysis. In Proceedings of the seventeenth ACM SIGACT-SIGMOD-SIGART symposium on Principles of database systems (pp. 159-168). Rubin, A., & Babbie, E. R. (2016). Empowerment series: Research methods for social work. Cengage Learning. Sagiroglu, S., & Sinanc, D. (2013, May). Big data: A review. In 2013 international conference on collaboration technologies and systems (CTS) (pp. 42-47). IEEE. Sievert, C., & Shirley, K. (2014, June). LDAvis: A method for visualizing and interpreting topics. In Proceedings of the workshop on interactive language learning, visualization, and interfaces (pp. 63-70). Sullivan, D. (2001). Document warehousing and text mining: techniques for improving business operations, marketing, and sales. John Wiley & Sons, Inc. Sumpter, Randall S. (July 2001). 'News about News'. Journalism History,27 (2): 64–72 Tan, A. H. (1999, April). Text mining: The state of the art and the challenges. In Proceedings of the PAKDD 1999 Workshop on Knowledge Discovery from Advanced Databases (Vol. 8, pp. 65-70). Toubia, O., Iyengar, G., Bunnell, R., & Lemaire, A. (2019). Extracting features of entertainment products: A guided latent dirichlet allocation approach informed by the psychology of media consumption. Journal of Marketing Research, 56(1), 18-36. Zhang, W., Yoshida, T., & Tang, X. (2011). A comparative study of TF* IDF, LSI and multi-words for text classification. Expert systems with applications, 38(3), 2758-2765.
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/84796-
dc.description.abstract中國經過改革開放後躍居世界強權之一,由於經濟上對外開放而政治上對內封閉的原因,其政府任何對外的官方發布都極為重要,中國政府工作報告是中國官方對外闡述未來政策走向的重要管道,本文以較嶄新的研究方法,以Python這個程式語言架構所需的工具如詞頻分析、關鍵字分析、文字雲、LDA、相似度分析結合資料視覺化分析歷經鄧小平、江澤民、胡錦濤、習近平四位為最高領導人時期的政府工作報告,探討歷經不同領導人時期歷任總理政策制定上的差異,並歸納出其施政的重點。 研究結果發現,工作報告組成可歸為八大類成分: 「經濟發展」、「社會發展」、「國際關係」、「政府改革」、「政治思想」、「港澳台」、「國防」、「其他」,鄧小平時期的政府工作報告著重在「經濟發展」、「國際關係」,而江澤民、胡錦濤、習近平時期則著眼於「經濟發展」、「社會發展」;政府工作報告年與年之間的相似度數值也隨著國際情勢波動減緩保持高達七成左右的平均值,說明中國已經步入了穩定的發展中國家階段;除此之外,觀察主題占比中「政治思想」、「國防」的主題分類站比變動,也可發現不同領導人的權力高低差別,這顯示了文字探勘為研究方法的有效性。zh_TW
dc.description.abstractAfter reforming and opening up policy, China has become one of the most powerful country. Due to the economic openness but political block out situation ,any statement make by the Chinese government is undoubtedly important. The Chinese government work report is the official statement of the future policy direction of China. This thesis uses a relatively new research method, using the tools required for the Python programming language framework, such as word frequency analysis, keyword analysis, word cloud, LDA, similarity analysis, and data visualization analysis to analyze the differences in the policy formulation of the prime ministers who have gone through different leadership periods- Deng Xiaoping, Jiang Zemin, Hu Jintao, Xi Jinping ,and summarize the focus of their governance. The research results found that the composition of the work report can be classified into eight categories: 'economic development', 'social development', 'international relations', 'government reform', 'political ideology', 'Hong Kong, Macao and Taiwan', 'national defense', 'others'. ”, the government work report during Deng Xiaoping focused on “economic development” and “international relations,” while Jiang Zemin, Hu Jintao, and Xi Jinping focused on “economic development” and “social development”; the similarities index between the years of the government work report has also maintained an average value of about 70% as the fluctuation of the international situation has slowed down, indicating that China has entered the stage of a stable developing country. Changes in the topic themes’ ratio such as 'political ideology', 'national defense', can also find differences in the power levels of different leaders, which shows the effectiveness of text mining as a research method.en
dc.description.provenanceMade available in DSpace on 2023-03-19T22:26:05Z (GMT). No. of bitstreams: 1
U0001-2109202219370600.pdf: 8429804 bytes, checksum: c60bb6597f0112cb96dcab71aaccf404 (MD5)
Previous issue date: 2022
en
dc.description.tableofcontents致謝 I 摘要 II Abstract III 目錄 IV 圖表目錄 VI 第一章 緒 論 1 第一節 研究緣起 1 第二節 研究目的 2 第三節 研究限制 3 第四節 論文架構 3 第二章 相關概念與文獻探討 5 第一節 內容分析 5 壹、內容分析的定義 5 貳、內容分析的流程 5 第二節 文字探勘 6 壹、文字探勘的定義 6 貳、文字探勘的運作方式 7 參、文字探勘相關應用文獻 9 肆、小結 9 第三節 運用文字探勘分析中國政府工作報告相關文獻 10 第三章 研究設計與實作 13 第一節 資料來源 13 第二節 資料預處理 15 第三節 研究分析工具介紹 17 壹、詞頻分析(Word frequency) 18 貳、文字雲(Word cloud) 19 參、TF-IDF(Term frequency-inverse document frequency) 20 肆、主題模型生成(Topic modeling) 23 伍、文本相似度(similarity) 26 第四節 研究架構與流程 28 第四章 研究結果與分析 30 第一節 詞頻分析 30 壹、整體分析 30 貳、領導人之間的字頻比較分析 33 第二節 關鍵字分析 36 壹、領導人之間的字頻比較分析 37 第三節 主題模型分析 40 壹、鄧小平時期(1979-1989) 47 貳、江澤民時期(1990-2003) 50 參、胡錦濤時期(2004-2012) 53 肆、習近平時期(2013-2022) 56 伍、小結 60 第四節 相似度分析 60 第五章 結論與建議 65 第一節 結論 65 壹、政府工作報告的總體組成 65 貳、不同領導人時期政府工作報告的組成 66 第二節 未來研究建議 67 參考文獻 68 壹、中文 68 貳、英文 69
dc.language.isozh-TW
dc.subject隱含狄利克雷分佈zh_TW
dc.subject中國政府工作報告zh_TW
dc.subject文字探勘zh_TW
dc.subject關鍵字分析zh_TW
dc.subjecttext miningen
dc.subjectkeyword analysisen
dc.subjectLDAen
dc.subjectChinese government work reporten
dc.title運用文字探勘分析1979年至2022年中國政府工作報告zh_TW
dc.titleUsing Text Mining to Analyze China Government Work Report from 1979 to 2022en
dc.typeThesis
dc.date.schoolyear110-2
dc.description.degree碩士
dc.contributor.oralexamcommittee聶建中(Chien-Chung Nieh),郭迺鋒(Nai-Fong Kuo)
dc.subject.keyword中國政府工作報告,文字探勘,關鍵字分析,隱含狄利克雷分佈,zh_TW
dc.subject.keywordChinese government work report,text mining,keyword analysis,LDA,en
dc.relation.page72
dc.identifier.doi10.6342/NTU202203762
dc.rights.note同意授權(限校園內公開)
dc.date.accepted2022-09-29
dc.contributor.author-college社會科學院zh_TW
dc.contributor.author-dept國家發展研究所zh_TW
dc.date.embargo-lift2022-09-30-
顯示於系所單位:國家發展研究所

文件中的檔案:
檔案 大小格式 
U0001-2109202219370600.pdf
授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務)
8.23 MBAdobe PDF
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved