請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/72323
標題: | 利用深度嵌入向量模型的非監督式文字分群方法 Unsupervised Text Clustering with Deep Embedding Model |
作者: | Ko-Ching Liang 梁可擎 |
指導教授: | 黃鐘揚(Chung-Yang Ric Huang) |
關鍵字: | 機器學習,深度學習,自然語言處理,分群, machine learning,deep learning,natural language processing,clustering, |
出版年 : | 2018 |
學位: | 碩士 |
摘要: | 非監督學習為現今機器學習中相當熱門的領域。對於自然語言處理方面的問題,在監督式學習法取得相當的成功同時,非監督式方法仍有許多挑戰及困難。本論為旨在提出一基於特徵提取之非監督學習模型,針對文字序列資料集優化其分群結果。實驗結果顯示出保留文字序列資訊與特徵對於分群結果有效產生影響並提升結果。 Unsupervised clustering is a popular research domain in machine learning on natural language while supervised methods like intent classification achieve remarkably good results in text data. A latent variable based model is introduced to improve the clustering results on NLP tasks. We exploit recurrent auto-encoder to obtain latent representations of sentences, then iteratively optimize an objective which learns feature representations and clustering assignments simultaneously. Experiments on several datasets show the need for preserving sequence information and the effectiveness of the proposed method. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/72323 |
DOI: | 10.6342/NTU201803637 |
全文授權: | 有償授權 |
顯示於系所單位: | 電子工程學研究所 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-107-1.pdf 目前未授權公開取用 | 3.4 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。