請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/72175| 標題: | 基於鏈結式時序分類器之能保留語序之語音數位內容標題生成 Order-Preserving Abstractive Headline Generation for Spoken Content Based on Connectionist Temporal Classification |
| 作者: | "Lu,Bo Ru" 盧柏儒 |
| 指導教授: | 李琳山(Lin-shan Lee) |
| 關鍵字: | 自動摘要,語音數位內容,標題生成,鏈結式時序分類器, Automatic Summarization,Headline Generation,Spoken Content,Connectionist Temporal Classification, |
| 出版年 : | 2018 |
| 學位: | 碩士 |
| 摘要: | 由於網路多媒體資訊的蓬勃發展,資料量爆炸性增長的速度已遠遠超過人類 能夠吸收的能力。然而因為語音資訊不同於文字文件,人類若不聽完它就沒有辦 法一目瞭然或在音檔中快速瀏覽。因此,好的語音文件標題自動生成技術可以幫 助我們將語音文件,用一則言簡意賅的標題來描述其內容,幫助使用者大大減少 從語音文件中搜尋知識的時間。
本文是全球首先使用目前語音辨識領域表現最好的方法之一——鏈結式時序 分類器模型(connectionist temporal classification model,CTC)來解決語音文件自 動摘要的問題,其演算法中的良好特性可以在標題中保留原文件中的字詞順序, 而忽略不重要的詞彙,因此能相當程度保留了語意。 本論文分別探討對純文字文件(中文十億詞語料庫)與語音文件(中 文廣播新聞)而言,鏈結式時序分類器模型、序列至序列模型(sequence- to-sequence model,seq2seq)與專注式序列至序列模型(attentive sequence-to- sequence model,attentive seq2seq)之間的優劣,並透過實驗數據與範例來分析鏈 結式時序分類器模型在解決語音及文字文件標題生成問題時的優點。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/72175 |
| DOI: | 10.6342/NTU201803826 |
| 全文授權: | 有償授權 |
| 顯示於系所單位: | 電信工程學研究所 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-107-1.pdf 未授權公開取用 | 3.88 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
