使用支撐向量機的自發性語音語句分段

Yu-Cheng Liu; 劉又誠

Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/63278

Title:	使用支撐向量機的自發性語音語句分段 Sentence Segmentation of Spontaneous Speech using Support Vector Machine
Authors:	Yu-Cheng Liu 劉又誠
Advisor:	李琳山(Lin-Shan Lee)
Keyword:	語句分段,自發性語音,機器學習,語彙特徵,韻律特徵, sentence segmentation,spontaneous speech,machine learning,lexical feature,prosodic feature,
Publication Year :	2012
Degree:	碩士
Abstract:	語音處理的技術日新月異，從語音辨識率的提升至語意的理解分析，都被廣泛的研究及應用。語句分段可分為四個階段，首先用能量等基本特徵做粗分段，再將每一粗分段的語音訊號辨識成詞串，接著在詞與詞之間找出適當的語句邊界，最後再將重新分段的語句進行再辨識，以提升辨識率。本論文著重在第三階段的尋找適當斷點。　　語音大致上可分為朗讀式語音和自發性語音兩大類，後者會因為語者的思路和語者習慣，說話節奏、韻律、及用詞上與前者不同。而本論文的研究語料為課程語音，屬於自發性語音，實驗中使用支撐向量機做為學習演算法訓練模型，並藉此比較不同的語彙及韻律特徵對語句分段的效用。　　實驗分別做在人工標記轉寫和語音辨識後的結果上。語彙特徵包含語言模型特徵、詞性標記特徵、關鍵詞彙特徵，研究顯示語彙特徵彼此有加成性，其中又以關鍵詞彙特徵對結果的提升最有幫助，但由於實驗語料為單一語者，在多語者情況下，其效用尚待實驗；韻律特徵的部分使用了兩組不同的特徵，一組原用於音調辨識；另一組原用於偵測自發性語音中不流利處，而研究顯示後者較為有效。整體而言，韻律特徵的效果遠勝語彙特徵，但兩者具有一定程度的加成性。此外由於自發性語音中，語句邊界附近用詞特性的關係，人工標記轉寫和語音辨識結果的實驗數據和趨勢相近，說明辨識率對自發性語音的語句分段並無太大影響。
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/63278
Fulltext Rights:	有償授權
Appears in Collections:	資訊工程學系

Files in This Item:

File	Size	Format
ntu-101-1.pdf Restricted Access	622.15 kB	Adobe PDF

Show full item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets