Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/63278
標題: 使用支撐向量機的自發性語音語句分段
Sentence Segmentation of Spontaneous Speech using Support Vector Machine
作者: Yu-Cheng Liu
劉又誠
指導教授: 李琳山(Lin-Shan Lee)
關鍵字: 語句分段,自發性語音,機器學習,語彙特徵,韻律特徵,
sentence segmentation,spontaneous speech,machine learning,lexical feature,prosodic feature,
出版年 : 2012
學位: 碩士
摘要: 語音處理的技術日新月異,從語音辨識率的提升至語意的理解分析,都被廣泛的研究及應用。語句分段可分為四個階段,首先用能量等基本特徵做粗分段,再將每一粗分段的語音訊號辨識成詞串,接著在詞與詞之間找出適當的語句邊界,最後再將重新分段的語句進行再辨識,以提升辨識率。本論文著重在第三階段的尋找適當斷點。
  語音大致上可分為朗讀式語音和自發性語音兩大類,後者會因為語者的思路和語者習慣,說話節奏、韻律、及用詞上與前者不同。而本論文的研究語料為課程語音,屬於自發性語音,實驗中使用支撐向量機做為學習演算法訓練模型,並藉此比較不同的語彙及韻律特徵對語句分段的效用。
  實驗分別做在人工標記轉寫和語音辨識後的結果上。語彙特徵包含語言模型特徵、詞性標記特徵、關鍵詞彙特徵,研究顯示語彙特徵彼此有加成性,其中又以關鍵詞彙特徵對結果的提升最有幫助,但由於實驗語料為單一語者,在多語者情況下,其效用尚待實驗;韻律特徵的部分使用了兩組不同的特徵,一組原用於音調辨識;另一組原用於偵測自發性語音中不流利處,而研究顯示後者較為有效。整體而言,韻律特徵的效果遠勝語彙特徵,但兩者具有一定程度的加成性。此外由於自發性語音中,語句邊界附近用詞特性的關係,人工標記轉寫和語音辨識結果的實驗數據和趨勢相近,說明辨識率對自發性語音的語句分段並無太大影響。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/63278
全文授權: 有償授權
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-101-1.pdf
  未授權公開取用
622.15 kBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved