Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電機工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28049
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor李琳山
dc.contributor.authorMiao-Ru Wuen
dc.contributor.author吳妙嬬zh_TW
dc.date.accessioned2021-06-12T18:35:37Z-
dc.date.available2007-08-03
dc.date.copyright2007-08-03
dc.date.issued2007
dc.date.submitted2007-07-30
dc.identifier.citation【1】 廖碩鵬,”中文語音辨識中語言模型的強化”,國立台灣大學碩士論文,2003。
【2】 Alex Waibel, Petra Geutner, Laura Mayfield Tomokiyo, Tanja Schultz, and Monkia Woszczyna,”Multilinguality in Speech and Spoken Language Systems” PROCEEDINGS OF THE IEEE, VOL. 88, NO. 8, AUGUST 2000。
【3】 Thomas Nieslery, Daniel Willettz,” Language Identification and Multilingual Speech Recognition using Discriminatively Trained Acoustic Models”,ISCA Tutorial and Research Workshop on Multilingual Speech and Language Processing ,2006 April.
【4】 Dau-cheng Lyu, Ren-yuan Lyu, Yuang-chin Chian , Chun-nan Hsu,”Speech Recognition on Code-Switching Among the Chinese Dialects”,ICASSP 2006.
【5】 Joyce Y. C. Chan, P. C. Ching, Tan Lee and Houwei Cao,” Automatic speech recognition of Cantonese-English code-mixing utterances”,INTERSPEECH 2006.
【6】 R. Lejeune, J. Baude, C. Tchong, H. Crepy, C. Waast-Richard,” Flavoured Acoustic Model and Combined Spelling to Sound for Asymmetrical Bilingual Environment”,INTERSPEECH 2005.
【7】 Hirofumi Yamamoto1,3, Genichiro Kikui2, Satoshi Nakamura1,2and Yoshinori Sagisaka,” SPEECH RECOGNITION OF FOREIGN OUT-OF-VOCABULARY WORDS USING AHIERARCHICAL LANGUAGE MODEL”,INTERSPEECH 2006.
【8】 Timothy J. Hazen,” Automatic Alignment and Error Correctionof Human Generated Transcripts for Long Speech Recordings”,INTERSPEECH 2006.
【9】 謝國平,”語言學概論”,三民書局。
【10】 Xuedong Huang, Alex Acero, Hsiao-Wuen Hon,”Spoken Language Processing”,Prentice Hall PTR 2001
【11】 Chiu-yu Tseng and Fu-chiang Chou,”Machine Reachable Phonetic Transcription System for Chinese Dialects Spolen in Taiwan”,The First Oriental COCOSDA Workshop 1998 .
【12】 梁柏宇,”國與連續語音辨識之聲學模型研究”,國立台灣大學碩士論文,1998。
【13】 Peter F. Brown, Peter V. deSouza, Robert L. Mercer, Vincent J. Della Pietra, Jenifer C. Lai,” Class-Based n-gram Models of Natural Language”,Computational Linguistics 1992.
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/28049-
dc.description.abstract經過多年的發展,中文大字彙語音辨識系統已發展成熟,只要有足夠的訓練語料就能建立起高辨識率的語音辨識系統。隨著全球化的風潮,單一地區內多種語言,尤其是國際通用語言英語與當地語言,的交錯使用已相當普遍,但目前雙語辨識系統的發展程度卻遠不及單語系統。
因此本論文針對中英雙語課程錄音作為目標語料,根據既有的語音辨識系統架構,以不同定義方式設計系統內不同元件,建立雙語語音辨識系統。其中包括雙語詞典的取得、雙語音素集的設計、針對雙語特性設計語言模型、雙語語料分析,以及雙語系統等。
實驗證實,針對辨識流程就每一細部元件詳加設計,的確能夠影響辨識效能;而特別針對目標語料的雙語特性定義細部元件時,大部分多少都能朝向預期目標發展;但囿於訓練語料數量的限制,辨識率變動幅度較不明顯。但我們藉由分析不同元件、方法的辨識結果,得到許多有對發展雙語系統以及課程辨識系統的有效知識及經驗,並於最後提出改進方向。此外,本實驗的目標語料為自發性語音(spontaneous speech),但尚未就此一語料進行任何特殊考慮及設計。
zh_TW
dc.description.provenanceMade available in DSpace on 2021-06-12T18:35:37Z (GMT). No. of bitstreams: 1
ntu-96-R94921036-1.pdf: 870778 bytes, checksum: 61b74985f59f5db18ec83213edffcb17 (MD5)
Previous issue date: 2007
en
dc.description.tableofcontents志謝 ⅰ
中文摘要 ⅱ
目錄 ⅲ
圖目錄 ⅶ
表目錄 ⅷ
第一章 緒論……………………………………………………………….. 1
1.1 研究動機…………………………………………………………………… 1
1.2 中英雙與連續語音的特性及其辨識系統之考慮..……………………… 2
1.2.1 英文連續語音的特性及其系統………………...………………… 2
1.2.2 中文連續語音的特性及其系統………………...………………… 3
1.2.3 中英雙語語音的特性及其系統………………...………………… 3
1.3 本論文研究主題的背景………...………………...……………………… 4
1.3.1 辭典……………………………………………...………………… 5
1.3.2 音素集…………………………………………...………………… 5
1.3.3 語言模型………………………………………...………………… 5
1.4 本論文所採用的研究方法與主要結果...………...……………………… 5
1.5 章節大要………………………...………………...……………………… 6
第二章 中英雙語連續語音辨識基礎架構及相關研究………………………….. 7
2.1 雙語語音辨識的基本架構………………………………………………… 8
2.1.1 聲學模型………………………………………...………………… 8
2.1.2 辭典……………………………………………...………………… 8
2.1.3 語言模型………………………………………...………………… 9
2.2 雙語語音辨識文獻回顧…………………………………………………… 9
2.2.1 多語系統(Multi-lingual System)...……………...………………… 9
2.2.2 多語語音辨識結合語言辨認系統……………...……………….. 12
2.2.3 混合語言系統(Code-Mixing/Code-Switching)...………………... 13
2.3 本論文實驗語料介紹……………………………………………………. 18
2.3.1 語料內容………………………....……………...………………... 18
2.3.1.1 語音語料……...…………..……………...………………... 18
2.3.1.2 文字語料……...…………..……………...……………….. 20
2.3.2 課程語料特性在雙語語音辨識中的角色……...……………..… 21
2.3.3 辭典在雙語語音辨識中的角色………………...……………….. 22
2.4 實驗工作環境與工具…………………………………………………… 23
2.5 本章結論………………………………………………………………….. 23
第三章 音素集的設計選擇……………………………………………………... 25
3.1 概論……………………………………………………………………….. 25
3.2 音素集定義方式………………………………………………………….. 27
3.2.1 單語音素集特性………………………………...……………….. 29
3.2.2 雙語音素集特性………………………………...……………….. 33
3.3 音素集與決策樹定義方式……………………………………………….. 33
3.3.1 加成三連音素集………………………………...……………….. 35
3.3.1.1 音素直接加成法...………..……………...……………….. 35
3.3.1.2 聲韻母與音素直接加成法(IF-CMU)...….……………….. 37
3.3.2 綜合三連音素集………………………………...……………….. 38
3.3.2.1 基於國際音標的綜合法(IPA-B)..…….....……………….. 39
3.3.2.2 相似度綜合法(LLH-B)……………...…...……………….. 40
3.4 比較與效能分析………………………………………………………….. 41
3.5 本章結論………………………………………………………………….. 42
第四章 語言模型的設計………………………………………………………... 43
4.1 概論………………………………………………………………………. 43
4.2 語言模型基本定義………………………………………………………. 43
4.2.1 N連語言模型….………………………………...………………. 43
4.2.2 語言模型平滑法………………………………...……………….. 45
4.2.3 語言模型評估準則 – 混淆度(Perplexity)…......……………….. 46
4.2.4 雙語語言模型………………………………...………………….. 47
4.3 語言模型實驗定義方式………………………………………………….. 48
4.3.1 完全相關語言模型……………………………...……………….. 48
4.3.1.1 雙連語言模型與三連語言模型........…………………….. 48
4.3.1.2 以詞群為基礎的語言模型..………...…...……………….. 49
4.3.2 部份相關語言模型……………………………...……………….. 52
4.3.2.1 語言模型調適………………………........……………….. 52
4.4 比較與效能分析…………………………………………………………. 55
4.5 本章結論…………………………………………………………………. 56
第五章 實驗結果與討論……………………………………………………….. 57
5.1 基礎實驗(Baseline)……………………………………………………… 57
5.2 使用不同辭典造成的影響……………………………………………… 58
5.3 使用不同音素集造成的影響…………………………………………… 58
5.3.1 完整音素直接加成雙語音素集………………...……………….. 59
5.3.2 聲韻母與音素直接加成雙語音素集…………...……………….. 60
5.3.3 基於國際音標的綜合音素集…………….…......……………….. 62
5.4 使用不同語言模型造成的影響…………………………………………. 63
5.4.1 完全相關語言模型……………………………...……………….. 63
5.4.1.1 基礎雙連語言模型與基礎三連語言模型……………….. 63
5.4.1.2 以詞群為基礎的語言模型..………...…...……………….. 64
5.4.2 調適語言模型—使用部份相關語言模型………...…………….. 66
5.5 本章結論………………………………………………………………….. 67
第六章 結論與展望……………………………………………………………... 69
6.1 分析與討論……………………………………………………………….. 70
6.2 展望………………………………………………………………………. 70
6.2.1 雙語辨識系統的展望…………………………...……………….. 70
6.2.2 課程錄音辨識系統的展望……………………...……………….. 70
參考文獻…………………………………………………………………….…… 71
附錄……………………………………………………………………………….... 73
dc.language.isozh-TW
dc.subject辭典zh_TW
dc.subject雙語zh_TW
dc.subject音素集zh_TW
dc.subject語言模型zh_TW
dc.subjectphone seten
dc.subjectlexiconen
dc.subjectlanguage modelen
dc.subjectbilingualen
dc.title以課程錄音為基礎的中英雙語語音辨識之初步研究zh_TW
dc.titleInitial Study on Chinese/English Bilingual Speech Recognition based on Lecture Recordingen
dc.typeThesis
dc.date.schoolyear95-2
dc.description.degree碩士
dc.contributor.oralexamcommittee陳信宏,王小川,鄭秋豫
dc.subject.keyword雙語,音素集,語言模型,辭典,zh_TW
dc.subject.keywordbilingual,phone set,language model,lexicon,en
dc.relation.page72
dc.rights.note有償授權
dc.date.accepted2007-07-31
dc.contributor.author-college電機資訊學院zh_TW
dc.contributor.author-dept電機工程學研究所zh_TW
顯示於系所單位:電機工程學系

文件中的檔案:
檔案 大小格式 
ntu-96-1.pdf
  未授權公開取用
850.37 kBAdobe PDF
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved