Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67593
標題: 個人化語言處理:語言模型及理解
Personalized Linguistic Processing: Language Modeling and Understanding
作者: Zih-Wei Lin
林資偉
指導教授: 李琳山(Lin-Shan Lee)
關鍵字: 個人化語言模型,個人化詞向量,自然語言處理,語音辨識,
Personalized Language Model,Personalized Word Representation,Natural Language Processing,Speech Recognition,
出版年 : 2017
學位: 碩士
摘要: 隨著網路世代巨量資料的產生以及機器學習技術的發展,語音助理等多種語音技術的應用不再只是創造噱頭的玩具,而是藉由強大的辨識能力以及持續進步的理解能力進入這一世代人的生活中。今日大公司利用大量的語音資料以及龐大的運算資源在雲端伺服器建立一個通用的語音辨識系統以服務所有使用者,每天有成千上萬的使用者使用同一套通用語音技術,一部分的使用者得到令他們滿意的服務,一部分的使用者卻因為通用語音技術無法正確辨識或理解而感到挫折,其中一個可能原因是因為使用者的語句中參雜了帶有個人特色的說話習慣,例如口頭禪、流行用語、特殊主題、領域的用詞,或是朋友的名字等,與辨識或理解模型無法合理匹配。
解決這些問題的方法正是替每一位使用者建立帶有個人特色的說話習慣的專屬個人語音技術,以解決通用模型辨識及理解能力不足的問題。本論文針對語言處理的部分,使用由社群網路蒐集獲得的語料進行處理,藉由這些少量的個人化資料學習出每個使用者不同的用詞習慣以及語言特徵,幫助個人化語音處理以及語意理解。
本論文首先針對語音辨識系統中的語言模型加以個人化,藉由深層類神經網路,從個人化資料中抽取出代表使用者語言特徵的向量,利用使用者特徵將通用語言模型加以個人化來提高辨識正確率;再者,本論文也針對表示語意的詞向量加以個人化,使得相同的詞在不同的使用者事實上帶有略不相同的語意,更能貼近使用者想要表達的意思,以提升個人化語音處理及語意理解的能力。希望能夠藉由這兩個方向的個人化,補足通用語音辨識技術的不足,提升語音處理的使用者體驗。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/67593
DOI: 10.6342/NTU201702200
全文授權: 有償授權
顯示於系所單位:電信工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-106-1.pdf
  目前未授權公開取用
3.38 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved