Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81230
標題: 利用雙向長短期記憶人工神經網路的失智症患者語音分割
Speaker Change Detection for Patients with Dementia Using Bidirectional Long Short-Term Memory Networks
作者: JIAHAO WANG
王佳豪
指導教授: 鄭士康(Shyh-Kang Jeng)
關鍵字: 失智症,語音內容轉折點檢測,雙向長短期記憶人工神經網路,貝葉斯信息量準則,
Speaker change detection,Dementia speaker,Bayesian Information Criterion,Bidirectional Long Short-Term Memory networks,
出版年 : 2021
學位: 碩士
摘要: 我們希望設計出一種現代化的護理機器人,其需要能夠具備護理失智症患者的能力,其中一項挑戰是,實現護理機器人與失智症患者之間的對話,而這需要對護理機器人進行語言理解及表達能力的訓練。與此同時,實現這些訓練需要具備大量具有高度分割準確率的失智症患者之語音片段。我們通過實驗發現,失智症患者的語音識別及語音內容的轉折點檢測比正常人要復雜得多。因此,在本文中,我們首次提出設計雙向長短期記憶人工神經網路,進行失智症患者的說話人模型之設計,並通過對時間序列數據進行建模,從根本上解決失智症患者語音內容的轉折點檢測之難題。 本文研究結果表明,一些傳統中著名的關於語音內容轉折點檢測的方法,例如貝葉斯信息量準則,其不能有效地處理目標是失智症患者這樣的特殊情況。我們確認,現階段我們所提出的模型在處理失智症患者語音內容轉折點檢測方面的準確率為28.60%,比傳統中著名的貝葉斯信息量準則模型的準確率高出16.10%。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81230
DOI: 10.6342/NTU202101878
全文授權: 同意授權(限校園內公開)
顯示於系所單位:電信工程學研究所

文件中的檔案:
檔案 大小格式 
U0001-2907202104281500.pdf
授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務)
1.77 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved