請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81230| 標題: | 利用雙向長短期記憶人工神經網路的失智症患者語音分割 Speaker Change Detection for Patients with Dementia Using Bidirectional Long Short-Term Memory Networks |
| 作者: | JIAHAO WANG 王佳豪 |
| 指導教授: | 鄭士康(Shyh-Kang Jeng) |
| 關鍵字: | 失智症,語音內容轉折點檢測,雙向長短期記憶人工神經網路,貝葉斯信息量準則, Speaker change detection,Dementia speaker,Bayesian Information Criterion,Bidirectional Long Short-Term Memory networks, |
| 出版年 : | 2021 |
| 學位: | 碩士 |
| 摘要: | 我們希望設計出一種現代化的護理機器人,其需要能夠具備護理失智症患者的能力,其中一項挑戰是,實現護理機器人與失智症患者之間的對話,而這需要對護理機器人進行語言理解及表達能力的訓練。與此同時,實現這些訓練需要具備大量具有高度分割準確率的失智症患者之語音片段。我們通過實驗發現,失智症患者的語音識別及語音內容的轉折點檢測比正常人要復雜得多。因此,在本文中,我們首次提出設計雙向長短期記憶人工神經網路,進行失智症患者的說話人模型之設計,並通過對時間序列數據進行建模,從根本上解決失智症患者語音內容的轉折點檢測之難題。 本文研究結果表明,一些傳統中著名的關於語音內容轉折點檢測的方法,例如貝葉斯信息量準則,其不能有效地處理目標是失智症患者這樣的特殊情況。我們確認,現階段我們所提出的模型在處理失智症患者語音內容轉折點檢測方面的準確率為28.60%,比傳統中著名的貝葉斯信息量準則模型的準確率高出16.10%。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81230 |
| DOI: | 10.6342/NTU202101878 |
| 全文授權: | 同意授權(限校園內公開) |
| 顯示於系所單位: | 電信工程學研究所 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| U0001-2907202104281500.pdf 授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務) | 1.77 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
