請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/73283| 標題: | 基於深度學習及Thingtalk之中文虛擬助理 Chinese Virtual Assistant Based On Deep Learning And Thingtalk |
| 作者: | Cheng-Han Hsu 許正翰 |
| 指導教授: | 陳和麟(Ho-Lin Chen) |
| 共同指導教授: | 廖世偉(Shi-Wei Liao) |
| 關鍵字: | 虛擬助理,隱私保障,自然語言, Virtual Assistant,Genie,Thingtalk,Semantic Parsing,Almond, |
| 出版年 : | 2019 |
| 學位: | 碩士 |
| 摘要: | Almond是一個開放原始碼、保障隱私、可編程且具擴展性的虛擬助理。Almond提供了一個自然語言使用者介面,使用者不需要撰寫程式碼、不需要學習複雜的程式知識就可以使用。Almond作為一個整合服務平台,使用者可以透過自然語言,去使用、管理、新增和定義自己的網路服務以及互聯網裝置,例如Google信箱、臉書帳戶,使用者可以透過用說的方式,像是“幫我寄信給指導教授”、“幫我在臉書上貼文”、“當溫度高於25度時,打開我的冷氣”等等方式,來使用這些網路服務以及物聯網裝置。
當前市面上的虛擬助理裝置或服務,幾乎都是由大公司所提供,像是亞馬遜公司的Alexa。使用者若要使用這些服務,就必須把私人的資料,如網路服務的帳號、密碼,家中物聯網裝置的存取權限等資訊,提供給這些虛擬助理提供商。如此一來,使用者的資料勢必得集中在這些大公司的平台上,使用者對於自身資料的掌控度因而下降,甚至是隱私權保障等問題,便無法解決。 Almond提供使用者另外一個選擇:使用者可以把所有個人資料都保存在自己的主機,不需要提供給平台提供商。此外,使用者可以很容易地在Almond新增、定義新的網路服務或事物聯網裝置,無須等待裝置供應商或網路服務公司新增。 Almond虛擬助理可以改變目前世界上由主流大公司掌控使用者資料,並藉此影響世界各地廣大使用者的趨勢,改變由大公司定義,甚至操控使用者、操控資訊的情形。Almond開放原始碼虛擬助理提供了使用者不一樣的選擇,讓用戶掌握自己的資料,拿回屬於自己的權利。 ThingTalk是一個專門設計給Almond的程式語言。它可以用來控制網路服務、物聯網裝置。Almond利用深度學習模型來做自然語言語意分析,將自然語言翻譯成Thingtalk。 深度學習模型的訓練需要巨量的訓練資料,而訓練資料的數量以及品質基本上決定了模型的表現。為了產生足夠的訓練資料,Almond提供了一個稱為Genie的訓練資料產出模組及模型訓練流程。這是能夠順利使用Almond的關鍵因素。 全世界第二多人使用的語言就是中文,未來甚至會超過英文使用者的數量。為了讓廣大的中文使用者可以使用、接觸Almond,享受其服務,我們擴展Genie,讓Genie可以支援中文。如此一來,中文使用者就可以輕鬆地使用Almond,一起享受Almond帶來的革命。 Almond, which is an open source virtual assistant, aims at providing a privacy preserving, extensible and programmable virtual assistant which can help people to access the Internet and IoT (Internet of Things) through natural language. Virtual assistants are changing the way people interact with digital world and devices by giving us a uniform programming language, personalized combination of devices and web services, linguistic user interface to our diverse web service, our data, our IoT devices. Users have the right to decide where they want to put their personal data, when their data can be used, who have access toward their data, and whether they want their personal data to be deleted or not. This is a basic human right that everyone is born to have, and it is now formally protected by the legislator, for example, General Data Protection Regularization (GDPR). Almond provides such virtual assistant that can support functions just like Amazon Alexa yet protect users’ privacy at the same time. To keep users’ data away from storage in the third party, users are able to define their device and web service in Almond without learning complex programming language. It should be easy to extend new devices and web services by any one. Almond provides such platform to support technical innovations. Virtual assistant is a game-changer. Today’s big brother companies owning massive volume of private data can exert overwhelming influence on a large population. Almond provide a simple, natural language accessible interface, help users have a better choice of vendors, also have the option to keep their data on their end. Thingtalk - a virtual assistant programming language - is designed for controlling web service and IoT device on Almond. In order to provide a natural language interface, we need a semantic parser to parse natural language into Thingtalk. Almond utilizes deep learning model to translate natural language into Thingtalk. If we want the model to work, perform extraordinary and achieve our target performance, thousands of data are required for training. To generate this amount of data, Almond provides a generating process called Genie, a generator of training data for the semantic parser in Almond. Based on this, we extended Genie to support Chinese, so that users who speak Chinese can also benefit from Almond. |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/73283 |
| DOI: | 10.6342/NTU201900926 |
| 全文授權: | 有償授權 |
| 顯示於系所單位: | 電機工程學系 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-108-1.pdf 未授權公開取用 | 1.02 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
