請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/31778
標題: | 以多重評分自動產生語音文件標題之進一步研究 Improved Automatic Generation of Titles for Spoken Documents Using Various Scoring Techniques |
作者: | Chien-Chih Wang 王建智 |
指導教授: | 李琳山 |
關鍵字: | 語音辨識,適應性最近鄰居法,建造式標題產生法,精緻型建造式標題產生法, ASR,PLSA,title generation,topic entropy,viterbi beam search, |
出版年 : | 2006 |
學位: | 碩士 |
摘要: | 隨著科技的發展,生活中所能獲得的資訊愈來愈多,不只限於文字,包含著語音資訊的多媒體文件也愈來愈普遍,很有可能成為網路世界中最廣為流通的資料形式。雖然多媒體的資訊不易瀏覽,但大部分的多媒體資訊都包含了語音訊息,因此由語音文件來自動產生標題將會對於多媒體資訊的檢索與瀏覽有很大的幫助。
在本論文中提出了一套為語音文件自動產生標題的方法,結合了建造式標題產生法與適應性最近鄰居法,能夠自動為一篇語音文件產生通順且可讀的標題。其中,適應性最近鄰居法為改良最近鄰居法而來,在有相匹配的訓練語料的情形下,可以得到很好的結果。但是,在沒有相匹配的訓練語料時,產生的結果標題就會很不理想。在本論文中提出的建造式標題產生法則運用各種語音與語言處理方法,以及統計與評分技術來產生標題,可以相當程度解決訓練語料不匹配的問題。 由於適應性最近鄰居法充分運用人所撰寫的標題,使產生的標題能夠非常通順流暢,這個想法很值得保留下來使用。因此本論文將適應性最近鄰居法與本論文所提出的建造式標題產生法整合起來,一面保留適應性最近鄰居法的想法,一面配合運用建造式標題產生法,使產生標題的結果更理想。 其作法是先使用適應性最近鄰居法得到可能的候選標題,然後判斷這個候選標題是否與測試文件內容吻合。若是,則直接將該候選標題作為最後的標題;反之,若候選標題中的類專有名詞與關鍵用語都與測試文件內容不符,則改用建造式標題產生法來為測試文件產生標題。這種整合兩種方法的標題產生法,能夠保留兩個方法的概念與優點,確實使產生的標題可以普遍有更高可讀性與相關性。 It is about automatic generation of titles for spoken documents using various scoring techniques. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/31778 |
全文授權: | 有償授權 |
顯示於系所單位: | 資訊工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-95-1.pdf 目前未授權公開取用 | 1.19 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。