Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/48322
標題: 不必解碼的區段長度編碼字串比對問題演算法
Algorithms for Comparing Run-Length Encoded Strings without Decoding
作者: Kuan-Yu Chen
陳冠宇
指導教授: 趙坤茂
關鍵字: 區段長度,壓縮,字串搜尋,比對,迴文,
run length,compression,pattern matching,alignment,palindrome,
出版年 : 2011
學位: 博士
摘要: 在字串學的研究中,一個最新的趨勢結合了字串搜尋與資料壓縮這兩種概念,創造了所謂「壓縮字串搜尋問題」。在此研究課題中,最終的目標是希望能設計出不必解碼的字串比對演算法。此論文中所探討的壓縮方式稱為「區段長度編碼」,儘管這個編碼方式十分簡易,唯一正面的結果為計算區段長度編碼字串的「插入、刪除距離」,所需花費的時間為O(mn log mn),其中m和n分別代表輸入字串的區段數。此論文中,我們探討了包含如何比較兩區段長度編碼字串與尋找特徵片段等問題,所提出的演算法皆不必經過解碼步驟,其中,我們更提出了第一個不必經過解碼就能計算區段長度編碼字串「編輯距離」的演算法。論文中更對所討論的問題建立其時間複雜度的下界,分別由「三總和問題」或「排序成對和問題」當成其下界,這說明了所討論的問題具有Ω(mn)和Ω(mn logm)等猜測的時間複雜度下界。我們相信本論文的結果有助於設計出不必經過解碼的區段長度編碼字串的序列比對演算法。
A recent trend in stringology combines the two concepts of pattern matching and data compression, creating the so-called compressed pattern matching problem. The ultimate goal in this line of investigation is to design algorithms that can cope with encoded strings without resorting to any decoding step. The underlying compression scheme considered in this dissertation is called run-length encoding. Despite its simple coding nature, the only positive result before this work is the computation of indel-distance (dual of longest common subsequence) of two run-length encoded strings, achieving O(mnlog mn) time, where m and n are the number of runs of the input strings. Both comparing and identifying featured patterns in run-length encoded strings are explored in this dissertation. All the presented algorithms contain no decoding step, one of which is the firs-known algorithm that computes the Levenshtein distance of two run-length encoded strings without decoding. Several lower bounds are established in the dissertation, by reduction from either the 3sum problem or the problem of sorting pairwise-sums, implying O­mega(mn) and Omega­(mnlogm) conjectured time bounds, respectively. We believe that the work accomplished in this dissertation shed some light on solutions to aligning two run-length encoded strings without decoding.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/48322
全文授權: 有償授權
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-100-1.pdf
  目前未授權公開取用
612.97 kBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved