Skip navigation

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets

Learn More
DSpace logo
English
中文
  • Browse
    • Communities
      & Collections
    • Publication Year
    • Author
    • Title
    • Subject
  • Search TDR
  • Rights Q&A
    • My Page
    • Receive email
      updates
    • Edit Profile
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊網路與多媒體研究所
Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/53648
Title: 在串流使用記錄中進行趨勢偵測與分析事件成因組合
Trending Event Detection and Explanation on Streaming Log Data
Authors: Yi-Chih Tsai
蔡宜芷
Advisor: 徐宏民
Keyword: 趨勢事件,事件偵測,時間序列,類別資料,串流資料,大型資料視覺化,視覺分析,
Trending event,event detection,time-series,categorical data,streaming data,large-scale visualization,visual analytics,
Publication Year : 2015
Degree: 碩士
Abstract: 隨著視覺化網頁技術以及資料分析語言的興起,各式各樣的視覺化圖表或是系統資源充斥,我們很容易取得多樣化的視覺分析工具。但是現今仍然沒有一個工具或是圖表能夠讓使用者容易的找出存在於串流使用資料中的趨勢事件以及這個事件的成因組合。
在這篇論文中,我們對這個議題提出了可以應用在百萬筆資料規模上的解決方法,並使用串流音樂服務的資料為例。我們想在串流音樂的使用記錄中找出某個時間點的趨勢事件,例如:某歌手的點播率在這個時間點越來越紅,原因為某群使用者用某個平台點播。找出這樣的事件就是我們的目的。但礙於我們的資料為類別型的資料(而非數值型,例如說:歌手的名字),找出這樣的事件成因組合其實是非常困難的。我們無法直接使用已開發成熟的各種數值型的學習方法來解決我們想到的問題。所以我們提出一個學習方法和其結果瀏覽介面去揭露這個學習方法所學到的東西。而且這個方法不只可以應用在我們的音樂服務範例上,也可以應用在其他時間型的類別資料,像是社群網站中的主題標籤。
首先我們用``trending pool'這個操作去找出有用的項目以減少之後的記憶體和計算時間用量。再來我們使用sparse coding這個學習方法去找出重要的事件成因組合而非傳統的窮舉法,或是人工指定組合的方法。除了以上的貢獻之外,我們還做了視覺介面設計,用來方便觀察分析每個時段的事件成因組合,並用這個介面找出了一些有趣的使用者聆聽音樂的習慣模式。
Although many visualization tools provide us plenty of ways to view the data, users can not use them to easily find the trending events and their explanation from the million-scale data. In this work, we address the issue by leveraging the real music streaming log data as an example to help users better understand a million-scale dataset. Trending event explanation turns out to be challenging when it comes to categorical log data. Therefore, we propose to use a learning-based method with an interface design to uncover the trending event compositions for time-series categorical log data, which can be extend to other datasets, e.g., the hashtags in social media. First, we perform ``trending pool' operation to save the memory and time cost. Second, we apply sparse coding to learn important trending candidate combination sets instead of traditional brute-force way or manual investigation for generating combinations. Besides the contributions above, we also observe some interesting user behaviors by exploring detected trending candidate combinations visually through our interface.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/53648
Fulltext Rights: 有償授權
Appears in Collections:資訊網路與多媒體研究所

Files in This Item:
File SizeFormat 
ntu-104-1.pdf
  Restricted Access
1.94 MBAdobe PDF
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved