Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊網路與多媒體研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/53648
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor徐宏民
dc.contributor.authorYi-Chih Tsaien
dc.contributor.author蔡宜芷zh_TW
dc.date.accessioned2021-06-16T02:26:57Z-
dc.date.available2017-06-19
dc.date.copyright2015-08-11
dc.date.issued2015
dc.date.submitted2015-08-04
dc.identifier.citation[1] S. Roy and D. Suciu. A formal approach to finding explanations for database queries. ACM SIGMOD, 2014.
[2] J. Wang, J. Yang, K. Yu, F. Lv, T. Huang, and Y. Gong. Locality-constrained linear coding for image classification. In Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on, pages 3360–3367. IEEE, 2010.
[3] C.-C. Wu, T. Mei, W. H. Hsu, and Y. Rui. Learning to personalize trending image search suggestion. ACM SIGIR, 2014.
[4] E. Wu and S. Madden. Scorpion: Explaining away outliers in aggregate queries. VLDB, 2013.
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/53648-
dc.description.abstract隨著視覺化網頁技術以及資料分析語言的興起,各式各樣的視覺化圖表或是系統資源充斥,我們很容易取得多樣化的視覺分析工具。但是現今仍然沒有一個工具或是圖表能夠讓使用者容易的找出存在於串流使用資料中的趨勢事件以及這個事件的成因組合。
在這篇論文中,我們對這個議題提出了可以應用在百萬筆資料規模上的解決方法,並使用串流音樂服務的資料為例。我們想在串流音樂的使用記錄中找出某個時間點的趨勢事件,例如:某歌手的點播率在這個時間點越來越紅,原因為某群使用者用某個平台點播。找出這樣的事件就是我們的目的。但礙於我們的資料為類別型的資料(而非數值型,例如說:歌手的名字),找出這樣的事件成因組合其實是非常困難的。我們無法直接使用已開發成熟的各種數值型的學習方法來解決我們想到的問題。所以我們提出一個學習方法和其結果瀏覽介面去揭露這個學習方法所學到的東西。而且這個方法不只可以應用在我們的音樂服務範例上,也可以應用在其他時間型的類別資料,像是社群網站中的主題標籤。
首先我們用``trending pool'這個操作去找出有用的項目以減少之後的記憶體和計算時間用量。再來我們使用sparse coding這個學習方法去找出重要的事件成因組合而非傳統的窮舉法,或是人工指定組合的方法。除了以上的貢獻之外,我們還做了視覺介面設計,用來方便觀察分析每個時段的事件成因組合,並用這個介面找出了一些有趣的使用者聆聽音樂的習慣模式。
zh_TW
dc.description.abstractAlthough many visualization tools provide us plenty of ways to view the data, users can not use them to easily find the trending events and their explanation from the million-scale data. In this work, we address the issue by leveraging the real music streaming log data as an example to help users better understand a million-scale dataset. Trending event explanation turns out to be challenging when it comes to categorical log data. Therefore, we propose to use a learning-based method with an interface design to uncover the trending event compositions for time-series categorical log data, which can be extend to other datasets, e.g., the hashtags in social media. First, we perform ``trending pool' operation to save the memory and time cost. Second, we apply sparse coding to learn important trending candidate combination sets instead of traditional brute-force way or manual investigation for generating combinations. Besides the contributions above, we also observe some interesting user behaviors by exploring detected trending candidate combinations visually through our interface.en
dc.description.provenanceMade available in DSpace on 2021-06-16T02:26:57Z (GMT). No. of bitstreams: 1
ntu-104-R02944009-1.pdf: 1989643 bytes, checksum: cf51542263a88906e414a443a893218b (MD5)
Previous issue date: 2015
en
dc.description.tableofcontentsContents
誌謝. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
摘要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
0.0.1 Keywords . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
1.1 Trending Traffics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Streaming Data Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Problem Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Related Work . . . . . . . . . . . . . . . . . . . . . 4
2.1 Trending Detection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Event Explanation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2.1 Limitations of Prior works . . . . . . . . . . . . . . . . . . . . . 4
3 Technical Details . . . . . . . . . . . . . . . . . . . . . 6
3.1 Trending Candidate Detection . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.1 Trending Pool . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.1.2 Trick: Entropy Weight . . . . . . . . . . . . . . . . . . . . . . . 8
3.2 Event Composition Discovering . . . . . . . . . . . . . . . . . . . . . . 9
3.2.1 Sparse Coding . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3 System Summarization: with Visualization . . . . . . . . . . . . . . . . 10 v
4 Experiment Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.1 Datasets and Implementation . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2 Trending Candidate Evaluation . . . . . . . . . . . . . . . . . . . . . . . 12
4.2.1 Pseudo Ground Truth . . . . . . . . . . . . . . . . . . . . . . . . 13
4.2.2 Pilot Experiment Flow . . . . . . . . . . . . . . . . . . . . . . . 13
4.2.3 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.3 Trending Event Results . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4 User Behavior Findings . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.4.1 Windows Platform . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.4.2 Users of 1970 to 1989 . . . . . . . . . . . . . . . . . . . . . . . 17
4.4.3 Mobile Platforms . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5 Visualization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.1 Visualization Layout . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.2 Design Factors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.1 Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.2 Future Works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
dc.language.isoen
dc.title在串流使用記錄中進行趨勢偵測與分析事件成因組合zh_TW
dc.titleTrending Event Detection and Explanation on Streaming Log Dataen
dc.typeThesis
dc.date.schoolyear103-2
dc.description.degree碩士
dc.contributor.oralexamcommittee孫民,李宏毅,陳文進
dc.subject.keyword趨勢事件,事件偵測,時間序列,類別資料,串流資料,大型資料視覺化,視覺分析,zh_TW
dc.subject.keywordTrending event,event detection,time-series,categorical data,streaming data,large-scale visualization,visual analytics,en
dc.relation.page22
dc.rights.note有償授權
dc.date.accepted2015-08-04
dc.contributor.author-college電機資訊學院zh_TW
dc.contributor.author-dept資訊網路與多媒體研究所zh_TW
顯示於系所單位:資訊網路與多媒體研究所

文件中的檔案:
檔案 大小格式 
ntu-104-1.pdf
  目前未授權公開取用
1.94 MBAdobe PDF
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved