請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/53648
完整後設資料紀錄
DC 欄位 | 值 | 語言 |
---|---|---|
dc.contributor.advisor | 徐宏民 | |
dc.contributor.author | Yi-Chih Tsai | en |
dc.contributor.author | 蔡宜芷 | zh_TW |
dc.date.accessioned | 2021-06-16T02:26:57Z | - |
dc.date.available | 2017-06-19 | |
dc.date.copyright | 2015-08-11 | |
dc.date.issued | 2015 | |
dc.date.submitted | 2015-08-04 | |
dc.identifier.citation | [1] S. Roy and D. Suciu. A formal approach to finding explanations for database queries. ACM SIGMOD, 2014.
[2] J. Wang, J. Yang, K. Yu, F. Lv, T. Huang, and Y. Gong. Locality-constrained linear coding for image classification. In Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on, pages 3360–3367. IEEE, 2010. [3] C.-C. Wu, T. Mei, W. H. Hsu, and Y. Rui. Learning to personalize trending image search suggestion. ACM SIGIR, 2014. [4] E. Wu and S. Madden. Scorpion: Explaining away outliers in aggregate queries. VLDB, 2013. | |
dc.identifier.uri | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/53648 | - |
dc.description.abstract | 隨著視覺化網頁技術以及資料分析語言的興起,各式各樣的視覺化圖表或是系統資源充斥,我們很容易取得多樣化的視覺分析工具。但是現今仍然沒有一個工具或是圖表能夠讓使用者容易的找出存在於串流使用資料中的趨勢事件以及這個事件的成因組合。
在這篇論文中,我們對這個議題提出了可以應用在百萬筆資料規模上的解決方法,並使用串流音樂服務的資料為例。我們想在串流音樂的使用記錄中找出某個時間點的趨勢事件,例如:某歌手的點播率在這個時間點越來越紅,原因為某群使用者用某個平台點播。找出這樣的事件就是我們的目的。但礙於我們的資料為類別型的資料(而非數值型,例如說:歌手的名字),找出這樣的事件成因組合其實是非常困難的。我們無法直接使用已開發成熟的各種數值型的學習方法來解決我們想到的問題。所以我們提出一個學習方法和其結果瀏覽介面去揭露這個學習方法所學到的東西。而且這個方法不只可以應用在我們的音樂服務範例上,也可以應用在其他時間型的類別資料,像是社群網站中的主題標籤。 首先我們用``trending pool'這個操作去找出有用的項目以減少之後的記憶體和計算時間用量。再來我們使用sparse coding這個學習方法去找出重要的事件成因組合而非傳統的窮舉法,或是人工指定組合的方法。除了以上的貢獻之外,我們還做了視覺介面設計,用來方便觀察分析每個時段的事件成因組合,並用這個介面找出了一些有趣的使用者聆聽音樂的習慣模式。 | zh_TW |
dc.description.abstract | Although many visualization tools provide us plenty of ways to view the data, users can not use them to easily find the trending events and their explanation from the million-scale data. In this work, we address the issue by leveraging the real music streaming log data as an example to help users better understand a million-scale dataset. Trending event explanation turns out to be challenging when it comes to categorical log data. Therefore, we propose to use a learning-based method with an interface design to uncover the trending event compositions for time-series categorical log data, which can be extend to other datasets, e.g., the hashtags in social media. First, we perform ``trending pool' operation to save the memory and time cost. Second, we apply sparse coding to learn important trending candidate combination sets instead of traditional brute-force way or manual investigation for generating combinations. Besides the contributions above, we also observe some interesting user behaviors by exploring detected trending candidate combinations visually through our interface. | en |
dc.description.provenance | Made available in DSpace on 2021-06-16T02:26:57Z (GMT). No. of bitstreams: 1 ntu-104-R02944009-1.pdf: 1989643 bytes, checksum: cf51542263a88906e414a443a893218b (MD5) Previous issue date: 2015 | en |
dc.description.tableofcontents | Contents
誌謝. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii 摘要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv 0.0.1 Keywords . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv 1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 1.1 Trending Traffics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Streaming Data Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Problem Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 Related Work . . . . . . . . . . . . . . . . . . . . . 4 2.1 Trending Detection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.2 Event Explanation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.2.1 Limitations of Prior works . . . . . . . . . . . . . . . . . . . . . 4 3 Technical Details . . . . . . . . . . . . . . . . . . . . . 6 3.1 Trending Candidate Detection . . . . . . . . . . . . . . . . . . . . . . . 6 3.1.1 Trending Pool . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3.1.2 Trick: Entropy Weight . . . . . . . . . . . . . . . . . . . . . . . 8 3.2 Event Composition Discovering . . . . . . . . . . . . . . . . . . . . . . 9 3.2.1 Sparse Coding . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3.3 System Summarization: with Visualization . . . . . . . . . . . . . . . . 10 v 4 Experiment Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4.1 Datasets and Implementation . . . . . . . . . . . . . . . . . . . . . . . . 12 4.2 Trending Candidate Evaluation . . . . . . . . . . . . . . . . . . . . . . . 12 4.2.1 Pseudo Ground Truth . . . . . . . . . . . . . . . . . . . . . . . . 13 4.2.2 Pilot Experiment Flow . . . . . . . . . . . . . . . . . . . . . . . 13 4.2.3 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4.3 Trending Event Results . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 4.4 User Behavior Findings . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4.4.1 Windows Platform . . . . . . . . . . . . . . . . . . . . . . . . . 16 4.4.2 Users of 1970 to 1989 . . . . . . . . . . . . . . . . . . . . . . . 17 4.4.3 Mobile Platforms . . . . . . . . . . . . . . . . . . . . . . . . . . 17 5 Visualization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 5.1 Visualization Layout . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 5.2 Design Factors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6.1 Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6.2 Future Works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 | |
dc.language.iso | en | |
dc.title | 在串流使用記錄中進行趨勢偵測與分析事件成因組合 | zh_TW |
dc.title | Trending Event Detection and Explanation on Streaming Log Data | en |
dc.type | Thesis | |
dc.date.schoolyear | 103-2 | |
dc.description.degree | 碩士 | |
dc.contributor.oralexamcommittee | 孫民,李宏毅,陳文進 | |
dc.subject.keyword | 趨勢事件,事件偵測,時間序列,類別資料,串流資料,大型資料視覺化,視覺分析, | zh_TW |
dc.subject.keyword | Trending event,event detection,time-series,categorical data,streaming data,large-scale visualization,visual analytics, | en |
dc.relation.page | 22 | |
dc.rights.note | 有償授權 | |
dc.date.accepted | 2015-08-04 | |
dc.contributor.author-college | 電機資訊學院 | zh_TW |
dc.contributor.author-dept | 資訊網路與多媒體研究所 | zh_TW |
顯示於系所單位: | 資訊網路與多媒體研究所 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-104-1.pdf 目前未授權公開取用 | 1.94 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。