Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/60746
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor徐宏民(Winston H. Hsu)
dc.contributor.authorYi-De Linen
dc.contributor.author林沂德zh_TW
dc.date.accessioned2021-06-16T10:28:27Z-
dc.date.available2015-08-26
dc.date.copyright2013-08-26
dc.date.issued2013
dc.date.submitted2013-08-15
dc.identifier.citation[1] Yucheng Low, Joseph Gonzalez, Aapo Kyrola, Danny Bickson, Carlos Guestrin, and
Joseph M. Hellerstein. Distributed graphlab: A framework for machine learning in
the cloud. PVLDB, 5(8):716--727, 2012.
[2] Timo Ojala, Matti Pietikainen, and Topi Maenpaa. Multiresolution gray-scale and
rotation invariant texture classification with local binary patterns. IEEE Trans. Pattern
Anal. Mach. Intell., 24(7):971--987, 2002.
[3] Lun Zhang, Rufeng Chu, Shiming Xiang, ShengCai Liao, and Stan Z. Li. Face detection
based on multi-block lbp representation. In ICB, pages 11--18, 2007.
[4] Michael J. Jones and James M. Rehg. Statistical color models with application to skin
detection. In CVPR, pages 1274--1280, 1999.
[5] Paul A. Viola and Michael J. Jones. Rapid object detection using a boosted cascade
of simple features. In CVPR (1), pages 511--518, 2001.
[6] Christoph H. Lampert, Matthew B. Blaschko, and Thomas Hofmann. Efficient subwindow
search: A branch and bound framework for object localization. IEEE Trans.
Pattern Anal. Mach. Intell., 31(12):2129--2142, 2009.
[7] Rein-Lien Hsu et al. Face detection in color images. IEEE Trans. Pattern Anal. Mach.
Intell., 24(5):696--706, 2002.
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/60746-
dc.description.abstract隨著網路發展、行動裝置的普及和相關社交應用的興盛,全世界
每天有超過數百億的照片上傳至各雲端空間。如此龐大的資料量(Big
Data) 意謂著與其相關的任何應用如人臉偵測(Face Detection) 等,都
將負荷十分巨大的運算量。而不同演算法處理單張照片時效能上可
以忽略的些微差異,累積至大尺度(Large-Scale) 資料量時卻可能使得
整體執行時間與耗電成本達到數個量級以上的差距。因此,基於增
進於大尺度資料上實行人臉偵測的整體效率,本論文提出了一利用
大尺度影像,學得關於人臉大小(Face Size) 及位置(Face Location) 的
知識來排序照片中人臉搜尋區域的策略。就人臉偵測而言,在照片
上給定一大小及位置所得之目標區域,即為一可能為人臉的子視窗
(Sub-Window)。過去的研究主要著重於設計特徵(Feature) 及偵測流程
(Detection Process),對於輸入圖片的偵測方法即在其上窮舉各種可能
之子視窗進行偵測,使得一張照片往往需檢視數百萬以上的子視窗。
而本研究發現,人臉在相片中的分布具有一定模式,意即各個子視窗
含有人臉的機率並非相等。因此,本研究運用關於人臉如何分布的全
域知識(Global Knowledge) 及當前輸入照片關於人臉的區域知識(Local
Knowledge) 來模型化各個子視窗出現人臉的可能性並加以排序。使用
者可以針對排序後的子視窗搜尋序列,根據自身對效能的需求,有效
地過濾在序列中排序較後、出現人臉機率較低的子視窗來大幅減少子
視窗偵測運算量。最終實驗顯示,相較過去傳統暴力搜尋的方式─滑
動視窗(Brute-force Sliding Window),本論文所提出之方法可以在保有
人臉偵測召回率(recall) 百分之九十五的情況下,省下了百分之四十的
子視窗搜尋數,及其對應的偵測運算量。此方法針對輸入端的子視窗
序列作處理,可實施於各人臉偵測系統提升其效能。
關鍵字: 人臉偵測, 子視窗搜尋, 大資料, 大尺度相片, 人臉位置, 人
臉大小, 滑動視窗
zh_TW
dc.description.abstractWith the developments of smart devices and network capabilities, the
growths of the photos uploaded in social websites make either the data or the
computations of face-related applications become enormously huge. Huge
computations imply huge energy consumption that every service provider of
face detection wants to effectively reduce for it's economical benefits. Despite
the various features and detection processes proposed in previous researches,
the selection of search hypotheses (i.e. sub-windows, areas in a photo being
face candidates) for the inputs of detectors is basically the form of sliding
window, which scans images in a brute-force manner. By observing the patterns
of face locations and face sizes in large-scale photos, we incorporate
global and local information to formulate the patterns observed, and propose
a ranking model for search hypotheses in photos. By constraining the search
areas to be the hypotheses with ranking scores above a given threshold, which
implies to only search on those with high possibilities of faces, the number
of sub-windows examined can be effectively reduced. The experiment shows
that 40% of sub-windows can be reduced while maintaining 95% face recall,
compared to traditional sliding window.
Keywords: face detection, sub-window search, big data, large-scale photos,
face location, face size, sliding window
en
dc.description.provenanceMade available in DSpace on 2021-06-16T10:28:27Z (GMT). No. of bitstreams: 1
ntu-102-R00922151-1.pdf: 14783100 bytes, checksum: 120e5938915f9ee3820eadd7ad3e080e (MD5)
Previous issue date: 2013
en
dc.description.tableofcontents口試委員會審定書i
致謝ii
中文摘要iii
Abstract iv
Contents v
List of Figures vii
List of Tables x
1 Introduction 1
2 Related Works 3
3 Problem Definition 5
3.1 Term Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.1.1 Search Space . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.1.2 Search Hypothesis . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.1.3 Search Sequence . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2 Problem Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4 System Overview 9
v
5 Observations 10
5.1 Observation Setting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5.2 Location Patterns of Faces . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.3 Size Correlation of Faces . . . . . . . . . . . . . . . . . . . . . . . . . . 12
6 Models and Ranking Algorithms 15
6.1 Global Knowledge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
6.1.1 Prior Probability Ranking . . . . . . . . . . . . . . . . . . . . . 15
6.1.2 Bayesian Ranking . . . . . . . . . . . . . . . . . . . . . . . . . 16
6.2 Local Knowledge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.2.1 Skin Color Information . . . . . . . . . . . . . . . . . . . . . . . 17
6.3 Ranking Score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
6.4 Ranking Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
7 Experiments 20
7.1 Evaluation Setting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
7.1.1 Data Set . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
7.1.2 Parameters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
7.1.3 Thresholds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
7.2 Evaluation Metrics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
7.2.1 Computation Reduction . . . . . . . . . . . . . . . . . . . . . . 21
7.2.2 Ranking Performance . . . . . . . . . . . . . . . . . . . . . . . . 22
7.3 Experimental Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8 Discussion 24
9 Future Works 26
10 Conclusion 27
Bibliography 28
dc.language.isoen
dc.subject子視窗搜尋zh_TW
dc.subject大資料zh_TW
dc.subject大尺度相片zh_TW
dc.subject滑動視窗zh_TW
dc.subject人臉偵測zh_TW
dc.subject人臉大小zh_TW
dc.subject人臉位置zh_TW
dc.subjectsliding windowen
dc.subjectsub-window searchen
dc.subjectbig dataen
dc.subjectlarge-scale photosen
dc.subjectface locationen
dc.subjectface sizeen
dc.subjectface detectionen
dc.title基於人臉分布規律的搜尋策略優化zh_TW
dc.titleEfficient Face Detection by Leveraging Knowledge from
Large-Scale Photos
en
dc.typeThesis
dc.date.schoolyear101-2
dc.description.degree碩士
dc.contributor.oralexamcommittee陳祝嵩(Chu-Song Chen),林彥宇(Yen-Yu Lin)
dc.subject.keyword人臉偵測,子視窗搜尋,大資料,大尺度相片,人臉位置,人臉大小,滑動視窗,zh_TW
dc.subject.keywordface detection,sub-window search,big data,large-scale photos,face location,face size,sliding window,en
dc.relation.page28
dc.rights.note有償授權
dc.date.accepted2013-08-15
dc.contributor.author-college電機資訊學院zh_TW
dc.contributor.author-dept資訊工程學研究所zh_TW
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-102-1.pdf
  未授權公開取用
14.44 MBAdobe PDF
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved