Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 理學院
  3. 統計與數據科學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/93456
標題: 處理多重實例學習中標籤歧義的貝氏方法
A Bayesian Approach for Addressing Label Ambiguity in Multiple Instance Learning
作者: 陳思妤
Szu-Yu Chen
指導教授: 楊鈞澔
Chun-Hao Yang
關鍵字: 多重實例學習,標籤歧義,吉布斯取樣,玻利亞伽瑪擴充,
multiple instance learning,label ambiguity,Gibbs sampling,Pólya­-Gamma augmentation,
出版年 : 2024
學位: 碩士
摘要: 多實例學習 (MIL) 是弱監督學習問題,已被應用於許多領域。多實例(MI)數據包括了袋子和實例的概念,其中每個袋子中都包含了一些實例。另外,袋子的資訊是已知的,而實例的資訊是缺失的。Carbonneau et al. (2018) 提到由於多實例數據中存在缺失值,因此標籤歧義 (label ambiguity) 是在 MIL 中的常見問題。在本論文中,我們了解了某些可能造成標籤歧義的來源,並提出了一個新的袋子模型來解決此問題。我們提出的模型具有幾個優勢:除了放寬現有 MIL 方法中常用的嚴格假設,也能提供更多實例與袋子關聯性的資訊,並且可以與於許多不同的實例分類方法一起合併使用,例如羅吉斯回歸。
本文討論的 MIL 模型是使用貝氏的吉布斯採樣進行模型推論。我們在吉布斯採樣過程中使用變量擴展的方法,具體來說是引入了玻利亞伽瑪的潛變量。我們對提出的袋子模型與現有方法(例如Haußmann et al. (2017) 中提出的方法)進行了比較分析,證明了我們方法的有效性。最後,通過模擬以及實際資料的實驗,驗證了我們方法的性能。
Multiple Instance Learning (MIL) is a weakly supervised learning problem, and it has been used in various fields. Multiple Instance (MI) data includes the concepts of bag and instance, where each bag contains several instances. Also, the bag information is observed, while the instance information is missing. Carbonneau et al. (2018) mentions that label ambiguity is a common issue in MIL due to the missing values in the MI data. In this thesis, we investigate the sources of label ambiguity and propose a novel bag model to address this issue. Our proposed model offers several advantages: (i) It relaxes the strict MIL assumption commonly employed in existing MIL methods. (ii) It provides greater insight into the relationship between instances and their corresponding bags. (iii) It can be integrated with various classifiers at the instance level, such as logistic regression.
The MIL models discussed here are inferred by a Gibbs sampling scheme, which is a Bayesian approach. We employ a variable augmentation technique on the Gibbs sampling process, specifically the Pólya­Gamma augmentation. Comparative analysis between our proposed bag model and existing methods, such as the one presented in Haußmann et al. (2017), demonstrate the effectiveness of our approach. Finally, we validate the performance of our model through various simulations and real data.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/93456
DOI: 10.6342/NTU202401899
全文授權: 同意授權(全球公開)
顯示於系所單位:統計與數據科學研究所

文件中的檔案:
檔案 大小格式 
ntu-112-2.pdf1.09 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved