請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79963| 標題: | 機器學習於物種數估計之應用 Species richness estimation by machine learning |
| 作者: | MIN-SHAN LIN 林名珊 |
| 指導教授: | 邱春火(CHUN-HUO CIOU) |
| 關鍵字: | 生物多樣性,物種數,機器學習, biodiversity,species richness,machine learning, |
| 出版年 : | 2021 |
| 學位: | 碩士 |
| 摘要: | 準確地估計一個地區的物種數在生態統計的領域中一直是個挑戰,過去的文獻已經發展許多統計方法估計物種數,物種數估計方法可分為有母數估計與無母數估計。有母數估計方法一般假設物種相對豐富度來自特定機率分布,透過傳統的統計推論求得機率分布之參數,在真實的物種相對豐富度組成近似其假設的機率分布時,有母數方法的估計十分準確,不過當真實的物種相對豐富度組成與其假設的機率分布相差許多時,有母數方法則難以保證準確的估計。無母數估計方法則不需要假設物種相對豐富度組成的分布,應用於多樣的生態資料時也能穩健地估計,其中Chao1與Chao2估計式,以及應用摺刀法提出的一階摺刀與二階摺刀估計式,不過當群落的物種豐富度組成異質性增加,亦或是樣本數少時,無母數估計式低估的情形將不可被忽略。本文提出透過Chao1的物種數估計以及信賴區間估計,建構物種相對豐富度之母體的可能分布,並使用機器學習技法預測物種數,解決無母數估計式在小樣本時低估的狀況。本研究使用常見的四種機器學習技法:脊迴歸( ridge regression )、K最近鄰法( K nearest neighbors)、隨機森林( random forest )以及提升方法( boosting )預測物種數。透過模擬試驗選擇變數,並比較機器學習模型與Chao1和摺刀法的統計表現,模擬結果顯示在不同物種豐富度分布假設下,機器學習技法能夠改善無母數估計方法在小樣本時低估的狀況,同時也降低RMSE,而不同的機器學習模型其預測表現並沒有明顯地高低之別,因此依預測速率建議使用脊迴歸模型或隨機森林模型。最後分析臺灣耕地雜草之多樣性資料與巴伐利亞國家公園的甲蟲多樣性資料,比較機器學習模型與無母數估計式的統計表現。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79963 |
| DOI: | 10.6342/NTU202101715 |
| 全文授權: | 同意授權(全球公開) |
| 顯示於系所單位: | 農藝學系 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| U0001-2507202103135700.pdf | 4.92 MB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
