Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 工程科學及海洋工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/93439
完整後設資料紀錄
DC 欄位值語言
dc.contributor.advisor張瑞益zh_TW
dc.contributor.advisorRay-I Changen
dc.contributor.author林宗昇zh_TW
dc.contributor.authorTsung-Sheng Linen
dc.date.accessioned2024-08-01T16:07:18Z-
dc.date.available2024-08-02-
dc.date.copyright2024-08-01-
dc.date.issued2024-
dc.date.submitted2024-07-30-
dc.identifier.citation謝宗憲(2021)。應用類神經網路與關聯規則探討室內格局與銷售率之關係,國立臺灣科技大學建築系碩士論文,臺灣,臺北。
張雅文(2023)。個人所得、物價指數、股價指數對房價之影響-以雙北市為例,東吳大學經濟學系碩士論文,臺灣,臺北。
蔡宜真(2012)。少子化須是對當代家庭都市居住偏好影響之研究-以台北 地區為例,國立成功大學都市計畫學系碩士論文,臺灣,臺南。
林左裕、陳慧潔、蔡永利(2010)。影響住宅大樓價格因素之探討,評價學報, 3期,P13-23。
陳哲倫(2023)。房貸成數和總體因素對台灣房價之影響,國立臺北大學經濟學系碩士論文,臺灣,新北。
江之凡(2023)。台積電於台南科學園區設廠對周遭房價的影響 - 以差異中之差異法估計,國立政治大學經濟學系碩士論文,臺灣,臺北。
謝明穎(2023)。囤房稅政策與房價效應:以臺灣大臺北都會區的實證為例,國立政治大學應用經濟與社會發展英語碩士學位學程碩士論文,臺灣,臺北。
黃凱麟(2023)。交通運具、生活圈型態、共同影響範圍與路網對房價影響之探討-以高雄市為例,國立屏東大學不動產經營學系碩士在職專班碩士論文,臺灣,屏東。
呂蕙宇(2023)。新冠肺炎疫情對房價之影響,國立政治大學行政管理碩士碩士學程碩士論文,臺灣,臺北。
林靖親(2022)。臺灣各縣市人口結構對其房價的影響-以空間計量模型分析,國立政治大學行政管理碩士碩士學程碩士論文,臺灣,臺北。
F.-Y. Wang (2010). The emergence of intelligent enterprises: From CPS to CPSS, IEEE Intell. Syst., vol. 25, no. 4, pp. 8588.
Y. Zhu, Y. Tan, R. Li, and X. Luo (2016). Cyber-physical-social-thinking modeling and computing for geological information service system, Int. J. Distrib. Sensor Netw., vol.12,no.11,Art.no.155014771666666
L. Yan, M. Katherine, and F. Simon (2016). Current Standards Land scape for Smart Manufacturing Systems.
G. Xiong, F. Zhu, X. Liu, X. Dong, W. Huang, S. Chen, and K. Zhao (2015). Cyber-physical-social system in intelligent transportation, IEEE/CAA J. Autom. Sinica, vol. 2, no. 3, pp. 320333, Jul. 2015.
I. F. Ashari (2020). Implementation of cyber-physical-social system based on service oriented architecture in smart tourism, J. Appl. Informat. Comput., vol. 4, no. 1, pp. 6673.
J. Perno and C. W. Probst(2017). Behavioural pro ling in cyber-social systems, in Human Aspects of Information Security, Privacy and Trust, T. Tryfonas, Ed. Cham, Switzerland, pp. 507517.
Smirnov, A., Levashova, T., Shilov, N., & Sandkuhl, K. (2014). Ontology for cyber-physical-social systems self-organisation. Proceedings of 16th Conference of Open Innovations Association FRUCT
Kamola, M., & Arabas, P. (2020). Improving Time-Series Demand Modeling in Hospitality Business by Analytics of Public Event Datasets. IEEE Access, 8, 53666-53677.
Korb, K. B., & Nicolson, A. E. (2011). Bayesian Artificial Intelligence. USA: Taylor & Francis.
潘俊帆(2001)。以貝氏網路為基礎的個人差異化知識處理機制,東海大學工業工程研究所碩士論文,臺灣,臺中。
Spirtes, P., C. Glymour, and R. Scheines (1993). Causation, Prediction and Search. Springer-Verlag, New York, Inc.
Heckerman, D., Geiger, D., & Chickering, D. M. (1995). "Learning Bayesian Networks: The Combination of Knowledge and Statistical Data". Machine Learning, 20(3), 197-243.
G. F. COOPER and E. HERSKOVITS. (1992). "A Bayesian method for the induction of probabilistic networks from data". Machine learning, 1992. 9(4): p. 309-347.
Heckerman, D. (1995). A Tutorial on Learning With Bayesian Networks,Technical Report MSR-TR-95-06, Microsoft Research, Microsoft Corporation.
Peter, B. (2005). Comparison of Bayesian and maximum-likelihood inference of population genetic parameters. Bioinformatics, Volume 22, Issue 3, Pages 341–345.
Lucas, P. J. F., & van der Gaag, L. C., & Abu-Hanna, A. (2004). "Bayesian networks in biomedicine and healthcare." Artificial Intelligence in Medicine, 30(3), 201-214.
Montgomery, A. L., & Bradlow, E. T. (1999). "Bayesian methods for media selection." Journal of Marketing Research, 36(3), 334-348.
Li, X., Ding, Q., & Sun, J. Q. (2018). "Remaining useful life estimation in prognostics using deep convolution neural networks." Reliability Engineering & System Safety, 172, 1-11.
Nagarajan, R., Scutari, M., & Lèbre, S. (2013). Bayesian Networks in R: with Applications in Systems Biology. Springer, New York, NY.
Koller, D., & Friedman, N. (2009). Probabilistic Graphical Models: Principles and Techniques. Cambridge, MA: MIT Press.
Pearl, J. (2000). Causality: Models, Reasoning and Inference. Cambridge University Press.
Chen, T., & Guestrin, C. (2016). Xgboost: A scalable tree boosting system. Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining.
邱國祥(2020)。以多元線性迴歸與機器學習模型預估不動產價格-以台中市實價登錄為例,國立中興大學應用數學系碩士論文,臺灣,臺中。
張莎煒(2020)。利用XGBoost建立台灣中小型企業信用風險評估模型,國立中興大學財務金融學系碩士論文,臺灣,臺中。
柯東寧(2020)。應用極限梯度提升演算法建構晶圓良率預測模型,國立交通大學工業工程與管理系碩士論文,臺灣,新竹。
樊俊文(2023)。梯度提升決策樹回歸模型在房價預測中的性能比較與優化,長庚大學商管專業學院碩士學位學程在職專班資訊管理組碩士論文,臺灣,桃園。
Duy Tan Tran, Tinnapat Onjaipurn (2024). An eXtreme Gradient Boosting prediction of uplift capacity factors for 3D rectangular anchors in natural clays
Zhou, W.-X., & Sornette, D. (2008). Analysis of the real estate market in Las Vegas:Bubble, seasonal patterns, and prediction of the CSW indices. Physica A: Statistical Mechanics and its Applications, 387(1), 243-260.
賴姵宇(2019)。台北市與新北市房價預測模型-以行政區劃分,國立臺北商業大學財務金融研究所碩士論文,臺灣,臺北。
王能立(2022)。利用機器學習預測新北市房價之研究,輔仁大學資訊管理學系碩士在職專班碩士論文,臺灣,新北。
洪詠昱(2023)。基於時間序列與機器學習的台灣住宅價格漲跌研究,國立成功大學財務金融研究所碩士論文,臺灣,臺南。
謝明穎(2017)。運用機器學習方法建構房價預測視覺化平台,輔仁大學統計資訊學系應用統計碩士班碩士論文,臺灣,新北。
王培得(2019)。房屋的結構因子與外在環境因子對房價之影響分析研究:以2013~2016台北市房屋交易資料為例,輔仁大學商學研究所博士班博士論文,臺灣,新北。
施佳君(2017)。實價登錄資訊去識別化對房價預測影響與深度學習房價預測模型之研究,輔仁大學統計資訊學系應用統計碩士班碩士論文,臺灣,新北。
Yang, Y., Webb, G.I., and Wu, X. (2009). Discretization Methods. In: Maimon, O., Rokach, L. (eds) Data Mining and Knowledge Discovery Handbook. Springer, Boston, MA.
Liu, H., Hussain, F., Tan, C.L., and Dash, M. (2002). “Dis cretization: An Enabling Technique.” Data Mining and Knowledge Discovery, 6, 393-423.
Elhilbawi, H., Eldawlatly, S., & Mahdi, H. (2023). Combining data discretization and missing value imputation for incomplete medical datasets. PLOS ONE, 18(1), e0295032.
Lewis, E. (2004). Control of body segment differentiation in Drosophila by the bithorax gene complex. Genes, Development and Cancer: The Life and Work of Edward B. Lewis, 239-253.
-
dc.identifier.urihttp://tdr.lib.ntu.edu.tw/jspui/handle/123456789/93439-
dc.description.abstract過去台灣房價預測在挑選資料集特徵時有幾個問題,首先是實價登錄資料集多以縣市的全行政區進行,這樣的範圍選取忽略不同行政區之間的差異,會造成預測結果的誤差。此外,對於社會因子特徵的選取目前多只考慮總體經濟變數,與一般大眾的感受較不直覺。而經驗法則的挑選方式往往會使挑選的特徵缺乏客觀性。
因此本研究在預測範圍上改以行政區為單位,除探討可否提高預測精準度,也想了解在不同行政區主要影響房價的因子是否相同。並著重在新興開發區域與離市中心較遠的近郊區域。而代表社會因子特徵的資料集除經常使用的總體經濟變數,本研究也納入了政府政策、企業建商投資、交通設施、人口結構以及COVID-19疫情,並使用CPSS (Cyber-Physical-Social System)本體論架構對上述社會因子進行分類。對於挑選放入機器學習模型的特徵,本研究使用貝式網路(Bayesian networks)及因果推論(Causality Inference),排列出社會因子特徵影響目標變數的順序。並依序將社會因子放入XGBoost (Extreme Gradient Boost)模型進行訓練得到預測結果及找出在本研究架構下適當的特徵數量為10個。
實驗顯示本研究預測結果與未使用社會因子相比可改善MAPE (Mean Absolute Percentage Error)值5%、RMSE (Root Mean Square Error)值11%、R2_SCORE (coefficient of determination, R^2)值4%。與使用經驗法則挑選社會因子相比可改善MAPE值1.34%、RMSE值3.44%、R2_SCORE值1.31%。此外以分區進行預測與全區相比,可使MAPE值改善2%。經實證本研究所提出挑選因子的方法相對經驗法則挑選更有依據及可解釋性,且可改善預測精準度。也為房價預測領域提供新的研究思路,有助於投資者、開發商和政策制定者更準確地理解和預測市場動態。
zh_TW
dc.description.abstractHouse Price Prediction in Taiwan has encountered several problems in feature selection. The data set of Actual Price Registration is often considered at the level of the entire administrative division of cities and counties, ignoring the differences between various administrative districts, leading to prediction errors. Additionally, the selection of social factor features currently often only considers macroeconomic variables, which are less intuitive to the general public. The use of empirical rules for feature selection often results in a lack of objectivity in the chosen features.
Therefore, this study changes the prediction scope to the administrative district level to explore whether prediction accuracy can be improved and to understand whether the main factors influencing house price differ across different administrative districts. The study focuses on emerging development areas and suburban areas farther from city centers. In addition to commonly used macroeconomic variables, this research includes government policies, corporate investments, transportation facilities, population structure, and the COVID-19 pandemic as datasets representing social factor features. These social factors are classified using the CPSS (Cyber-Physical-Social System) ontology framework. For feature selection in the machine learning model, Bayesian networks and causality inference are used to rank the influence of social factor features on the target variable. The social factors are sequentially input into the XGBoost (Extreme Gradient Boost) model to obtain prediction results and determine that the appropriate number of features under this research framework is 10.
Experiments show that the prediction results of this study improve the MAPE (Mean Absolute Percentage Error) by 5%, RMSE (Root Mean Square Error) by 11%, and R2_SCORE (coefficient of determination, R^2) by 4% compared to not using social factors. Compared to selecting social factors based on empirical rules, MAPE improved by 1.34%, RMSE by 3.44%, and R2_SCORE by 1.31%. Additionally, predicting by administrative district compared to the entire district improves MAPE by 2%. Empirical evidence demonstrates that the proposed method of factor selection is more justified and interpretable than empirical rule-based selection and can improve prediction accuracy. This study provides new research insights into the field of house price prediction, aiding investors, developers, and policymakers in more accurately understanding and predicting market dynamics.
en
dc.description.provenanceSubmitted by admin ntu (admin@lib.ntu.edu.tw) on 2024-08-01T16:07:18Z
No. of bitstreams: 0
en
dc.description.provenanceMade available in DSpace on 2024-08-01T16:07:18Z (GMT). No. of bitstreams: 0en
dc.description.tableofcontents誌謝 i
中文摘要 ii
ABSTRACT iii
目次 v
圖次 vii
表次 viii
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機與目的 1
1.3 論文結構 2
第二章 文獻探討 3
2.1 社會因子 3
2.2 CPSS (Cyber-Physical-Social System) 4
2.3 貝氏網路模型 5
2.3.1 建立貝氏網路架構 5
2.3.2 貝氏網路的結構學習與參數學習 6
2.4 因果推論 8
2.4.1 干預與混淆變數 9
2.4.2 因果辨識與後門準則 10
2.5 XGBoost (Extreme Gradient Boost) 12
2.6 房價預測相關研究 15
2.7 文獻總結 17
第三章 研究方法 18
3.1 研究架構 18
3.2 資料來源及處理 19
3.2.1 資料來源 19
3.2.2 資料處理 21
3.3 貝氏網路與因果推論 28
3.3.1 結構學習 29
3.3.2 參數學習 29
3.3.3 結構因果模型 29
3.3.4 推理預測 30
3.4 XGBoost模型 31
3.4.1 XGBoost參數設定 32
3.4.2 模型評估方式 33
第四章 研究結果 35
4.1 結構學習與參數學習結果 35
4.2 結構因果模型與推理預測結果 37
4.3 XGBoost模型預測結果 42
第五章 結論與未來展望 51
參考文獻 53
-
dc.language.isozh_TW-
dc.title以機器學習因果推論挑選社會因子進行XGBoost房價預測zh_TW
dc.titleSelecting Social Factors for XGBoost House Price Prediction Using Machine Learning Causal Inferenceen
dc.typeThesis-
dc.date.schoolyear112-2-
dc.description.degree碩士-
dc.contributor.oralexamcommittee陳彥廷;呂菁菁;林書宇zh_TW
dc.contributor.oralexamcommitteeYen-Ting Chen;Ching-Ching Lu ;Shu-Yu Linen
dc.subject.keyword社會因子,XGBoost,貝氏網路,因果推論,房價預測,zh_TW
dc.subject.keywordSocial Factor,XGBoost,Bayesian Network,Causality Inference,House Price Prediction,en
dc.relation.page56-
dc.identifier.doi10.6342/NTU202402749-
dc.rights.note未授權-
dc.date.accepted2024-08-01-
dc.contributor.author-college工學院-
dc.contributor.author-dept工程科學及海洋工程學系-
顯示於系所單位:工程科學及海洋工程學系

文件中的檔案:
檔案 大小格式 
ntu-112-2.pdf
  目前未授權公開取用
2.46 MBAdobe PDF
顯示文件簡單紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved