私募投資顧問部 副部長 上席主任研究員
米倉 勝弘
機械学習を用いたキャップレート予測モデルの活用可能性
要約・概要
- キャップレート(Cap Rate)は、不動産投資における主要な指標の一つであり、資産価格の評価にとどまらず、取引市況の動向把握や類似性の高い物件間におけるリスクとリターンのバランス判断にも資する指標である。
- 本稿では、「重回帰分析」、「ランダムフォレスト」、「XGBoost」の3手法を用いて予測モデルを構築し、それぞれの予測精度を比較検討することで、不動産取引市場におけるキャップレート予測に適した分析手法を模索した。
- 各モデルの予測精度については、テストデータにおけるRMSE(Root Mean Squared Error)を用いて評価した。その結果、最も予測誤差が小さかったモデルは「XGBoost」となったものの、3手法間に顕著な差は確認されず、各モデルとも概ね同程度の予測精度を示した。
- ただし、今後、サンプル数の増加や属性情報(特徴量)の拡充が進めば、これら機械学習モデルの予測精度はさらに向上する可能性がある。
- 「ランダムフォレスト」および「XGBoost」は、欠損値の存在を前提とした内部処理機構を備えており、欠損値を含むデータに対しても比較的安定した予測性能を維持できる。一方で、属性情報の拡充については、Webスクレイピング等の技術を用いた自動収集に加え、人手による補足的なデータ収集も依然として必要とされる。不動産業界においては、情報の非公開性やデータの分散性が高く、これらが機械学習の導入を困難にしている要因の一つである。こうした課題を克服し、より網羅的かつ高品質なデータセットの整備が進めば、機械学習モデルの有効性は一層高まることが期待される。
- もっとも、実務の現場では、モデルの可読性や解釈性が依然として重視される傾向にある。「ランダムフォレスト」および「XGBoost」も特徴量における影響の強さ(重要度)は把握可能であるが、たとえば、「駅からの距離が遠いほどCap Rateが上昇する」といった変数間の統計的関係を直感的に捉えることが可能な点において、「重回帰分析」は依然として高い支持を得ている。このような背景を踏まえると、機械学習モデルの導入に際しては、まず「重回帰分析」を主軸に据えたうえで、その予測精度および変数の寄与度を検証・補完する目的で機械学習モデルを併用する、いわゆるシャドーモードでの運用が、実務への円滑な導入を図るうえで有効なアプローチであると考えられる。
関連レポート・コラム
- キャップレート推計モデルの予測精度向上へ向けて~ ディープニューラルネットワークを用いたモデル構築の試行 ~ (2021年3月8日)
- キャップレート推計の精度向上に関する一考察 (2020年8月19日)