機械学習

kaggleコンペに挑戦!住宅の価格予測

2018年6月19日

House Prices: Advanced Regression Techniques
https://www.kaggle.com/c/house-prices-advanced-regression-techniques

「salepriceを予測しよう!feature engineering、random forrestやgradient boostingを練習しよう!」

79の説明変数を用いて住宅の価格を予測する問題です。
こちらもどこかのデータサイエンティストさんによって少し修正が加えられている教師データみたいです。

モデル作成過程はいつも通り端折るとして、一回目に何も考えないで(ただのtraindataオンリーで)モデル作った結果は以下

score 0.12632
順位 1308/5017

上位30%以内には入った感じですが。。。うーん。。
これ凄いのがscore 0.0001の違いで10名くらいがひしめき合ってますね。なので少しでも精度が上がったらすぐにランクが上がるような気が。

というわけでもう少しチューニングしていきたいと思います。

~~2回目~~

TensorFlowからRandomForestに変更で少し精度向上

score 0.12457
順位 1172/5017

[st_af id="2474"]

-機械学習