機械学習

kaggleコンペに挑戦!住宅の価格予測

2018年6月19日

House Prices: Advanced Regression Techniques
https://www.kaggle.com/c/house-prices-advanced-regression-techniques

「salepriceを予測しよう!feature engineering、random forrestやgradient boostingを練習しよう!」

79の説明変数を用いて住宅の価格を予測する問題です。
こちらもどこかのデータサイエンティストさんによって少し修正が加えられている教師データみたいです。

モデル作成過程はいつも通り端折るとして、一回目に何も考えないで(ただのtraindataオンリーで)モデル作った結果は以下

score 0.12632
順位 1308/5017

上位30%以内には入った感じですが。。。うーん。。
これ凄いのがscore 0.0001の違いで10名くらいがひしめき合ってますね。なので少しでも精度が上がったらすぐにランクが上がるような気が。

というわけでもう少しチューニングしていきたいと思います。

~~2回目~~

TensorFlowからRandomForestに変更で少し精度向上

score 0.12457
順位 1172/5017

なお、私が参考にしているのは以下の本「機械学習のための前処理入門」です。

とりあえずこの一冊があれば、私のようなpythonド素人であってもとコンペで戦うことだけはできます。

更にランクを上げていくには修行が必要ですが、入門編としておすすめ。

書籍での独学が苦手という方は、千円ちょっとで学習できるUdemyのオンライン講座が安くて高品質です。

kaggleやSIGNATE挑戦記など、その他AI・機械学習関連の記事をまとめたものはこちら。

機械学習関連の記事まとめ

続きを見る

-機械学習

© 2024 あざらし情報局