SIGNATEコンペに挑戦!レンタル自転車の利用者数予測
https://signate.jp/competitions/114
これってkaggleの有名な問題「Bike Sharing Demand」ですよね。。。
https://www.kaggle.com/c/bike-sharing-demand
最近SIGNATEはkaggleの日本語訳的な問題が多い気がしますが、独自色を出さなくて大丈夫なんだろうか・・・という心配はよそにtrainデータを見ていきます。
レンタル自転車の利用者数予測:データ確認・前処理
ざっと見た感じは、欠損等は無く綺麗な感じです。なのでそのままトライ
レンタル自転車の利用者数予測:結果
1回目:RandomForest 暫定評価:125.64587
当ブログ投稿時点で5人中2位ですが、もう少しトライします
2回目:XGBoost 暫定評価:123.30773
3回目:DecisionTree 暫定評価:131.46102
4回目:RuleFit 暫定評価:124.23062
5回目:上記のアンサンブル 暫定評価:125.89596
とりあえずXGBoostの結果が一番良かったのでこれを投稿。
今この瞬間は暫定1位になりましたw
暫定にせよ1位って珍しいので、その時の画像をアイキャッチに設定笑
たぶん各特長量の移動平均やラグ変数を取ったりすると精度は上がるんでしょうね。。
と思いながらちょっとめんどくさくなってしまい、一旦このまま提出。
ということで今日は終了です。
なお、私が参考にしているのは以下の本「機械学習のための前処理入門」です。
とりあえずこの一冊があれば、私のようなpythonド素人であってもとコンペで戦うことだけはできます。
更にランクを上げていくには修行が必要ですが、入門編としておすすめ。
書籍での独学が苦手という方は、千円ちょっとで学習できるUdemyのオンライン講座が安くて高品質です。
kaggleやSIGNATE挑戦記など、その他AI・機械学習関連の記事をまとめたものはこちら。
-
機械学習関連の記事まとめ
続きを見る