【練習問題】銀行の顧客ターゲティング
https://signate.jp/competitions/1
精度上げに挑戦していきます。
まずはタイタニックで効果のあったRandomForest
暫定スコア:0.93196 約230位
前回0.5位から一気にこんなに上がるとは考えづらいので、前回のデータは何かミスをしてしまったのかもしれませんね。。。
コンペで最も人気のあったDecisionTreeでも挑戦。
暫定スコア:0.90128 約450位
ちょっと下がってしまいました
※今気づきましたが、これ提出後のメール受信を待たなくても、「投稿済みファイル」のページから自分のスコアを見ることができますね。
最終的にblenderモデルでスコア0.93くらい、順位2ケタ位くらいまであがりました
2018年9月3日追記
日付項目を少しを見直して再々トライ。
その結果、スコア0.93908→0.94121。暫定1,311人中、64位から35位へ。
上位3%に入ることはできましたが、まだまだ先は長い・・・
2018年9月7日追記
13:compaign(現キャンペーンにおける接触回数)
と
15:previous(接触実績:現キャンペーン以前までに顧客に接触した回数)
を足しこんで、「総接触実績」変数を追加してみました。
その結果、0.94121→0.94167と精度が改善し、36位→30位にランクアップしました!
独自のSIGNATEランクも0.1%改善し上位7.5%となりました。
ただ、まだまだ上位には猛者共が沢山いますね。頑張ります。
※SIGNATEのフォーラム機能、練習問題でも実装してくれないかなぁ。。
なお、私が参考にしているのは以下の本「機械学習のための前処理入門」です。
とりあえずこの一冊があれば、私のようなpythonド素人であってもとコンペで戦うことだけはできます。
更にランクを上げていくには修行が必要ですが、入門編としておすすめ。
書籍での独学が苦手という方は、千円ちょっとで学習できるUdemyのオンライン講座が安くて高品質です。
kaggleやSIGNATE挑戦記など、その他AI・機械学習関連の記事をまとめたものはこちら。
-
機械学習関連の記事まとめ
続きを見る