【私はGOLDランカーw】SIGNATEコンペにおける総合順位の算出
SIGNATEってkaggleみたいにGoldとかMasterとか複数コンペの結果を元にした称号付けが無いんですよね。まぁそのうちできるんじゃないかとは思いますが。
というわけで公式の称号ができるまでは自分勝手なロジックで自身のポジションを勝手に考えて、励みにしていきたいと思ったわけです。
というわけでこれから練習問題でイキりますw
称号の考え方
まずはシンプルにこれでいきます。
コンペティション総参加履歴について、
(自身の順位の総和)/(その時点の参加人数の総和)
要は均して上位何%に入っているか?という指標で考えようと思います。
特に練習問題については、どのコンペも概ね参加者99人以下で全く盛り上がっていません。
ですのでkaggleに倣って以下のランクわけで良いのではないかと勝手に考えました。
ランク | ポジション |
---|---|
Bronze | 上位40% |
Silber | 上位20% |
Gold | 上位10% |
とういか異論あってもこれでいきます。個人の自己満足の世界なので。。。
現時点の私のランク※2018/09/08修正
というわけで、当記事執筆中の自身のランクを表にまとめてみました。参加人数は今この瞬間のスナップショットです。
コンペティション | 順位 | 参加人数 |
---|---|---|
ボットの判別 | 13 | 41 |
自動車の評価 | 3 | 14 |
自動車の走行距離予測 | 10 | 19 |
アヤメの分類 | 5 | 15 |
レンタル自転車の利用者数予測 | 6 | 67 |
ワインの品種の予測 | 3 | 24 |
国勢調査からの収入予測 | 1 | 14 |
アワビの年齢予測 | 5 | 65 |
毒キノコの分類 | 3 | 40 |
タイタニックの生存予測 | 6 | 53 |
Jリーグの観客動員数予測 | 504 | |
お弁当の需要予測 | 30 | 1,305 |
行の顧客ターゲティング | 36 | 1,319 |
合計: | 3,480 |
結論!
この計算でいくと、いまのところ上位8% 6%以内に入っているのでとりあえずSIGNATE GOLDホルダーと名乗れるのではないかと。
今後公式な指標が出るまで、かつイキった方々が乗り込んでくるまでは勝手かつ積極的に名乗らせて頂きたいと思いますw
相変わらず鬼門のJリーグは全く進歩ないですね。。何やっても全然精度が高まらない気がします。
とりあえず誰かの手ほどきを受けてからもう一度チャレンジしようかな。
※2018/09/08 Jリーグもちょっとだけ改善w
なお、私が参考にしているのは以下の本「機械学習のための前処理入門」です。
とりあえずこの一冊があれば、私のようなpythonド素人であってもとコンペで戦うことだけはできます。
更にランクを上げていくには修行が必要ですが、入門編としておすすめ。
書籍での独学が苦手という方は、千円ちょっとで学習できるUdemyのオンライン講座が安くて高品質です。
kaggleやSIGNATE挑戦記など、その他AI・機械学習関連の記事をまとめたものはこちら。
-
機械学習関連の記事まとめ
続きを見る