機械学習

【3位】SIGNATEコンペに挑戦!練習問題:ボットの判別

2018年7月25日

SIGNATEコンペ:ボットの判別

[blogcard url="https://signate.jp/competitions/124"]

アワビの年齢予測と同タイミングで追加されたのが、このボットの判別 問題です。

ボットの判別:trainデータ

いわゆるtwitter?のアカウントに対して、ツイート数やフォロワー数などの属性情報を元に、発信元が人間かボットかを当てる問題です。

フィーチャーエンジニアリングの介入余地は少ない気がします。

また、trainにあってtestに無い列(account_age_hours)は削除してしまいました。

一旦は特徴量追加などはなしでそのままトライ。

ボットの判別:アルゴリズム

色々試した中で、XGBoostが最も精度が良さそうだったのでこれにしました。

最近アンサンブルモデルにハマっているのですが今回は面倒なのでこのまま。

ボットの判別:結果

スコア0.70870、10人中3位の結果でした。これが良いのか悪いのか・・・

ちなみに記事更新時点(8/25)、ユーザ数37名、順位は10位に落ちてしまっていました・・・むぅ。

しかしtwitterを見てもSIGNATEは全く盛り上がってなくて悲しいですね。。

[st_af id="2474"]

-機械学習