SIGNATEコンペ:ボットの判別
[blogcard url="https://signate.jp/competitions/124"]
アワビの年齢予測と同タイミングで追加されたのが、このボットの判別 問題です。
ボットの判別:trainデータ
いわゆるtwitter?のアカウントに対して、ツイート数やフォロワー数などの属性情報を元に、発信元が人間かボットかを当てる問題です。
フィーチャーエンジニアリングの介入余地は少ない気がします。
また、trainにあってtestに無い列(account_age_hours)は削除してしまいました。
一旦は特徴量追加などはなしでそのままトライ。
ボットの判別:アルゴリズム
色々試した中で、XGBoostが最も精度が良さそうだったのでこれにしました。
最近アンサンブルモデルにハマっているのですが今回は面倒なのでこのまま。
ボットの判別:結果
スコア0.70870、10人中3位の結果でした。これが良いのか悪いのか・・・
ちなみに記事更新時点(8/25)、ユーザ数37名、順位は10位に落ちてしまっていました・・・むぅ。
しかしtwitterを見てもSIGNATEは全く盛り上がってなくて悲しいですね。。
[st_af id="2474"]