Rossmann Store Sales
https://www.kaggle.com/c/rossmann-store-sales
ヨーロッパのドラッグストア「Rossmann」の、ドイツ国内1,115店舗の6週間の売上を当てる問題です。
【事前準備】
trainデータのうち「customer」(来店客数)についてはtestデータに無かったので、モデル作成時には省いてしまいました。
またstoreデータがあるので、IDをキーにtrainとtestと結合しておきます。
※こういった、ちょっとしたテーブルの結合はexcelのvlookup関数を使っています。
(単純にAccessとかを持っていないだけなのですが。)
なのですがさすがexcel。大量データの編集はすぐに固まりますね。。
【試したアルゴリズムと結果】
既に2015年にコンペは終了してしまっているため、自己満足の世界になります。
VowpalWabbit:0.40724
TensorFlow:0.39693
RandomForest:0.18977
DecisionTree:0.15434
XGBoost:0.14479
同じ教師データを使っているのに結構バラつきありますね。。
[st_af id="2474"]