Blogブログ

BLOGブログ

6

Dataikuでやってみた!!kaggleの「Food Demand Forecasting(食材需要予測)」分析

Blog

本記事では、kaggleFood Demand Forecasting(食材需要予測)
分析ツールDataikuを利用して分析してみたいと思います。

今回使用するデータは、kaggle「Food Demand Forecasting」です。

  1. Kaggleとは
  2. Dataikuとは
  3. kaggle「食材需要予測」
  4. おわりに

Kaggleとは

Kaggleとは、データサイエンティスト達が、自分たちのデータ分析力を磨く場として機能しているプラットフォームとなります。kaggleとはカグルと読み、kaggleに参加し、スキルを磨く方々をカグラーと呼びます。

the home of Data Science & Machine Learning

と表記されるように、データサイエンスと機械学習の家と呼ばれ、
世界中の、機械学習・データサイエンスに携わる約40万人が集まるコミュニティです。

Kaggleの中では、企業や政府などの組織と、
データ分析のプロであるデータサイエンティストや機械学習エンジニアを繋げるプラットフォームとして機能しており
単純にエンジニアと起業をマッチングするのではなく、コンペが行われ盛り上がりをみせています。

Dataikuとは

Dataikuは、データサイエンスと機械学習のためのエンドツーエンドプラットフォームです。
データの準備からモデルの展開までをサポートし、効率的なチームコラボレーションが実現できます。

ビジネスユーザーやデータサイエンティストは、
異種のデータソースからのデータ統合やモデル構築を簡素化できます。
豊富なデータ可視化機能やセキュリティ対策も特長です。

kaggle「食材需要予測」

複数の都市で運営されている食事配達会社のデータです。
顧客から注文された食事を出荷するために、各都市に配達センターがあります。
クライアントは、センターが将来の数週間の需要予測を行い、原材料の在庫を適切に計画するように求めています。

ほとんどの原材料の補充は週単位で行われ、生鮮性のある原材料であるため、調達計画は非常に重要になります。
また、センターのスタッフ配置も正確な需要予測が本当に役立つ分野の一つです。

データの読み込み

まずは、データをDataikuで読み込みます。

fulfilment_center_infoセンター情報
meal_info食事情報
train需要履歴データ
test予測対象

データの加工

読み込んだデータを機械学習を実行するために一つのデータを作成します。
StackレシピとJoinレシピ、Prepareレシピを使って、下図のようにフローを作成しました。

週別の平均注文数の推移

料理別センタータイプ別の平均注文数

予測モデルの構築

学習用のデータとテスト用のデータに分けて学習用のデータで予測モデルを構築します。
下図のダンベルのアイコン部分が学習で、ひし形のアイコンが出来上がったモデルです。

デフォルトだとランダムフォレストとRidge回帰の2つですが、
他にもたくさんアルゴリズムが提供されてるので、とりあえずいっぱい実行してみます。

結果、下図のようになりました。
このデータでは、LightGBMが一番精度が高いようです。

最後に、テストデータで予測をします。
Scoreレシピで実行すると↓のようにprediction予測結果のカラムが追加されます。

週別の平均注文数(予測)の推移

任意のセンターIDの週別食事別注文数の予測結果

おわりに

kaggle食事予測データを使って、データの読み込みからモデルの構築、予測まで実行してみました。
いかがでしたでしょうか。Dataikuを使うと、簡単に出来ますね!

最後に、今回作成したフローを載せておきます。

RELATED

関連記事

コメント

この記事へのコメントはありません。

PAGE TOP