Deep Learningによる予測(2018年)

当社は、技術が提供できる最も正確な予測を提供するという当社の基本的なコミットメントの一環として、予測エンジンの第5世代をLokadでリリースしました。このエンジンは、1つのリリースで達成した中で最も大きな精度向上をもたらしています。

確率的予測からディープラーニングへ

power-clouds
このエンジンの設計は、比較的新しい機械学習の一種である「ディープラーニング」に基づいています。サプライチェーンにおいて、大幅な予測精度の向上は、より多くの顧客にサービスを提供し、より迅速にサービスを提供することを意味し、在庫リスクを軽減することができます。約18か月前、当社は当社の予測技術の第4世代を発表しました。第4世代は、真の確率的予測を提供する最初のものでした。確率的予測は、サプライチェーンにおいて重要です。なぜなら、コストは統計的な極値に集中するため、需要が予想外に高いまたは低い場合に発生します。対照的に、従来の予測手法(例:従来の日次、週次、月次の予測)は、中央値や平均値の予測に焦点を当てるだけであり、この問題には無関心です。その結果、これらの手法は通常、企業に満足のいくリターンを提供することができません。第5世代はその起源を否定せず、確率的予測も受け入れ、前世代の経験を基に構築されています。

偶然の一致により、ディープラーニングは、設計上、確率的予測に特化しています。ただし、この視点の動機は、サプライチェーンの問題とはまったく関係ありませんでした。ディープラーニングアルゴリズムは、確率的/ベイジアンの視点に基づいた最適化を重視しており、クロスエントロピーなどのメトリクスを使用しています。これらのメトリクスは、深層学習を可能にする「一つの」アルゴリズムである確率的勾配降下法に特に適しています。

サプライチェーンの具体的なケースでは、ディープラーニングの基礎が実際のビジネス要件と完全に一致していることがわかります!

人工知能のハイプを超えて

2017年、ディープラーニングによる人工知能が注目を集めました。主張は大胆で魅力的ですが、曖昧です。Lokadの視点から見ると、これらの企業向けAIテクノロジーの大半は期待に応えていません。Instacartのように数十億ドルの資金を確保し、世界クラスのディープラーニングチームを集めてサプライチェーンの課題に取り組むことができる企業はほとんどありません。

このリリースにより、LokadはAIグレードの予測技術を「デジタル化」された企業にアクセス可能にしています。もちろん、データは引き続きLokadにアクセス可能である必要がありますが、当社の技術はディープラーニングの専門知識を必要としません。ほとんどの「エンタープライズ」AIテクノロジーとは異なり、Lokadは手動の特徴量エンジニアリングに依存しません。当社のクライアントにとっては、従来の確率的予測からディープラーニングへのアップグレードはシームレスに行われます。Lokadは、1人の小規模なeコマースから数千の場所と100万の製品参照を含む最大のサプライチェーンネットワークにスケーリングする、キーターンのAIグレードの予測技術を提供する最初のソフトウェア企業です。

GPUコンピューティングの時代

power-clouds ディープラーニングは、GPU(グラフィックプロセッシングユニット)の利点を活用するために、コミュニティが自身のソフトウェアビルディングブロックをアップグレードするまで、ある程度ニッチな存在でした。これらのGPUは、現在でもほとんどのアプリケーションに使用されているCPU(中央処理ユニット)とは大きく異なります。ただし、コンピューターゲームはCPUとGPUの両方に大いに依存しています。第5世代の予測エンジンの完全な書き直しとともに、Lokadの低レベルインフラストラクチャも大幅にアップグレードしました。実際、企業にサービスを提供するために、LokadプラットフォームはGPUとCPUの両方を活用しています。Lokadは、LokadをサポートするクラウドコンピューティングプラットフォームであるMicrosoft AzureでレンタルできるGPUパワードマシンの利点を活用しています。GPUの大量の処理能力により、予測をより正確にするだけでなく、はるかに高速にすることができます。GPUグリッドを使用することで、通常、サイズの大きなデータセットに対して予測を約3倍から6倍高速化しています(*)。

(*) 超小規模のデータセットの場合、第5世代の予測エンジンは実際には遅くなり、数分かかることがありますが、実際の実務ではほとんど問題ありません。

製品の発売とプロモーション

第5世代の予測エンジンは、製品の発売やプロモーションなどの困難な予測状況に大幅な改善をもたらしています。製品の発売は非常に困難ですが、プロモーションの予測よりもわずかに簡単です。この困難度の違いは、歴史データの品質によって引き起こされます。プロモーションの場合、歴史データの品質は製品の発売と比較して必ずしも高くありません。適切な品質保証プロセスが整備されると、プロモーションデータは時間とともに改善されます。

特に、ファッションブランドにとってディープラーニングは、売上を「支配する」製品の発売に大きな機会として捉えています。新製品の発売は例外ではなく、むしろルールです。さらに、色やサイズのバリエーションがSKUの数を大幅に増やすため、状況はさらに複雑になります。

予測に関するよくある質問

どの予測モデルを使用していますか?

当社のディープ予測エンジンは、ディープラーニングの原則に基づいて構築された単一のモデルを使用しています。従来の統計モデルとは異なり、このモデルは数千万のトレーニング可能なパラメータを備えており、前の最も複雑な非ディープ機械学習モデルよりも約1000倍のパラメータを持っています。ディープラーニングは、古い機械学習手法(ランダムフォレスト、勾配ブースティングツリー)を大幅に上回ります。ただし、これらの古い機械学習手法は、すべての時系列クラシックモデル(Box-Jenkins、ARIMA、Holt-Winters、指数平滑法など)をすでに上回っていました。

予測のミスから学んでいますか?

はい。統計的なトレーニングプロセス(最終的にディープラーニングモデルを生成する)は、Lokadが利用可能なすべての歴史データを活用しています。歴史データは、バックテストとして知られるプロセスを通じて活用されます。したがって、モデルに利用可能な歴史データが多ければ多いほど、モデルは自身のミスから学ぶ機会が増えます。

予測エンジンは季節性、トレンド、曜日を扱えますか?

はい、予測エンジンは一般的な周期性および準周期性をすべて扱うことができます。また、コードに関しては、ディープラーニングモデルは、他の製品で観察される周期性を活用するために、複数の時系列アプローチを積極的に使用して、特定の製品の予測精度を向上させるために使用されます。自然に、2つの製品は同じ季節性を共有するかもしれませんが、同じ曜日パターンを共有するわけではありません。モデルはこのパターンを捉えることができます。また、ディープラーニングの主な利点の1つは、季節性の変動性を適切に捉える能力です。実際、季節性は天候などの外部変数によって早くまたは遅く始まる場合があり、これらの変動は予測に反映されます。

どのようなデータが必要ですか?

以前の予測技術と同様に、需要を予測するためには、予測エンジンに少なくとも日次の需要履歴を提供する必要があります。さらに、分解された注文履歴を提供するとさらに良いです。履歴の長さに関しては、長ければ長いほど良いです。2年未満の履歴では季節性を検出することはできませんが、3年の履歴は良いと考えていますし、5年は優れています。リードタイムを予測するためには、エンジンは通常、発注日と納品日の両方を含む発注書が必要です。製品またはSKUの属性を指定することも予測をかなり精緻化するのに役立ちます。さらに、在庫レベルを提供することも、最初の意味のある在庫分析を行うために非常に役立ちます。

Excelシートを予測できますか?

一般的な目安として、データがすべて1つのExcelシートに収まる場合、私たちは通常、あまり助けにならないし、正直なところ、誰も助けになりません。スプレッドシートのデータは通常週ごとまたは月ごとに集計されるため、そのような集計によってほとんどの履歴情報が失われます。さらに、この場合、スプレッドシートには製品に適用されるカテゴリや階層に関する情報もほとんど含まれていません。私たちの予測エンジンは、お持ちのすべてのデータを活用し、小さなサンプルでのテストは満足のいく結果を得ることはできません。

在庫切れやプロモーションについてはどうですか?

在庫切れやプロモーションは、過去の販売におけるバイアスを表します。需要を予測することが目標であり、販売を予測することではないため、このバイアスを考慮する必要があります。これらのイベントに対処するための一般的なが、しかし誤った方法は、ギャップを埋め、ピークを切り詰めるために履歴を書き換えることです。しかし、私たちはこのアプローチが好きではありません。なぜなら、予測エンジンに予測を与えることになり、過剰適合の問題を引き起こす可能性があるからです。代わりに、私たちのエンジンは、需要が検閲または膨張された場所を示す「フラグ」をネイティブにサポートしています。

新製品の予測はできますか?

はい、できます。ただし、新製品を予測するには、エンジンに他の「古い」製品の発売日と、発売時の需要の履歴が必要です。また、製品のカテゴリや階層の一部を指定することをお勧めします。エンジンは、新製品に比較可能と考えられる「古い」製品を自動的に検出して予測します。ただし、新しいアイテムに対してまだ需要が観察されていないため、予測はそれらに関連付けられた属性に完全に依存します。

予測を改善するために外部データを使用していますか?

通常、ウェブスクレイピングなどに特化した第三者企業から入手した競合価格データを使用することができます。ウェブトラフィックデータも使用でき、さらに統計的な精度を向上させるために歴史データを豊かにするために取得することもできます。実際、外部データソースを使用する際の最大のボトルネックは、比較的能力のあるLokad予測エンジンではなく、それらの外部データソースに接続された高品質のデータパイプラインを設定および維持することです。