Deep Learningを通じた予測(2018年)

テクノロジーが提供できる最も正確な予測を提供するという当社のコアコミットメントの一環として、Lokadで5世代目の予測エンジンが稼働していることを誇らしく発表できることを嬉しく思います。このエンジンは、1つのリリースで達成した中で最大の精度向上をもたらしています。

確率的予測から深層学習へ

power-clouds
エンジンの設計は、_深層学習_と呼ばれる比較的新しい機械学習のフレーバーに依存しています。サプライチェーンにおいて、大幅な予測精度の向上は、より多くの顧客にサービスを提供し、より速くサービスを提供し、在庫リスクを減らすことができます。約18か月前、当社の予測技術の第4世代を発表していました。第4世代は、真の確率的予測を提供する最初のものでした。確率的予測は、サプライチェーンにおいて重要です。なぜなら、コストが統計的な極端値に集中するためです。需要が予想外に高いか低い場合に。対照的に、従来の予測方法 - 伝統的な日次、週次、月次の予測のように - 中央値や平均値の予測のみに焦点を当てる従来の方法は、この問題に無頓着です。その結果、これらの方法は通常、企業に満足のいくリターンを提供することができません。第5世代はその起源を否定しません。確率的予測も受け入れ、前の世代で得た経験を活かしています。

偶然の一致で、深層学習は設計上、確率的予測に非常に適しています。この視点の動機付けは、供給チェーンの懸念とは全く関係ありませんでした。深層学習アルゴリズムは、確率的/ベイズ的視点に基づいた最適化を重視しており、これらのメトリクスは、深層学習を可能にする「1つ」のアルゴリズムである確率的勾配降下法に特に適しているため、クロスエントロピーなどのメトリクスを使用しています。

特定のサプライチェーンの場合、深層学習の基盤が実際のビジネス要件と完全に一致していることがあります!

人工知能のハイプを超えて

2017年は、実践的な深層学習による人工知能がその年のキーワードでした。主張は大胆で魅力的であり、まあ、曖昧です。Lokadの視点から見ると、これらの企業向けAIテクノロジーの大半は期待に応えていません。Instacartのように、世界クラスの深層学習チームを集めてサプライチェーンの課題に成功裏に取り組むために50億ドル以上の資金を確保できる企業はほとんどありません。

このリリースにより、LokadはAIグレードの予測技術を、比較的「デジタル化」された企業にアクセス可能にしています。もちろん、すべてのことは引き続き歴史的なサプライチェーンデータによって支えられていますので、データはLokadにアクセス可能でなければなりませんが、当社の技術は深層学習の専門知識を必要としません。ほとんどすべての「エンタープライズ」AIテクノロジーとは異なり、Lokadは手動の特徴量エンジニアリングに依存していません。当社のクライアントにとって、以前の確率的予測から深層学習へのアップグレードはシームレスに行われます。Lokadは、1人の小さなeコマースから始まり、数千の場所と100万の製品参照を含む最大のサプライチェーンネットワークにスケーリングすることができる、即戦力のAIグレードの予測技術を提供する最初のソフトウェア企業です。

GPUコンピューティングの時代

power-clouds 深層学習は、コミュニティが自身のソフトウェア構築ブロックをアップグレードしてGPU(グラフィック処理ユニット)を活用するようになるまで、ある程度ニッチな存在でした。これらのGPUは、依然としてほとんどのアプリを駆動しているCPU(中央処理ユニット)とは大きく異なります。現在、コンピュータゲームを除いて、ほとんどのアプリはCPUに頼っていますが、コンピュータゲームはCPUとGPUの両方に大きく依存しています。この5回目のイテレーションのために、私たちの予測エンジンを完全に書き直すと同時に、Lokadの低レベルインフラも大幅にアップグレードしました。実際、企業にサービスを提供するために、Lokadプラットフォームは今やGPUとCPUの両方を活用しています。Lokadは、Microsoft AzureでレンタルできるGPUパワーを活用しています。GPUの大規模な処理能力により、私たちは予測をより正確にするだけでなく、はるかに高速にすることができます。GPUグリッドを介して、通常、かなり大きなデータセットに対して予測を約3倍から6倍速く取得しています(*)。

(*) 超小規模のデータセットの場合、私たちの第5世代の予測エンジンは実際に遅くなり、数分かかりますが、実際にはほとんど影響はありません。

製品の発売とプロモーション

私たちの第5世代の予測エンジンは、製品の発売やプロモーションなどの困難な予測状況に大幅な改善をもたらしています。私たちの視点から見ると、製品の発売は非常に困難ですが、プロモーションの予測よりも少し簡単です。難易度の違いは、歴史データの品質によって引き起こされ、プロモーションの場合、製品の発売と比較して常に品質が低いからです。適切な品質保証プロセスが整備されると、プロモーションデータは時間とともに改善されます。

特に、製品の発売に苦労しているファッションブランドにとって、深層学習は大きな機会です。新製品の発売が売上を「支配」する状況で、新製品を発売することが例外ではなく、ルールであるということを考えると、色やサイズのバリアントがSKUの数を大幅に増やすため、状況はさらに複雑になります。

当社の予測FAQ

使用している予測モデルは何ですか?

私たちの深層予測エンジンは、深層学習原則から構築された単一のモデルを使用しています。従来の統計モデルとは異なり、このモデルには数千万のトレーニング可能なパラメータが含まれており、これは以前の最も複雑な非深層機械学習モデルよりも約1000倍のパラメータです。深層学習は、古い機械学習アプローチ(ランダムフォレスト、勾配ブースティングツリー)を大幅に上回ります。ただし、これらの古い機械学習アプローチは、すでにすべての時系列のクラシック(Box-Jenkins、ARIMA、Holt-Winters、指数平滑化など)を上回っていました。

予測の間違いから学んでいますか?

はい。統計的トレーニングプロセス(最終的に深層学習モデルを生成する)は、Lokadで利用可能なすべての歴史データを活用しています。歴史データは、バックテストとして知られるプロセスを介して活用されます。したがって、モデルに利用可能な歴史データが多いほど、モデルが自らの間違いから学ぶ機会が増えます。

予測エンジンは季節性、トレンド、曜日を処理できますか?

はい、予測エンジンはすべての一般的な周期性、そしてしばしば過小評価される準周期性を処理します。コードに関しては、深層学習モデルは、他の製品で観察される周期性を活用するために、複数の時系列アプローチを積極的に使用して、任意の製品の予測精度を向上させます。自然に、2つの製品が同じ季節性を共有する場合がありますが、同じ曜日パターンを共有するわけではありません。モデルはこのパターンを捉えることができます。また、深層学習の主要な利点の1つは、季節性の変動性を適切に捉える能力です。実際、季節は、天候などの外部変数によって早くもしくは遅く始まる場合があり、これらの変動は予測に反映されます。

どのようなデータが必要ですか?

前世代の予測技術と同様に、需要を予測するためには、予測エンジンに少なくとも日次の過去の需要データを提供する必要があります。さらに、分解された注文履歴を提供するとさらに良いです。履歴の長さに関しては、長いほど良いです。2年未満の履歴では季節性を検出できませんが、3年の履歴は良好であり、5年は優れています。リードタイムを予測するためには、エンジンは通常、発注日と納品日の両方を含む発注書が必要です。製品またはSKUの属性を指定することも、予測をかなり精緻化するのに役立ちます。さらに、在庫レベルを提供することも、最初の意味のある在庫分析を行うのに非常に役立ちます。

Excelシートを予測できますか?

一般的な指針として、すべてのデータが1つのExcelシートに収まる場合、通常はあまり役立ちませんし、正直言って、他の誰も役立ちません。スプレッドシートのデータは通常週単位または月単位で集計されるため、ほとんどの履歴情報がそのような集計を通じて失われます。さらに、この場合、スプレッドシートには製品に適用されるカテゴリや階層に関する情報がほとんど含まれていない可能性があります。当社の予測エンジンは、お持ちのすべてのデータを活用し、小さなサンプルでテストを行っても満足のいく結果は得られません。

在庫切れやプロモーションについてはどうですか?

在庫切れとプロモーションは、過去の販売にバイアスを表します。目標は需要を予測することであり、販売ではないため、このバイアスを考慮する必要があります。これらのイベントに対処する一般的でありますが、正しくない方法の1つは、履歴を書き換えてギャップを埋め、ピークを切り捨てることです。しかし、このアプローチは好ましくありません。なぜなら、予測エンジンに予測を供給することになり、過剰適合の問題を引き起こす可能性があるからです。代わりに、当社のエンジンは、需要が検閲されたり膨張された場所を示す「フラグ」をネイティブでサポートしています。

新製品の予測はできますか?

はい、可能です。ただし、新製品を予測するには、エンジンに他の「古い」製品の発売日と、発売時の需要の履歴が必要です。また、製品のカテゴリや/または製品階層をいくつか指定することが推奨されます。エンジンは、新しい製品を予測する際に、「古い」製品を自動検出して、新しい製品と同等と見なすことができます。ただし、新しいアイテムにまだ需要が観測されていないため、予測はそれらに関連付けられた属性に完全に依存します。

予測を洗練するために外部データを使用していますか?

通常、ウェブスクレイピングに特化した第三者企業から入手した競合価格データを使用できます。Webトラフィックデータも使用でき、さらに統計的精度を向上させるために歴史データを豊かにするために取得できます。実際、外部データソースを使用する際の最大のボトルネックは、比較的能力のあるLokad予測エンジンではなく、それらの外部データソースに接続された高品質のデータパイプラインを設定および維持することです。