クラシックな時系列予測(2008年)
肝心な点
使用している予測モデルは何ですか?
この質問に答えるのは難しい理由が2つあります。第一に、当社の予測技術は詳細に開示したくない主要な知的財産(IP)資産であり、第二に、当社の技術は複雑で多くのモデルを備えています。 それは、Lokadは統計学習理論というよく知られた理論を活用しています。この理論には、サポートベクトル回帰、ベイジアンネットワーク、混合またはブースティングメソッド、ニューラルネットワークや遺伝的アルゴリズムを含むメタヒューリスティクスなど、ほとんどの現代の予測手法が含まれています… そして、私たちは単なる古典的な手法も無視しません:線形自己回帰、移動平均、(二重、三重)指数平滑化、Box-Jenkins、Holt-Winters、ARMA、ARIMA。 しかし、これらの「古典」は、時系列間の相関を活用する際に非常に弱いとされています。
予測の精度はどの程度ですか?
予測の精度は非常に特定のデータセットに依存します。私たちは、国内の電力消費量の毎時予測(24時間先)など、0.5%の誤差が悪いと考えられた状況や、製品ローンチ時に行われた一種類のプロモーション活動など、80%の誤差が優れていると考えられた状況など、さまざまな状況に遭遇しています。 精度は、予測が進むほど予測が不正確になるほど依存しますが、精度は集約レベルにも大きく依存します。 予測が集約されるほど、予測は正確になります。
予測コンペティション、技術の学術的検証はありますか?
毎年多くのデータマイニングコンペティションが開催されています。 Lokadでは、通常、これらのイベントに注意を払い、データがLokadに関連する場合には、競技データセットに対して定期的に予測技術をベンチマークにかけます(たとえば、画像や顧客プロファイルではなく、時系列のみを処理します)。 ただし、今日までに、私たちが日常的に直面する課題を深く代表すると考える公開データマイニングコンペティションはまだ観察されていません。 第一に、学術的なデータセットは小さく、時系列あたり数百のデータポイントを持つ長い時系列である傾向があります。これは、小売業界で一般的に観察されるものとはほとんど逆です:数千、あるいは数百万の時系列がありますが、製品の寿命が短いため、非常に短い系列です。 それにもかかわらず、Lokadは通常、これらのコンペティションで良い成績を収め、Lokadを使用すると、結果は即座に得られ、結果を出すために専門知識は必要ありません。
予測の精度を評価していますか?
Yes, we do. 当社の予測技術で達成された予測精度の正確な数量的測定は、当社のコア技術の約半分を占めています。詳細には立ち入りすぎず、データに実際に適合するモデルを作成するだけでなく、まだ持っていないデータ、つまり将来のデータに対して本当に優れたモデルを作成することは大きな課題であると言えます。詳細は過学習:精度測定が間違っているときを参照してください。Lokadの研究開発チームの典型的な日常業務は、クライアントのデータセットに予測エンジンを何度も実行し、予測誤差を測定し、それらを削減しようとすることです。その後、当社の技術の注目すべき側面は、予測だけでなく、各予測値に対してその値の期待される精度も得られることです。これはMAPE誤差として表現されます。したがって、予測が信頼性に欠けていたことを最終的に発見するのを待つ必要はありません。Lokadは情報を最初に提供するため、戦略を適応させることができます。
どれだけの過去データが必要ですか?
過去データの量に下限要件はありません。ただし、Lokadは統計技術を提供しているため、過去データが多いほど予測が正確になります。実際には、2年の過去データが良いとされており、3年以上は優れているとされています。1年未満の過去データしかない場合、Lokadは多くのビジネスにとって重要なパターンである季節性を通じて予測を洗練することができません。また、季節性を活用するためには、Lokadはすべての単一の時系列(つまり、製品販売)に1年以上のデータが必要ではありません。ビジネスに存在する季節性プロファイルを確立するために、1年以上の履歴を持ついくつかの時系列が必要です。スタートアップや新興企業の場合、Lokadは最初から使用できます。実際、予測だけでなく、予測される精度も提供しています。したがって、最初の予測は通常、非常に高い誤差レベルを示し、徐々に改善されます。Lokadは不確実性を定量化する方法を提供します。
一般的なパターン
マクロトレンド(例:金融危機)はどのように扱われますか?
マクロトレンドに関しては、一般的な誤解が2つあると考えています。まず、マクロトレンドは、それ自体が正確に予測される場合にのみ需要予測を洗練するために活用できます。金融危機を予測できれば、最初から危機は発生しなかったでしょう。マクロトレンドを予測することは、通常、平均的な製品の需要を予測するよりもはるかに難しいため、頻繁に非常に難しい選択肢となります。第二に、年間-3%の景気後退は大きなマクロトレンドと見なされますが、実際には週次レベルで-0.06%の影響を意味します。比較すると、我々は通常、製品販売が前週から20%変動するのを観察しています。Lokadは短期予測に最適であり、数週間先を見据えると、マクロトレンドは通常、プロモーション、カニバリゼーション、広告キャンペーンなどのマイクロ経済要因によって圧倒されます。結論として、Lokadは通常、ほとんどのマクロトレンドを無視しますが、当社の経験では、99%の状況に対して唯一の合理的な選択肢であると考えています。
季節性、トレンドはどのように扱われますか?
Lokadはカレンダーベースのパターンを自動検出します。製品が季節的であることをLokadに伝える必要はありません。季節性は、私たちの予測技術によってネイティブに対処される頻繁なパターンです。実際、季節性は、多くの人々が期待する以上に複雑です。私たちの見解では、1つの季節性ではなく、複数の周期的パターンが複数の方法で相互作用しています。年次の季節性、週の曜日効果、月次の給与効果、母の日などの準年次の季節性(アメリカの5月の第2日曜日に祝われる母の日)、…さらに、売上予測を販売時点のレベルで考慮すると、製品の周期的パターンが販売時点自体の周期的パターンと組み合わされます。実際、各販売時点は、独自の需要パターンを生成する環境を持っています。したがって、季節性は単なるYES/NOフラグを提供するだけではなく、相互に依存する複雑なパターンのセットです。良いニュースは、Lokadがこの複雑さをあなたのために管理するということです。
復活祭、ラマダン、母の日などの準季節的イベントは?
一部のカレンダーパターンは、Lokadのジャーゴンでは準季節的です:パターンは1年から次の年に繰り返されますが、グレゴリオ暦(西洋暦またはキリスト教暦としても知られています)の意味で厳密に年次ではありません。復活祭、ラマダン、旧正月、母の日などは、準季節的パターンの多くの例です。Lokadは準季節的パターンを自動検出するため、これらのパターンを処理するために特別な努力を払う必要はありません。そして、古典的な季節性と非常に似た方法で、Lokadは主に複数の時系列分析に依存して、似たような準季節的パターンを持つ時系列を検出してパターン分析を洗練させます。
製品ライフサイクルと製品のローンチ、どのように扱われますか?
ほとんどの消費財はライフサイクルを経ます。製品はローンチされ、成長し、衰退し、最終的に市場から段階的に撤退します。Lokadは、ローンチ時の売上を予測することができますが、ローンチ日が与えられていると仮定します。明らかに、製品がローンチされる直前には、予測をサポートするためにこの製品自体の売上データは利用できません。しかし、古典的な予測ツールキットとは異なり、Lokadは単なる古典的な時系列予測についてではありません。特に、製品はタグを介して記述することができます。タグは製品のカテゴリ、サブカテゴリ、ファミリー、ブランド、色、サイズなど、製品のほぼすべての属性を表すことができます。ローンチされる製品の売上を予測するために、Lokadは類似の製品の歴史的なローンチを分析し、各製品に提供されたタグに基づいて類似性を評価します。他のライフサイクルパターンについても同じ原則を適用します。
断続的/低ボリューム製品はどのように扱われますか?
1年に1度販売される製品がある場合、統計的予測としてはほとんど何もできません。実際には、店舗に1単位またはゼロを持つかどうかはマーケティングの選択です。ただし、この極端に遅い動きのケースとトップセラーの間には、在庫最適化が必要な頻繁に販売される製品のグレーゾーン全体があります。ほとんどの古典的な予測ツールキットは断続的な販売に対してうまく機能しません。Lokadでは、多くのビジネス、例えばeコマースなどが収益性を達成するためにロングテールに大きく依存しているため、この需要パターンに多くの努力を払っています。しかし、慎重に管理されない場合、遅い動きの製品はトップセラーよりもさらに多くの在庫を生み出す可能性があります。遅い動きの製品に対処するためには、確率的予測を選択することをお勧めします。
天候はどのように扱われますか?
食料品店など、一部のビジネスでは、天候が非常に重要な需要要因です。現時点では、Lokadは天候予測を予測技術の入力として活用していません。ただし、この項目は中期ロードマップの一部です。私たちの目標は、天候入力をサポートするだけでなく、プロセスを大幅に自動化して、クライアントが追加の精度を得るためにほとんど努力を必要としないようにすることです。
需要アーティファクト
在庫切れによる失われた売上はどのように扱われますか?
売上は需要と同じではありません。在庫切れは、売上を元の需要から歪めるアーティファクトです。実際、在庫切れは売上を減少させる一方で需要は一定のままです。従来の予測ツールキットとは異なり、Lokadでは、在庫切れが発生しなかった場合の売上を表現しようとして過去のデータを変更したり調整する必要はありません。代わりに、イベントを使用して在庫切れが発生した時点を示すことができます。在庫切れ情報は、それ以外のすべてのパターン(季節性、トレンドなど)をより正確に推定するために使用されます。在庫切れがイベントとしてフラグ付けされていない場合、Lokadはそれらのパターンをノイズとしてフィルタリングします。在庫切れを追跡することは望ましいですが、Lokadを始めるための要件ではありません。
例外的な売上はどのように扱われますか?
産業によっては、ビジネスが例外的な売上に直面することがあります。これらの売上は、そのサイズが例外的であるため、純粋な統計的アプローチで比較的簡単に特定できます。したがって、例外的な売上をクリーンアップするために過去のデータを調整することをお勧めしません。まず、時間の無駄である可能性がありますし、例外的な売上自体が需要予測に役立つ貴重な情報を持っているかもしれません。その後、Lokadは個々の将来の例外的な売上を予測することはできません - たとえば、交渉の結果に依存するかもしれません。将来の例外的な売上がわかっている場合は、その追加情報でLokadの予測を手動で上書きすることをお勧めします。
集約、トップダウンまたはボトムアップ?
一部の企業は、グループやファミリーのレベルで需要を予測し、それらの予測を個々の製品に達するために分割します。これは製品のトップダウン予測方法です。同じ考え方は、予測頻度にも適用できます。一部の企業は最初に週次レベルで予測し、その後曜日係数を適用します。この場合、これは頻度トップダウン予測方法です。逆に、週次予測は日次予測を合計することで生成できます。Lokadでは、予測をできるだけオペレーショナルなニーズに合わせるように調整することをお勧めします。サプライチェーンが製品ごとに週次予測を必要とする場合は、Lokadから製品ごとに週次予測を要求してください。日次予測を要求してからそれらの予測を合計しても、精度が向上しません。同じ考え方に従い、Lokadに製品グループレベルで売上を予測させ、その後SKUごとに予測を手動で分割することは良い考えではありません。分割そのものによってかなりの予測誤差が導入される可能性があります。内部的には、Lokadは多くの集約/分解アルゴリズムに依存しており、通常、利用可能な最も細かいデータを活用することを好みます。たとえば、月には4日または5日の週末が含まれることが多く、これはほとんどの小売業に大きな影響を与えます。通常通り、集約レベルを気にする必要はありません。Lokadが要件を処理します。