クラシックな時系列予測(2008年)

このページでは、当社のクラシックな予測技術に関するFAQ(よくある質問)を紹介しています。実際には、クラシックな予測は確率的予測に比べてはるかに優れています。詳細については、最新のテクノロジーページをご覧ください。

基本情報

どのような予測モデルを使用していますか?

この質問に対する回答は2つの理由から難しいです。まず、当社の予測技術は詳細に開示するつもりのない主要な知的財産(IP)資産です。次に、当社の技術は複雑で多くのモデルを備えています。ただし、Lokadは統計学習理論というよく知られた理論を活用しています。この理論には、サポートベクターレグレッション、ベイジアンネットワーク、混合またはブースティングメソッド、ニューラルネットワークや遺伝的アルゴリズムを含むメタヒューリスティクスなど、ほとんどの現代の予測手法が含まれています… また、私たちは古典的な手法も無視していません。線形自己回帰、移動平均、(二重、三重)指数平滑化、ボックス・ジェンキンス、ホルト・ウィンタース、ARMA、ARIMAなどです。ただし、これらの「クラシック」な手法は、時系列間の相関を活用する際には通常非常に弱いです。

予測の正確さはどの程度ですか?

予測の正確さは、考慮されるデータセットに非常に依存します。私たちは、0.5%の誤差が悪いと考えられる状況(例:全国の電力消費量の毎時予測24時間前)や、80%の誤差が優れていると考えられる状況(例:商品の発売時に実施される一回限りのプロモーション)に遭遇しています。正確さは予測の先を見るほど低くなりますが、正確さは集約レベルにも大きく依存します。予測がより集約されるほど、予測はより正確になります。

予測コンテスト、技術の学術的な検証はありますか?

毎年多くのデータマイニングコンテストが開催されています。Lokadでは、通常、これらのイベントに注目し、データがLokadに関連する場合には、競技データセットと当社の予測技術を定期的にベンチマークしています(画像や顧客プロファイルなどのデータは処理しません)。ただし、現時点では、私たちが日常的に直面する課題を深く代表すると考えられる公開データマイニングコンテストはまだ観察されていません。まず第一に、学術的なデータセットは通常小規模であり、数百の時系列を持ち、時系列ごとに数百のデータポイントを持っています。これは通常、小売業界で観察されるものとはほとんど逆です。数千、もしくは数百万の時系列がありますが、製品の寿命が短いため、非常に短い系列です。ただし、Lokadは通常、これらのコンテストで良い成績を収めており、Lokadでは、結果を出すために専門知識は必要ありません。

予測の正確さを評価していますか?

はい、評価しています。当社の予測技術によって達成された予測の正確さは、私たちのコア技術の約半分を占めています。詳細には触れませんが、データに実際に適合するモデルを作成するだけでなく、まだ手元にない未来のデータにおいても非常に優れたモデルを作成することは大きな課題です。詳細は過学習:精度測定が間違っているときを参照してください。LokadのR&Dチームの日常業務は、クライアントのデータセットに対して予測エンジンを繰り返し実行し、予測誤差を測定し、それらを減らすことです。また、当社の技術の特徴の一つは、予測だけでなく、各予測値に対して予測の正確さ(MAPE誤差)も得られることです。したがって、予測が信頼性に欠けていることが最終的にわかるまで待つ必要はありません。Lokadは情報を提供し、戦略を適応させることができます。

どれくらいの過去データが必要ですか?

過去データの量には下限の要件はありません。ただし、Lokadは統計技術を提供しているため、過去データが多ければ多いほど予測の正確さが向上します。実際には、2年の過去データは良いとされており、3年以上は優れているとされています。1年未満の過去データしかない場合、Lokadは多くのビジネスにとって重要なパターンである季節性を通じて予測を洗練することができません。また、季節性を活用するためには、Lokadはすべての単一の時系列(製品販売など)に1年以上のデータが必要ではありません。ビジネスに存在する季節性プロファイルを確立するためには、1年以上の履歴を持ついくつかの時系列があれば十分です。スタートアップや新興企業の場合、Lokadは最初から使用できます。実際に、予測だけでなく予測の正確さも提供しています。したがって、最初の予測は通常、非常に高い誤差レベルであり、徐々に改善されます。Lokadは不確実性を定量化する手段を提供します。

一般的なパターン

マクロトレンド(例:金融危機)はどのように扱われますか?

マクロトレンドに関しては、2つの典型的な誤解があると考えています。まず、マクロトレンドは、それ自体が正確に予測できる場合にのみ需要予測を洗練するために活用できます。もし銀行が金融危機を予測できていたなら、最初から危機は起こらなかったでしょう。マクロトレンドの予測は、通常、平均的な製品の需要予測よりもはるかに困難であり、頑固なオプションです。次に、年間-3%の景気後退は大きなマクロトレンドと見なされますが、実際には週次レベルで-0.06%の影響を意味します。比較すると、私たちは通常、1週間から次の週までに製品の販売が20%変動することを観察しています。Lokadは主に短期予測に適しており、数週間先を見越す際には、マクロトレンドは通常、プロモーション、カニバリゼーション、広告キャンペーンなどのマイクロ経済要因によって圧倒されます。結論として、Lokadは通常、ほとんどのマクロトレンドを無視しますが、私たちの経験では、99%の状況においては合理的な選択肢です。

季節性、トレンドはどのように扱われますか?

私たちはカレンダーベースのパターンを自動的に検出します。製品が季節的であることをLokadに伝える必要はありません。季節性は、私たちの予測技術によってネイティブに対応される頻繁なパターンです。実際のところ、季節性は多くの人々が期待する以上に複雑です。私たちの見解では、単一の「季節性」ではなく、複数の「周期的」なパターンが相互に作用するものと考えています。年間の季節性、週の曜日効果、月次レベルでの給与日効果、アメリカの母の日(5月の第2日曜日)などの準年間の季節性などがあります。さらに、販売予測を販売時点レベルで考慮する場合、製品の周期的なパターンは販売時点自体の周期的なパターンと組み合わさります。実際に、各販売時点は独自の環境を持ち、独自の需要パターンを生成します。したがって、季節性は単にYES/NOフラグを提供することではなく、相互に依存する複雑なパターンのセットです。良いニュースは、Lokadがこの複雑さをあなたのために管理することです。

復活祭、ラマダン、母の日などの準季節的なイベントはどのように扱われますか?

いくつかのカレンダーパターンは、Lokadの専門用語である準季節的です。これらのパターンは、グレゴリオ暦(西暦またはキリスト教暦とも呼ばれる)の意味で厳密に年次的ではありませんが、1年から次の年に繰り返されます。復活祭、ラマダン、中国の新年、母の日などは、準季節的なパターンの例です。Lokadは準季節的なパターンを自動的に検出するため、これらのパターンを処理するために特別な努力を必要としません。そして、クラシックな季節性と非常に似た方法で、Lokadは主に複数の時系列分析に依存して、似たような準季節的なパターンを持つ時系列を検出し、パターン分析を洗練させます。

製品のライフサイクルと製品の発売はどのように扱われますか?

ほとんどの消費財はライフサイクルを経ます。製品は発売され、成長し、衰退し、最終的に市場から姿を消します。Lokadは、発売日が与えられた場合に発売時の販売を予測することができます。明らかに、製品が発売される直前には、この製品自体の販売データは利用できません。しかし、クラシックな予測ツールキットとは異なり、Lokadは単なるクラシックな時系列予測に関するものではありません。特に、製品はタグを通じて説明することができます。タグは製品のカテゴリ、サブカテゴリ、ファミリ、ブランド、色、サイズなど、製品のほぼすべての属性を表すことができます。発売される製品の販売を予測するために、Lokadは類似の製品の歴史的な発売を分析し、各製品に提供されるタグに基づいて類似性を評価します。他のライフサイクルパターンにも同じ原則を適用します。

断続的な/低ボリュームの製品はどのように扱われますか?

1年に1回しか販売されない製品がある場合、統計的な予測に関してはほとんど何もできません。実際には、1つのユニットを店舗に置くかゼロにするかは、マーケティングの選択肢です。ただし、この極端なスロームーバーケースとトップセラーの間には、在庫最適化を必要とする頻繁に販売される製品のグレーゾーン全体があります。ほとんどのクラシックな予測ツールキットは断続的な販売に対してうまく機能しません。Lokadでは、多くのビジネス(例:eコマース)が収益性を確保するためにロングテールに大いに依存しているため、この需要パターンに多くの努力を注いでいます。ただし、スロームーバーは、注意深く管理されない限り、トップセラーよりもさらに多くの在庫を生成する可能性があります。スロームーバーに対処するためには、確率的予測を選択することをお勧めします。

天候はどのように扱われますか?

食料品店などの一部のビジネスでは、天候は非常に重要な需要要因です。現時点では、Lokadは天候予測を予測技術の入力として活用していません。ただし、この項目は中期のロードマップの一部です。私たちの目標は、天候の入力をサポートするだけでなく、プロセスを大幅に自動化し、クライアントが追加の精度を得るためにほぼゼロの努力しか必要としないようにすることです。

需要のアーティファクト

在庫切れによる失われた売上はどのように扱われますか?

売上は需要と同じではありません。在庫切れは、売上を元の需要から歪めるアーティファクトです。実際に、在庫切れは売上を減少させる一方で需要は一定のままです。従来の予測ツールキットとは異なり、Lokadでは、在庫切れが発生しなかった場合に発生したであろう売上を表現するために、過去のデータを変更したり調整したりする必要はありません。代わりに、イベントを使用して在庫切れが発生したタイミングを示すことができます。在庫切れの情報は、季節性、トレンドなどに影響を与える可能性のあるすべてのパターンをより正確に推定するために使用されます。イベントで在庫切れとしてフラグが立てられていない場合、Lokadはそれらのパターンをノイズとしてフィルタリングします。在庫切れの追跡は望ましいですが、Lokadを始めるための要件ではありません。

例外的な売上はどのように扱われますか?

業界によっては、ビジネスが例外的な売上に直面することがあります。これらの売上は、そのサイズが例外的であるため、純粋な統計的アプローチで比較的簡単に特定できる場合があります。したがって、例外的な売上をクリーンアップするために過去のデータを調整することはおすすめしません。まず、時間の無駄ですし、例外的な売上自体が需要予測に役立つ貴重な情報を持っている場合があります。ただし、Lokadは個々の将来の例外的な売上を予測することはできません。例えば、交渉の結果に依存する場合があります。既知の例外的な売上がある場合は、Lokadの予測に追加の情報を手動でオーバーライドすることをおすすめします。

集約、トップダウンまたはボトムアップ?

一部の企業では、グループやカテゴリのレベルで需要を予測し、それらの予測を個々の製品に分割します。これは製品のトップダウン予測方法です。同じ考え方は頻度の予測にも適用できます。一部の企業では、まず週単位で予測し、その後曜日ごとの係数を適用します。この場合、これは頻度のトップダウン予測方法です。逆に、週次の予測は日次の予測を合計することで作成することができます。Lokadでは、予測をできるだけ操作上のニーズに合わせるように調整することをおすすめします。サプライチェーンが製品ごとに週次の予測を必要とする場合は、Lokadに製品ごとの週次の予測を要求してください。日次の予測を要求し、それらの予測を合計することは精度を向上させません。同じ考え方に従って、Lokadに製品グループレベルでの売上予測をさせ、それから手動で各SKUの予測を分割することは良いアイデアではありません。なぜなら、分割自体によってかなりの予測誤差が導入される可能性があるからです。Lokad内部では、多くの集約/分解アルゴリズムを利用しており、通常は最も詳細なデータを活用することを好みます。例えば、月次の予測を提供するために日次の売上データを活用しています。実際、月には4週または5週末があり、これはほとんどの小売業に大きな影響を与えます。通常どおり、集約レベルの心配はする必要はありません。Lokadが要件を処理します。