クラシックな時系列予測(2008年)

このページでは、当社のクラシックな予測技術に関するFAQ(よくある質問)を紹介しています。実際には、クラシックな予測は確率的予測に比べてはるかに優れています。詳細については、最新のテクノロジーページをご覧ください。

ナットとボルト

どのような予測モデルを使用していますか?

この質問に対する回答は2つの理由で難しいです。まず、当社の予測技術は詳細に開示するつもりのない主要な知的財産(IP)資産です。次に、当社の技術は複雑で多くのモデルを備えています。ただし、Lokadは統計学習理論というよく知られた理論を活用しています。この理論には、サポートベクトル回帰、ベイジアンネットワーク、混合またはブースティング法、ニューラルネットワークや遺伝的アルゴリズムを含むメタヒューリスティクスなど、ほとんどの現代の予測手法が含まれています… また、私たちは古典的な手法も無視していません。線形自己回帰、移動平均、(二重、三重)指数平滑化、ボックス・ジェンキンス、ホルト・ウィンタース、ARMA、ARIMAなどです。ただし、これらの「クラシック」な手法は、時系列間の相関を活用する際には通常非常に弱いです。

予測の正確さはどの程度ですか?

予測の正確さは、考慮されるデータセットに非常に依存します。私たちは、0.5%の誤差が悪いと考えられる状況(例:全国の電力消費量の毎時予測24時間前)や、80%の誤差が優れていると考えられる状況(例:製品のローンチ時に実施される一回限りのプロモーション)に遭遇しています。正確さは予測の先を見るほど低くなりますが、正確さは集約レベルにも大きく依存します。予測がより集約されるほど、予測はより正確になります。

予測コンテスト、技術の学術的な検証はありますか?

毎年多くのデータマイニングコンテストが開催されています。Lokadでは、通常、これらのイベントに注目し、データがLokadに関連する場合には定期的に予測技術をこれらの競技データセットと比較してベンチマークを行っています(画像や顧客プロファイルなどのデータは処理しません)。ただし、現時点では、私たちが日常的に直面する課題を深く代表すると考えられる公開のデータマイニングコンテストはまだ観察されていません。まず、学術的なデータセットは通常小規模であり、数百の時系列を持ち、時系列ごとに数百のデータポイントがあります。これは通常、小売業界で観察されるものとはほとんど逆です。数千、もしくは数百万の時系列がありますが、製品の寿命が非常に短いため、非常に短い系列です。ただし、Lokadは通常、これらのコンテストで良い成績を収めます。また、Lokadでは、結果を得るために専門知識は必要ありません。

予測の正確さを評価していますか?

はい、評価しています。当社の予測技術によって達成された予測の正確さの正確な定量的測定は、当社の主要な技術の約半分を占めています。詳細には触れませんが、データに実際にフィットするモデルを作成するだけでなく、将来のデータ、つまりまだ手元にないデータに対しても非常に優れたモデルを作成することは大きな課題です。詳細は過学習:精度測定が間違っているときを参照してください。Lokadの研究開発チームの典型的な日常業務は、顧客のデータセットに対して予測エンジンを繰り返し実行し、予測誤差を測定し、それらを減らすことです。そのため、Lokadでは予測だけでなく、各予測値に対して予測の期待精度も提供されます。これはMAPE誤差として表されます。したがって、予測が信頼性に欠けることが判明するのを待つ必要はありません。Lokadは情報を提供するため、戦略を適切に調整することができます。

どれくらいの過去データが必要ですか?

過去データの量には下限の要件はありません。ただし、Lokadは統計技術を提供しているため、過去データが多ければ多いほど予測の精度が高くなります。実際には、2年の過去データは良いとされており、3年以上は優れているとされています。もし1年未満の過去データしか持っていない場合、Lokadは多くのビジネスにとって重要なパターンである季節性を通じて予測を改善することができません。また、季節性を活用するためには、Lokadはすべての時系列(つまり、製品の販売)で1年以上のデータを必要とするわけではありません。ビジネスに存在する季節性プロファイルを確立するために、1年以上の履歴を持ついくつかの時系列があれば十分です。スタートアップや新興企業の場合、Lokadは最初から使用することができます。実際に、予測だけでなく予測の正確さも提供しています。したがって、最初の予測は通常非常に高い誤差率を持ち、徐々に改善されていきます。Lokadは不確実性を定量化する方法を提供します。

一般的なパターン

マクロトレンド(例:金融危機)はどのように扱われますか?

マクロトレンドに関しては、2つの典型的な誤解があると考えています。まず、マクロトレンドは、それ自体が正確に予測できる場合にのみ需要予測を改善するために活用できます。もし銀行が金融危機を予測できていたなら、最初から危機は起こらなかったでしょう。マクロトレンドの予測は、通常、平均的な製品の需要予測よりもはるかに困難であり、頑固なオプションとなることが多いです。第二に、年間-3%の景気後退は大きなマクロトレンドと見なされますが、実際には週次レベルで-0.06%の影響を意味します。比較すると、私たちは通常、製品の販売が1週間から次の週まで20%変動するのを観察しています。Lokadは主に短期予測に適しており、数週間先を見越す際には、マクロトレンドは通常、プロモーション、カニバリゼーション、広告キャンペーンなどのマイクロ経済要因によって圧倒されます。結論として、Lokadは通常、ほとんどのマクロトレンドを無視しますが、私たちの経験では、99%の状況においては唯一の合理的な選択肢です。

季節性、トレンドはどのように扱われますか?

私たちはカレンダーベースのパターンを自動的に検出します。製品が季節的であることをLokadに伝える必要はありません。季節性は、私たちの予測技術によってネイティブに対応される頻繁なパターンです。実際、季節性は多くの人々が期待する以上に複雑です。私たちの目には、単一の季節性ではなく、多くの周期的なパターンが複数の方法で相互作用していると見えます。年間の季節性、週の曜日効果、月次レベルでの給与日効果、アメリカで5月の第2日曜日に祝われる母の日など、ほぼ年間の季節性があります。さらに、販売時点での販売予測を考慮する場合、製品の周期的なパターンは販売時点自体の周期的なパターンと組み合わさります。実際、各販売時点は独自の環境を持ち、独自の需要パターンを生成します。したがって、季節性は単なるYES/NOフラグを提供するだけでなく、相互に依存する複雑な一連のパターンです。良いニュースは、Lokadがこの複雑さをあなたのために管理することです。

イースター、ラマダン、母の日などの準季節イベントはどのように扱われますか?

いくつかのカレンダーパターンは、Lokadの専門用語で言うところの準季節的です。これらのパターンは年々繰り返されますが、グレゴリオ暦(西洋暦またはキリスト教暦とも呼ばれる)の意味で厳密に年次ではありません。イースター、ラマダン、中国の新年、母の日などは、準季節的なパターンの例です。Lokadは準季節的なパターンを自動的に検出するため、これらのパターンを処理するために特別な努力をする必要はありません。その後、クラシックな季節性と非常に似た方法で、Lokadはパターン分析を改善するために、似たような準季節的なパターンを持つ時系列に主に依存します。

製品のライフサイクルと製品のローンチはどのように扱われますか?

ほとんどの消費財はライフサイクルを経ます。製品はローンチされ、成長し、衰退し、最終的に市場から姿を消します。Lokadは、ローンチ時の販売を予測することができます。ただし、製品がローンチされる直前には、この製品自体の販売データは利用できません。しかし、クラシックな予測ツールキットとは異なり、Lokadは単なるクラシックな時系列予測に関するものではありません。特に、製品はタグを通じて説明することができます。タグは製品のさまざまな属性を表すことができます:カテゴリ、サブカテゴリ、ファミリー、ブランド、色、サイズなど。ローンチされる製品の販売を予測するために、Lokadは類似の製品の過去のローンチを分析し、各製品に提供されたタグに基づいて類似性を評価します。他のライフサイクルパターンにも同じ原則を適用します。

断続的な/低ボリュームの製品はどのように扱われますか?

1年に1回販売される製品がある場合、統計的な予測に関してはほとんど何もできません。実際には、1つのユニットを店舗に置くか、ゼロにするかはマーケティングの選択です。ただし、これは非常に遅い動きの場合とトップセラーの間の製品のグレーゾーン全体であり、在庫最適化が必要です。ほとんどのクラシックな予測ツールキットは断続的な販売に対してうまく機能しません。Lokadでは、多くのビジネス(例:eコマース)が収益性を確保するためにロングテールに大いに依存しているため、この需要パターンに多くの努力を注いでいます。ただし、遅い動きの場合、注意深く管理しない限り、トップセラーよりも在庫を生成する可能性があります。遅い動きの場合は、確率的予測を選択することをおすすめします。

天候はどのように扱われますか?

食料品店などの一部のビジネスでは、天候が非常に重要な需要要因です。現時点では、Lokadは予測技術の入力として天候予報を活用していません。ただし、この項目は中期的なロードマップの一部です。私たちの目標は、天候の入力をサポートするだけでなく、プロセスを非常に自動化することであり、クライアントが追加の精度を得るためにほとんど努力を必要としないようにすることです。

需要のアーティファクト

在庫切れによる失われた販売はどのように扱われますか?

販売は需要と同じではありません。在庫切れは、需要が一定のままである中で販売が減少するアーティファクトです。実際には、在庫切れは販売パターン(季節性、トレンドなど)に影響を与えるすべてのパターンをより正確に推定するために使用できます。在庫切れがイベントとしてフラグ付けされない場合、Lokadはこれらのパターンをノイズとしてフィルタリングします。在庫切れの追跡は望ましいですが、Lokadを始めるために必要なものではありません。

例外的な販売はどのように扱われますか?

産業によっては、ビジネスが例外的な販売に直面することがあります。これらの販売は、そのサイズが例外的であるため、純粋な統計的アプローチで比較的簡単に特定できます。したがって、例外的な販売をクリーンアップするために過去のデータを調整することはおすすめしません。まず、時間の無駄ですし、例外的な販売自体が需要の予測に役立つ貴重な情報を持っている場合があります。そのため、Lokadは個々の将来の例外的な販売を予測することはできません(交渉の結果に依存する場合など)。既知の例外的な販売がある場合は、Lokadの予測に追加の情報を手動でオーバーライドすることをおすすめします。

集約、トップダウンまたはボトムアップ?

一部の企業は、グループやファミリーのレベルで需要を予測し、それらの予測を個々の製品に分割します。これは製品のトップダウン予測方法です。同じ考え方は頻度の予測にも適用できます。一部の企業はまず週単位で予測し、その後曜日係数を適用します。この場合、これは頻度のトップダウン予測方法です。逆に、週次の予測は日次の予測を合計することで作成することができます。Lokadでは、予測をできるだけ正確に運用ニーズに合わせるように調整することをおすすめします。サプライチェーンが製品ごとに週次の予測を必要とする場合は、Lokadに製品ごとの週次の予測を要求してください。日次の予測を要求し、それらの予測を合計しても精度は向上しません。同じ考え方に従って、Lokadに製品グループレベルでの販売予測を行わせ、それから手動で各SKUの予測を分割するのは良い考えではありません。なぜなら、分割自体によって予測誤差が大きく導入される可能性があるからです。Lokad内部では、多くの集約/分割アルゴリズムを利用しており、通常は最も詳細なデータを活用することを好みます。例えば、月次の予測を提供するために、Lokadは日次の販売データを活用しています。実際、1ヶ月には4週または5週末が含まれており、これはほとんどの小売業に大きな影響を与えます。いつも通り、集約レベルのことは心配しなくても大丈夫です。Lokadはあなたの要件を処理します。