予測技術-faq

予測技術 よくあるご質問(FAQ)


予測技術 » このページ

   主眼点
      ビデオによるやさしい導入
      どのような予測モデル使っていますか?
      予測はどの程度正確ですか?
      予測コンテスト、Lokadの技術は学術的に立証されていますか?
      予測結果に関する精度の評価はありますか?
      履歴データはどのぐらい必要ですか?
   一般的なパターン
      マクロ・トレンド(例:経済危機)はどのように扱われていますか?
      季節性、トレンド、これらはどのように扱われていますか?
      イースター、ラマダン、母の日、その他の準季節的イベントについては?
      プロモーション(販売促進)はどのように扱われていますか?
      商品のライフ・サイクルと新商品の発売、これらはどのように扱われますか?
      間欠的需要品/少量生産品についてはどのように扱われていますか?
      カニバリゼーションについてはどのように扱っていますか?
      天候はどのように扱われていますか?
   需要アーティファクト
      在庫切れによる売上げの損失についてはどう扱われますか?
      例外的な売上げはどのように扱われますか?
      集約は、トップダウンですか、ボトムアップですか?
   ビデオ


主眼点

ビデオによるやさしい導入



どのような予測モデル使っていますか?

こういう質問は以下の2つの理由から注意しなければなりません。ひとつは、弊社の予測技術は知的財産(Intellectual Property)のコアの部分にあたるため、詳細を開示することは難しいという点。ふたつめは、弊社の技術は複雑で多くのモデルを使用している点です。そうはいっても、Lokadは、 statistical learning theory:統計的学習理論と呼ばれる良く知られた理論を活用しています。 この理論は、一番最近の予測メソッドのサポートベクター回帰(SVR:Support Vector Regression)、ベイジアンネットワーク(Bayesian Networks)、神経回路網(NN:neural networks)や遺伝的アルゴリズムを含む混合方式やブースティング方式とメタヒューリスティクスを網羅しています。そして弊社は従来のクラシック方式である線形自己回帰、移動平均、(二次、三次)指数平滑化法、ボックス・ジェンキンス法(Box-Jenkins)、ホルト・ウィンタース法(Holt-Winters)、ARMA、 ARIMAなどを退けてしまっているわけではありません。しかしながら、これらのクラシック な方法は、時系列間の相関活用には非常に弱いと言えます。

予測はどの程度正確ですか?

予測精度は、考慮すべきデータセットに非常に左右されます。あるケースでは、0.5%のエラーが生じこれを精度が低いと評価されます。このケースでは国内の24時間先の電気消費量を予測するものでした。また別のケースでは80%のエラーで優れた結果と考えられました。これは新商品投入の際のプロモーション・キャンペーンとういうケースでした。精度は水平軸に大きく左右されます。予測期間が長くなればなるほど精度は低下します。しかし、精度は集約レベルにも大きく左右されます。予測が集約されるほど精度が向上するのです。

予測コンテスト、Lokadの技術は学術的に立証されていますか?

毎年たくさんのデータ・マイニング・コンテストが開催されています。Lokadは、常にこれらのイベントに注目しており、関連性のあるデータ(例えば、弊社で扱っているのはイメージや顧客データではなく時系列データのみ)を扱うコンテストに定期的に応募し、これらのコンテストで弊社の予測技術を性能の評価基準としています。しかし現在に至っては、私たちが日々直面するチャレンジを代表すると深く確信できるようなデータ・マイニング・コンテストが行われていません。理由のひとつには学術的データセットは小規模であり(数百の時系列)、長期時系列(時系列ごとに何百ものデータポイントが存在する)であるからです。これは小売業界で一般的に見られる現象とほぼ逆であるといえます。小売業界では、何千もの時系列が存在するのですが、商品のライフサイクルが短いため短期時系列となるのです。そうはいっても、Lokadは一般的にこれらのコンテストでは好成績を得、Lokadを使うことでお客様は特別な専門家を必要とせずにこのような結果を出せることを考えると、優秀 な成績であると言えるのではないでしょうか。

予測結果に関する精度の評価はありますか?

はい、あります。私たちの予測技術で達成される予測精度の厳格な量的測定は、弊社のコア・テクノロジーの半分を占めています。詳細に立ち入らずに言うならば、貴社データにフィット するモデルを作成するだけでなく、将来データのようにまだ存在しないのものに合うモデルを作成するということは、大きな挑戦と言えます。こちら Overfitting: when accuracy measure goes wrongもご参照ください。LokadのR&Dチームの一般的な日々のタスクは、顧客のデータセットを幾度も予測エンジンで計算し、予測エラーを測定しそれを削減することです。そして、特筆すべき弊社の技術は、お客様が予測を得るだけでなく、MAPE エラーで表される通り、予測の値ごとに値に予想される精度 を得ることができます。したがって、最後になって予測の信頼性が低いと分かるということはなく、Lokadは貴社の戦略に応じて貴社自身が対応を決めるよう情報を提供します。

履歴データはどのぐらい必要ですか?

履歴データの最低必要量というのはありません。そうは言ってもLokadは統計技術を提供しているので、履歴データが多いほど予測はより正確になります。具体的には、2年分の履歴データは良と考えられます、そして3年分の履歴データは優良と考えられます。1年分以下の履歴データでは、Lokadは多くのビジネスで重要なパターンと言えるseasonality:季節性を考慮して改良することができません。また、季節性を活用するために、すべての各時系列(例えば各商品の売上げ)について1年以上のデータは必要ではなく、貴社のビジネスにおいて過去履歴1年以上で季節性が確立されている時系列データが、いくつかあればいいのです。スタート・アップや新興ビジネスについては、始めからLokadのサービスをご利用になれます。実際には、私たちは予測だけでなく、予想される予測精度もご提供します。したがって、一般的に最初の予測はエラーレベルが高いですが、徐々に改良されていきます。Lokadは不確実性の量 もご提供します。

一般的なパターン

マクロ・トレンド(例:経済危機)はどのように扱われていますか?

マクロ・トレンドについて、典型的な誤解が2点あると思われます。ひとつは、マクロ・トレンドは、それ自体が正確に予測されるならば需要予測を改善するのに活用できるという点です。もし仮に、銀行が経済危機を予測できていたなら、まず経済危機など起こり得なかったでしょう。このことからも分かるように、通常マクロ・トレンドを予測するというのは、平均商品の需要予測を出すことよりもずっと難しいため、どちらかというと解決困難な問題と言えます。二つ目は、毎年3%の景気後退は大きなマクロ・トレンドと考えられますが、実際には週ベース考えると-0.06%の影響です。これに対して、週ごとに売上げが20%変動するという状況は常に観察されます。Lokadは短期予測 に適しており、数週間先を念頭に置いています。そしてマクロ・トレンドは、プロモーション、カニバリゼーション(共食い現象)、宣伝キャンペーンなどのミクロ経済ファクターによって矮小化されます。結論として、Lokadはほとんどのマクロ・トレンドは考慮に入れませんが、私たちの経験から99%のケースにおいてこれは妥当な選択だと言えます。

季節性、トレンド、これらはどのように扱われていますか?

カレンダーに基づくパターンは自動検知します。貴社はLokadに商品が季節性のものであると言う必要はありません。 seasonality:季節性 は弊社の予測技術として高頻度のパターンとして取り扱っています。事実、季節性は多くの人が考えるよりもずっと複雑なものです。目で見える形の季節性 は存在していなくても多くの循環 パターンが複数の方法で相互作用しています。年を通じた季節性、曜日による影響、毎月の給料日、5月の第二日曜日の母の日(米国の場合)などの準年間季節性などがあります。その上、Point of Sale(POS:販売時点管理)で売上げ予測を考えるとき、商品の循環パターンはPOS自体の循環パターンと連合されます。実際、各POSシステムは多かれ少なかれ独自の需要パターンを作り上げる独特の環境です。したがって、季節性はある/ないという単純なものではなく、独立したパターンの複雑なものであると言えます。朗報は、Lokadがこの複雑な点をお客様に代って引き受ける、ということです。

イースター、ラマダン、母の日、その他の準季節的イベントについては?

いくつかのカレンダーパターンは、Lokadの業界用語で言うと、「準季節的」と言えます。つまり、毎年繰り返されるがグレゴリウス暦(西洋暦、キリスト暦)において同じ日にならないものを指します。イースター、ラマダン、中国の旧正月、母の日などは準季節的パターンの例です。Lokadは準季節的パターンを自動検知するのでお客様はこれらを扱う努力は不要となります。それから、「標準的」な季節性と非常に似た方法で、Lokadは主に複数時系列分析によって類似の準季節性パターンを持つ時系列を検知し、パターン分析を精製しています。

プロモーション(販売促進)はどのように扱われていますか?

従来型の予測ツールではプロモーションは扱いません。その理由は裸の 時系列しか扱えないからです。Lokadは、高度な予測フレームワークを持ち、 タグとイベントを通してプロモーションを取り扱うことができます。ひとつのイベントタグ の集合です。ここではお客様によって任意のキーワードが選択されています。そしてこれらのタグ はある日付に位置しています。プロモーションは一般的に4つの域に分類してタグに関連付けられます:割引メカニズム、フェーシング(商品陳列)、パッケージング、コミュニケーションです。実際には、貴社システムから得られる情報量によってこの有用性は変わってきます。過去のプロモーションに関する記録情報がまったくない場合、弊社の予測技術ではこれらのプロモーションの急な山形曲線はノイズとしてとらえ、フィルターにかかってしまいます。しかし、いくつか でも情報があるとすれば、それがある/ないだけで表されるプロモーション・フラッグであっても、Lokadはこの情報を活用して貴社の販売履歴の予測を精錬できます。そして、プロモーションが将来行われる(イベントを通して)時、私たちのテクノロジーでは、過去に類似商品で類似したプロモーションをすべて調べ、これらのプロモーションが与える影響を推察します。

商品のライフ・サイクルと新商品の発売、これらはどのように扱われますか?

ほとんどの消費財にはライフ・サイクルがあります。新商品が発売され、成長し、最盛期を迎え、最終的にはマーケットから消えて行きます。Lokadは与えられた新商品の発売日を考慮して、新商品の売上げ予測を行うことができます。明らかに、商品が新らたに販売される時には予測を裏付けるためのその商品 に関する売上げデータはありません。しかし従来型の予測ツールとは異なり、Lokadはただ単に従来型の時系列予測をするのではありません。殊に、タグ を通して商品が説明されます。ひとつのタグは商品のどんな性質も表現できます:カテゴリー、準カテゴリー、族、ブランド、色、サイズ等です。新しく発売される商品の売上げを予測するために 、Lokadは過去の類似した商品の新規投入時の履歴を分析し、類似性は各商品で与えられたタグに基づいて評価されます。この方法はその他のライフ・サイクルパターンにも適用します。

間欠的需要品/少量生産品についてはどのように扱われていますか?

貴社が一年に一度だけ販売される商品を扱っている場合、統計予測はほとんど関与しません。実際に店舗にその商品を1個置くか0個にするかはマーケティング上の選択となります。しかしながら、スロームーブ商品とトップセラー商品の間では頻繁に売れない商品のグレーゾーン があり、これについては、やはり在庫管理と最適化が必要です。多くの従来型予測ツールでは、このような間欠的需要に十分に対応しているとは言えません。Lokadではこのタイプの需要パターンに対して努力を重ねてきました。なぜなら多くのビジネス、中でもeコマースでは 利益を出すためにこのようなロングテール商品(頻繁には売れない商品)に重点を置いているからです。しかし、スロームーブ商品は、慎重に管理をしなければトップセラー商品以上に在庫を抱えてしまいます。Lokadはスロームーブ商品を扱う際に、分位値予測を行うことをお勧めします。

カニバリゼーションについてはどのように扱っていますか?

カニバリゼーションは一般的にプロモーションの結果現われる現象です。プロモーションは自社プロモーションであったり競合他社の行うものであったりします。Lokadはプロモーションをイベント を通して扱います。一イベントは、そのイベントに関連する商品に主に影響しますが、そのイベントが他の商品に与える影響も分析します。私たちの経験から言えるのは、カニバリゼーションは商品Aが一つ売れることで商品Bが売れなくなるというような、1対1で対応するわけではないということです。カニバリゼーションは何十、何百という商品に与える緩やかな否定的相関関係と言えます。プロモーションごとにエンドユーザーにカニバリゼーションに当たる商品に関してアンケートを取るわけではなく、Lokadはカニバリゼーションを自動探知します。そして、当然Lokadが知りうる情報内のプロモーションということになるので、貴社の プロモーションということになります。他社のプロモーションについてはノイズとしてフィルターがけされます。

天候はどのように扱われていますか?

ある分野のビジネス、食糧品店などでは天気が非常に重要な需要ファクターとなります。現時点で、Lokadは天気予報を予測技術に活用していません。しかしながら、この点については弊社の中期的ロードマップとして考慮しています。弊社のゴールは天気データをサポートするだけでなく、そのプロセスを大きく自動化し、お客様がほぼなんの努力もせずに追加の精度を享受できるようにすることを目指しています。

需要アーティファクト

在庫切れによる売上げの損失についてはどう扱われますか?

売上げは需要と一致しません。在庫切れは本来の需要を歪めてしまう人為的結果となります。確かに、在庫切れは売上げを下げますが需要は保たれます。従来型の予測ツールとは異なり、Lokadでは在庫切れがなければ実現されただろう売上げを、履歴データで変更したり微調整したりする必要はありません。それに代わって、イベント によって在庫切れを示します。在庫切れ情報は、在庫切れにならなかった場合に受けたであろう影響(季節性、トレンド等)すべてのパターンをより正確に予測する為に使われます。もし在庫切れがイベントとしてフラッグされない場合は、Lokadではこれらのパターンはノイズとして処理されます。在庫切れを記録するのはいいことですが、Lokadを始めるのなら必要条件ではありません。

例外的な売上げはどのように扱われますか?

業界によっては、例外的な売上げに直面する場合があります。これらの売上げは規模について例外的であると言えるので、純統計的アプローチでは割と簡単に見つけることができます。よってこれらの例外的売上げを履歴データ上で消去しないことをお勧めします。ひとつには、それは時間の浪費であること。そして二つ目には、例外的売上げ自体が需要を予測するにあたって価値ある情報である場合があるからです。そしてLokadは個々の将来に起こる例外的売上げを予測できません(これは、例えば交渉の結果として起こるかもしれないからです)。もし事前に例外的売上げが分かっている場合は、この追加情報をLokad予測に手入力で上乗せさせることを推奨します。

集約は、トップダウンですか、ボトムアップですか?

ある企業は需要をグループまたはカテゴリーで予測し、これらの予測を個々の商品に振り分ける方法を取ります。これは商品トップダウン 予測メソッドです。同じ考え方を予測頻度に適用することができます。例えばある企業は週ベースに予測を行い、その後曜日係数に適用させます。このケースは頻度トップダウン 予測メソッドとなります。逆に、週ベース予測は日々の予測の集計として作成可能です。Lokadでは、お客様の営業ニーズに最もマッチする 予測を推奨しています。例えば、供給プロセスが個々の商品について週ベースの予測が必要なら、Lokadに各商品の週予測をリクエストしてください。日々の予測を依頼して、それからその予測を集計しても精度は改善されません。同様の考え方で、Lokadに商品グループレベルで売上げ依頼をして、その後手入力で各SKUを仕分けるというのはお勧めしません。なぜなら、深刻な予測エラーが仕訳作業の際に発生する可能性が大きいからです。Lokadは、内部で集約/分割アルゴリズムを使っており、一般的に最もキメの細かいデータを活用することを好みます。確かにひと月はビジネスに大きな影響を与える週末が4~5回あります。これもいつもと同じく、集約レベルについてのご心配は無用です。すべてLokadがお客様のご希望に応じて対応いたします。

ビデオ

Video explains how forecast accuracy can be assessed, and how the accuracy of different forecasts should be compared