00:00:05 季節ごとの販売予測.
00:00:35 主要な季節性パターンの解説.
00:02:23 季節性予測の難しさ、製品寿命.
00:04:33 季節性に関する更なる問題点の検討.
00:06:53 不足している履歴データの問題の克服.
00:07:16 解決策:季節性のために製品群を考慮する.
00:08:49 動的時間伸縮法.
00:09:06 予測のためのディープラーニングへの移行.
00:10:02 需要予測における動的時間伸縮法.
00:12:09 履歴データの急増とプロモーションへの対応.
00:13:01 正確なデータと機械学習の必要性.
00:16:01 機械学習におけるディープラーニングの人気.
00:16:30 将来の予測に対する過去データの限界.
00:17:40 モデリングのための人間活動における季節性.
00:19:42 機械学習による予測の改善.
00:21:39 時間の経過とともに得られる機械学習の利点.
概要
インタビューで、Joannes Vermorelは販売予測に季節性を取り入れる際の課題について議論しています。季節性とは、年間、週、日によって影響を受ける周期的な販売パターンを意味し、需要の変動に寄与します。『ペイチェック効果』や『準季節性』のような二次的な周期性も重要です。需要の基準、トレンド、統計的ノイズを理解することが正確な予測に役立ちます。課題として、多くの製品の短い寿命や、クリスマスなどのイベントの年間変動が挙げられます。Vermorelは、同様の製品に対して集合的な視点を採用し、新製品のパフォーマンスを予測すること、そして季節ごとのバケットを自動管理するために機械学習のセットアップを使用することを提案しています.
詳細な概要
Kieran Chandlerは、販売予測における季節性の概念とそれに伴う課題について、Joannes Vermorelにインタビューしています.
季節性は、販売予測の精度を高めるために使われる主要なパターンの一つですが、しばしば誤解され、不適切に適用されることがあります。Vermorelは、季節性を販売パターンにおける主要な周期性として認識しています。彼はこれらの周期性を、年間、週、日の三つの主要なタイプに分け、すべてが消費者需要の変動に寄与していると述べています.
Vermorelはまた、『ペイチェック効果』のような二次的な周期性についても議論しています。これは、人々が給与を受け取る月ごとのサイクルと、それが購買行動に与える影響を表しています。さらに、彼は『ミネラル周期性』または『準季節性』として、復活祭、ラマダン、旧正月など、年ごとに繰り返し起こるが、必ずしもグレゴリオ暦に従って同じ日に発生するわけではないイベントを紹介しています.
需要の基準、トレンド、そしてデータ中の統計的ノイズのレベルを理解することは、Vermorelが強調するもう一つの重要な側面です。これらのパターンを認識することは、ランダムなノイズと実際の統計パターンを区別するのに役立ち、効果的な予測には不可欠です.
一見単純に見える季節性ですが、Vermorelはなぜ多くの人がそれに苦労するのかを語ります。最初の課題は、市場に出回る多くの製品が短命であることです。例えば、FMCG製品の平均寿命は3年から5年程度です。これは、製品カタログの大部分が丸一年存在していない可能性を示唆し、季節性の適用を複雑にします.
Vermorelは季節性における『時間の歪み』という概念を紹介し、様々な要因による季節パターンのシフトを指摘します。気象パターンの変化は、消費者が通常よりも早く、あるいは遅く冬の買い物を始める要因となり得ます。政治的な気候や消費者の感情も、クリスマスショッピングなどの購買タイミングに影響を与えることがあります。これらの変化は、典型的な季節パターンを歪め、予測を困難にします.
次に、彼は季節性に対する追加的なパターンの干渉について語ります。Vermorelは、これらの外部要因と本当の季節トレンドを区別する重要性を強調します。また、カタログの大部分における履歴データの欠如が引き起こす課題にどのように対処するかについて詳しく述べます。彼は、同様の製品群全体に共通する季節パターンを特定する集合的な視点を提案します。この共有パターンは、販売履歴がない製品に対しても、初日から季節性予測を可能にします.
不確実な天候条件下での予測に関する質問に答え、Vermorelは動的時間伸縮法の概念を示します。しかし、彼は動的時間伸縮法の実装が非常に複雑であると認め、その結果、音声認識コミュニティと同様にLokadも予測エンジンにディープラーニングを採用することになったと述べています.
季節需要とプロモーション時の急増を区別するため、Vermorelはパラメトリック分解アプローチを提案します。しかし、彼は履歴データが通常複雑に絡み合っているため、個々のパターンを独立して学習することが困難であるという、この手法の限界を認識しています.
これに対処するため、Vermorelは二つの戦略を提案します。第一に、プロモーションや品切れなど、需要の観測を歪めるすべてのイベントやその他の販売に影響を及ぼす要因を記録すること。第二に、これらのパターンを個別に学習しようとするのではなく、機械学習のセットアップを用いてこれらすべてのパターンを共同で学習することです。これが、機械学習コミュニティでディープラーニングが人気を博している理由であると彼は示唆しています.
Vermorelは、データの歪みにより結果に対する完全な信頼を持つことが難しいと認めています。しかし、彼はほとんどの市場には大きな慣性があり、直近の過去が近い将来の妥当な近似値であると主張しています.
また、彼は需要予測における季節性の重要性を強調し、その安定性を認めつつも固定的でないことを指摘しています。つまり、季節性は年々進化する可能性があり、良い統計モデルは
この平均的な進化率を予測できるものでなければなりません.
会話の締めくくりとして、Vermorelは、予測手法を改善し季節性をより適切に考慮したい企業に対して、手動で季節性プロファイルを作成する従来の方法から脱却し、機械学習のセットアップへ移行することを推奨しています。機械学習は季節ごとのバケットの自動管理を可能にし、時間の経過とともに予測精度を向上させます.
完全なトランスクリプト
Kieran Chandler: Joannes、私たちは予測の精度向上のための主要なパターンの一つとして季節性についてよく話します。しかし、これが具体的に何を意味するのでしょうか?その主要なパターンとは何ですか?
Joannes Vermorel: 季節性は主要な周期パターンの一つです。年間、週、日の3つの主要なサイクルが存在します。次に、給与受取や月初・月末の出来事により生じる、月次の周期である『ペイチェック効果』などの二次的な周期があります。さらに、私が『準季節性』と呼ぶもの、例えば復活祭、ラマダン、旧正月などもあります。これらのイベントは毎年起こりますが、少なくともグレゴリオ暦によると、必ずしも同じ時期に起こるわけではありません。これらすべての周期的パターンの中で、季節性は非常に重要なものです。周期以外にも、需要のベースラインや、物事がどれだけ成長または縮小しているかというトレンド、そしてかなり大きなパターンである統計的ノイズがあります。変動性を十分に理解し、目に見えるものがノイズなのか、あるいは実際の統計的パターンなのかを判断する必要があります.
Kieran Chandler: では、季節性そのものについて話しましょう。なぜ人々はこれに苦労するのでしょうか?クリスマスになると売上が急増し、祝祭シーズンには様々な製品の売上が異なることは明らかですが、なぜ苦労するのでしょうか?
Joannes Vermorel: 季節性を正確に把握するのは難しいです。まず課題を見てみましょう。第一の課題は、市場に出回るほとんどの製品が短命であることです。FMCG製品の平均寿命は3年から5年程度です。つまり、平均して3年間存在する製品を販売している場合、製品の半数はわずか1年半しか存在せず、さらに三分の一の製品は1年未満です。そのため、次のクリスマスの売上が前回のクリスマスと同様になるという単純な季節モデル(統計モデル)を立てようとしても、製品の三分の一には前回のクリスマスが存在しない、つまり参照がないのです。市場における製品の新規性のため、カタログのかなりの部分が丸一年のデータを持たないというのが第一の課題です。例えば、自動車部品のように寿命が約6年と長い製品であっても、製品の六分の一は1年分の売上データさえ存在しません。したがって、カタログのかなりの部分にこの優れた季節性パターンを適用することはできないのです。これが季節性において直面する問題の一つです.
Kieran Chandler: 他に季節性に関して直面する問題は何ですか?
Joannes Vermorel: 別の問題は、季節性が年ごとに必ずしも全く同じでないということです。確かに、クリスマスは毎年12月25日ですが、商人の視点から見ると、年ごとにクリスマスシーズンには違いが生じます.
Kieran Chandler: ある年は10月にも非常に寒くなり、人々が早めに冬の買い物を始める一方で、温暖な年には買い物を遅らせる傾向もあります。時には、政治情勢が購買習慣に影響を与えることもあります。例えば、人々が将来に対して非常に不安を感じれば、クリスマスの買い物を最後の一瞬まで先延ばしにするかもしれません。これらはすべて、いわゆる「時間の歪み」を引き起こす要因の一部にすぎません。例として、クリスマスピークは依然として存在しますが、クリスマスシーズンの開始時期が年ごとに数週間ずれる可能性があります。このような歪みはすべての季節パターンで起こり得るものです。そう思いませんか?
Joannes Vermorel: その通りで、これがおそらく第二の問題点です。第三の問題は、季節性が他のパターンに影響されてしまうことです。例えば、昨年9月に大規模なプロモーションがあったとしても、今年それが再現されない場合、そのプロモーションの効果を季節性と混同すべきではありません。季節性と他のパターンを切り離して考える必要があります。これらすべての変化が、長寿命で安定しておりすべてが順調に機能する製品における純粋な季節性の状況と比べて、季節性をはるかに捉えにくくしているのです.
Kieran Chandler: では、これらの問題を克服する方法について話しましょう。例えば、カタログの三分の一しか履歴データがない場合、その製品に対して実際に季節性を利用した予測は可能でしょうか?
Joannes Vermorel: はい、しかし、製品を個々に見るのではなく、コレクション全体として捉え始める必要があります。例えば、冬用ブーツを考えてみてください。これらの製品には共通の季節パターンが存在するはずです。共通の季節性が存在すると合理的に仮定できます。したがって、この共通の季節性を特定できれば、今年販売している冬用ブーツが昨年のものと異なっていても問題ありません。つまり、「冬用ブーツ全体としてこのパターンがある」と言えるのです。こうして、全く売上履歴のない新製品を市場に投入する場合でも、初日から季節性パターンを適用することができます。重要なのは、履歴の深さではなく、製品の幅広さを見ることです.
Kieran Chandler: 数ヶ月先を予測する場合、夏が1ヶ月延長されるかどうかをどのように把握し、予測するのでしょうか?
Joannes Vermorel: ここで次の段階、すなわちすべての歪みに対処する方法に入ります。それは、動的時間伸縮法と呼ばれる技術を用いて解析的に実施することができます。興味があればWikipediaで調べると良いでしょう。動的時間伸縮法の実装は、ソフトウェア面で非常に複雑です。約10年前、音声認識のための機械学習を行っていたコミュニティは、動的時間伸縮法に対処しなければならなかったのですが、その複雑さにより断念し、ディープラーニングに移行しました。興味深いことに、Lokadも季節性に関して全く同じことを行いました。私たちは予測エンジンに動的時間伸縮法を実装しましたが、最終的には最新世代の予測エンジンでディープラーニングに置き換えました.
Kieran Chandler: 時間伸縮、とてもSFのように聞こえますね。簡単な概要を教えていただけますか?
Joannes Vermorel: 概要としては、季節がもうすぐ終わることは分かっているが、正確な時期は分からないということです。しかし、その変動性を考慮することができます.
Kieran Chandler: シーズンが終了したため、需要は継続するものの大幅に低下することは分かっています。しかし、動的時間伸縮法のような方法を使わない季節性分析はどのようなものになるのでしょうか?もしシーズンが早期に終了した場合、どうなりますか?
Joannes Vermorel: シーズンが早めに終わると、新たな基準値やレベルが設定され、季節性のプロフィールに従って、12月の最初の週の需要は8月の最終週の半分程度になるはずです。これが静的で固定的なプロフィールです。しかし、問題は、夏が早く終わり、8月の最終週には既に夏のシーズンが終了している場合、9月の最初の週に再び需要を2で割る必要はないということです。なぜなら、8月の最終週から9月の最初の週にかけて需要は低下しており、すでに需要が落ち込んでいる状況だからです。
ダイナミック・タイムワーピングは、シーズン開始が遅れたり早まったりして季節性のプロフィールを二重に適用してしまう場合に、累積誤差を避けるための手法です。最初に需要が落ち、その後、季節パターンを再適用するとさらなる低下が生じるか、または逆に、シーズンが早く始まったために需要が新たな定着レベルに上昇しており、その上に同じ係数が再適用されるという状況を防ぐことができます。ダイナミック・タイムワーピングは、シーズン間の移行をより正確に予測するわけではありませんが、こうした累積誤差を回避するのに役立ちます。
Kieran Chandler: つまり、需要のプロフィール自体は同じものになるのですが、シーズンによって圧縮されたり伸びたりするということですか?
Joannes Vermorel: その通りです。
Kieran Chandler: そして、最後に話したのは、過去のデータに見られる急上昇のピークと、今年の季節性にはそのピークを反映させないという点でした。これを実際にはどのように実現するのですか?それらをどうやって考慮から外すのですか?何が季節的な需要で、何がプロモーションなどによる一時的なピークなのか、どのように区別するのですか?
Joannes Vermorel: 時系列予測の従来のアプローチはパラメトリック分解です。需要の履歴から、ある部分は基準値、ある部分は季節性要因、またある部分はトレンドで説明できる、といった具合に需要を分解します。この手法は、すべてのパターンを独立して学習したいという点で弱点がありますが、実際の履歴データでは、すべてが完全に混ざり合っているのが現実です。
この問題には少なくとも二つの観点があります。まず、歴史的データにおいて、プロモーションや在庫切れ、そして需要そのものではなく需要の観測値である売上に影響を及ぼしたすべてのイベントを正確に記録する必要があります。売上は需要と同義ではありません。たとえば、予測を行う際、通常は「通常価格での需要を予測したい、超低価格のプロモーション時の需要は予測したくない」と考えます。しかし、履歴に記録されているのは売上であり、売上はプロモーションや場合によっては在庫切れなどの影響で歪んでしまうのです。
したがって、最初に行うべきことは、需要の認識を歪めたすべての要因を記録することです。これは言うは易く行うは難しく、実際に売上に影響を与えたすべてのイベントを非常に正確に記録している企業はほとんどありません。たとえば、eコマース企業であれば、商品がホームページに掲載されていたか、特集のセクションに prominently featured(強調表示)されていたか、ニュースレターに掲載されていたか、商品の価格変動があったか、さらには競合他社の競争環境情報として、競合商品の価格を記録していたか、などが考えられます。
Kieran Chandler: 在庫切れによるのではなく、競合他社が大規模なプロモーションを行い、自社がその価格に合わせなかったために需要が低下したということを言及されましたね。それが需要低下の原因を説明することになるのでしょう。
Joannes Vermorel: はい、それが一つの要素です。もう一つは、これらすべてのパターンを統合的に学習できる機械学習の仕組みが必要だという点です。現代の機械学習は、統計的パターンを個別に学習しようとはせず、まず季節性、次にトレンド、そしてプロモーション効果というように逐次学習するのではありません。代わりに、一度にこれらすべてのパターンを捉えようとするモデルを用います。つまり、モデルは幅広いパターンを学習する能力、すなわち非常に表現力の高いモデルが必要となります。だからこそ、多くの機械学習コミュニティの人々がディープラーニングを採用しているのです。このアプローチにより、幅広いパターンを捉えることができるモデルが生成されます。
Kieran Chandler: 歪みについて何度も言及されますが、データが歪む可能性は非常に多く、季節性の実装が非常に難しくなるように思えます。データの歪みの可能性を考えると、結果に完全に信頼を置くことは本当に可能なのでしょうか?
Joannes Vermorel: もちろんです。問題は、過去がどれだけ未来を予測する材料になるか、という点です。これが統計的需要予測の基本的な前提です。残念ながら、未来は常に過去から予測できるとは限りません。しかし、数ヶ月先の予測に関しては例外で、ほとんどの市場には大きな慣性があり、直近の過去は近い未来の合理的な近似と見なせるのです。これが我々が活用している考え方です。
季節性のパターンは比較的強固です。あらゆる人間の活動に見られ、すべてがこの年間サイクルに従っています。これは何千年も前から変わらない現象かもしれません。人間は習慣の生き物であり、その強い習慣はほぼすべての人間活動を示す時系列データに反映されています。
例えば、飛行機の乗客数は年間のサイクルに沿って変動します。ある特定の日に購入される牛乳の量にも季節性の曲線が現れます。ビデオゲームの購入、電力消費なども同様です。
これらのパターンは非常に安定しており、活用することができます。しかし、未来については常に取り除くことのできない 不確実性 が存在します。
Kieran Chandler: 供給チェーン最適化における確率論的アプローチについて議論してきましたが、私の理解では、この手法は季節性にも対応できるとのことです。年度ごとの季節パターンの変化にはどのように対処しているのか、詳しく教えていただけますか?
Joannes Vermorel: もちろんです。我々の統計モデルは、変化する季節性に適応するように設計されています。正確な変化を予測できなくても、進化の平均的な速度を予測することは可能です。これにより、予測に適切な不確実性を盛り込むことができます。これらの予測は季節パターンを取り入れた確率分布であることを忘れてはなりませんが、完全な表現ではなく、振幅に関してはある程度のあいまいさが存在します。ピークシーズン中の上昇率やピークのタイミング、その両方の要因を考慮しているのです。
Kieran Chandler: 非常に理にかなっていますね。締めくくりに、特に季節性に関して、企業が予測手法を改善するために取るべきステップについて教えていただけますか?
Joannes Vermorel: まず思い浮かぶのは、ぜひLokadにご連絡いただくことです!冗談はさておき、最も重要なステップは機械学習の仕組みへの移行だと思います。従来の季節性管理アプローチは、手動で季節性プロフィールを作成するというものです。つまり、共通する季節性に基づいて製品をグループ分けするのですが、この方法は人間の入力に大きく依存しており、時間とともに維持するのが困難になります。
Kieran Chandler: この従来のアプローチの問題点について、もう少し詳しく説明していただけますか?
Joannes Vermorel: もちろんです。主な問題は、専門家の仮定が必ずしも間違っているというわけではありません。供給チェーンの専門家は、ある製品群が同じ季節性を持つと正確に判断できるかもしれません。しかし、問題は時間の経過とともにこのシステムの維持が非常に困難になる点にあります。新製品を発売するたびに、その製品が正しいグループに分類されるよう管理しなければならず、初期のクラスタリングがいくら優れていても、次第に劣化し効率が悪くなってしまいます。
Kieran Chandler: では、機械学習への移行はどのようにこの問題を解決するのですか?
Joannes Vermorel: 機械学習の仕組みを取り入れることで、季節性のグループ分けを自動的に維持することが可能になります。これにより、たとえ完璧ではなくとも、時間の経過とともにグループが劣化することを防ぎ、精度を大幅に向上させることができます。必要なときに毎回再生成されるため、安定して機能します。
Kieran Chandler: とても貴重な見解をありがとうございます。残念ながら、今日はこれで締めさせていただきます。お時間をいただきありがとうございました、Joannes。
Joannes Vermorel: どういたしまして。こちらこそ光栄です。
Kieran Chandler: 以上で今週は終了です。来週もまた新たなエピソードでお会いしましょう。それでは、皆さんご視聴いただきありがとうございました。