00:00:06 最適化プロジェクトにおけるデータの重要性とデータの神話の検証。
00:01:50 偶発的なデータ収集と異なるシステムからのデータ利用の課題。
00:03:39 時系列データの制約とトランザクションの詳細度の重要性。
00:06:18 予測のためのより良くてより関連性のあるデータの必要性。
00:07:26 実践的な例:小売チェーンにおける在庫最適化とトランザクションデータの重要性。
00:10:01 トランザクションレイヤーと歴史的データ収集におけるデータストレージの役割。
00:11:38 ERPシステムの移行と予測プロセスの改善の必要性。
00:13:37 データクレンジングの欠点とフルスペクトラムデータの重要性。
00:15:20 サプライチェーンオペレーションにおけるコンピュータシステムの利用とデータの正確性。
00:17:31 予測における在庫レベルと返品の考慮の重要性。
00:19:24 ドメイン固有の視点に基づいた予測アプローチの適応。
00:21:46 より良いデータの重要性の理解と関連データの範囲の拡大。
00:24:48 データ生成の明確な理解とより良い予測の実現。

要約

キエラン・チャンドラーがLokadの創設者であるジョアネス・ヴェルモレルに、サプライチェーン最適化におけるデータ収集の重要性についてインタビューします。ヴェルモレルは、企業が最適化の目的で意図的にではなく、偶発的にデータを収集することが多いと指摘し、このデータは予測と最適化プロセスにおいて依然として有用であると述べています。彼は詳細なデータの重要性を強調し、データを時系列に集約することで貴重な情報が失われる可能性があると述べています。ヴェルモレルは企業に対して、生のトランザクションデータとドメイン固有の視点でサプライチェーンの課題に取り組むようアドバイスしています。この対話では、価格設定や返品、バックオーダー、在庫の動きなどの要素を予測プロセスに考慮する重要性も触れられています。

詳細な要約

ホストのキエラン・チャンドラーがLokadの創設者であるジョアネス・ヴェルモレルとデータ収集の重要性とサプライチェーン最適化における役割について議論します。彼らは、データが機械が処理できるために完璧である必要があるという神話に取り組み、企業がデータ収集プロセスを改善する方法について探求します。

ヴェルモレルは、企業のほとんどが最適化の目的で意図的にではなく、トランザクションシステムの副産物としてデータを偶発的に収集していると指摘します。ERPやPOSデバイスなどのシステムは、当初は日常業務を効率化するために設計されたものであり、包括的なトランザクション履歴を収集することを目的としていませんでした。しかし、この偶発的なデータ収集は、予測と最適化プロセスの基盤として依然として役立つことがあります。

チャンドラーは、企業内にはまだ活用されていないデータの埋もれた宝庫があるのかという疑問を投げかけます。ヴェルモレルは、企業システムが生成するデータはしばしば複雑で解釈が難しいと説明し、それはITシステムの内部動作よりも現実のプロセスをより正確に反映しています。企業が予測プロセスを実装しようとするとき、彼らはしばしば日次や週次の売上など、このデータの簡略化されたバージョンを抽出します。しかし、この簡略化は、ビジネスとその運営に関する重要な情報の喪失につながる可能性があります。

データの粒度は重要な懸念事項であり、集計されたデータでは効果的な予測と最適化のための十分な洞察を提供しない場合があります。ヴェルモレルは、企業が生データを簡略化したバージョンに変換すると、供給チェーンの最適化に有益な大量の情報が失われると主張しています。

インタビューでは、供給チェーンの最適化におけるデータ収集の重要性について議論し、企業が収集したデータを利用する際に直接的に直面する課題に焦点を当てています。会話では、完璧なデータは効果的な予測と最適化の前提条件ではないと強調されていますが、企業がデータを収集し、処理し、分析する方法には改善の余地があることも認識されています。

彼らは、供給チェーンの最適化において粒度の細かいデータを扱うことの課題と重要性について議論しています。

ヴェルモレルは、多くの企業がデータを時系列に集約していると説明し、これによりデータが1日ごとに単一の数値に簡略化されます。この方法は扱いやすいですが、情報を的確に把握するためには関連性がないか役に立たない場合があります。彼は、より良い予測と供給チェーンの最適化は、実際のビジネス運営に関する文脈と洞察を提供するトランザクションレベルのデータを使用することで実現できると主張しています。

インタビューでは、集計されたデータを扱う際のいくつかの落とし穴にも触れており、それが企業が重要なシナリオを見逃す原因になることがあります。たとえば、小売チェーンのシナリオでは、ヴェルモレルはデータの集約が流通センターレベルの需要を誤解する原因になる例を説明しています。データを時系列に処理することで、企業は曖昧さを排除しますが、これは有利な面と不利な面の両方を持つ可能性があります。つまり、彼らはビジネス運営について誤った仮定をする可能性があります。

会話ではまた、歴史的なデータに触れ、多くの企業が異なるERPシステム間の移行時に貴重な情報を失っていることを取り上げています。過去には、データの保存は優先されず、ERPシステムの目的は企業のスムーズな運営を支援することでした。また、データの保存は高価であり、さまざまな方法でデータを削除するためのヒューリスティックスが実装されました。しかし、現在ではデータの保存は比較的安価になっており、データの保存がより実現可能になっています。

ヴェルモレルは、Lokadが企業と協力する際に、既存の予測プロセスが供給チェーンの最適化の適切な出発点ではないことがよくあると強調しています。これは、トランザクションデータを時系列に単純化することで関連情報の多くが失われているためです。代わりに、企業は供給チェーンプロセスを最適化するために、生のトランザクションデータを扱うことに焦点を当てるべきだと提案しています。

最後に、インタビューではデータクレンジングの話題も取り上げています。ヴェルモレルは、生のトランザクションデータは既に彼らの目的には十分にクリーンであると主張し、“データクレンジング"という概念はしばしばデータを時系列に単純化することを指し、会社の運営の真の性質を理解するのに役立たない場合があると述べています。

ヴェルモレルは、企業がデータを限定的な方法でしか見ない場合、たとえば緑の色合いのみを考慮する場合、彼らの世界の理解が制限されると説明します。彼は、データは本質的に間違っているのではなく、むしろ企業のプロセスを反映していると指摘します。企業はデータをそのまま受け入れ、より良い予測を行うために活用する必要があります。

ヴェルモレルはさらに、企業は自社のシステムが元々データを生成するためではなく、供給チェーンを運営するために設計されたものであることを認識すべきだと述べています。企業が請求書、支払い、その他の文書を持っていることは、彼らのデータが大部分が正しいことの証拠です。しかし、予測に関しては、企業はしばしば価格、返品、在庫レベルなどの重要な要素を見落とします。

価格は需要と供給チェーンに大きな影響を与えます。企業が予測プロセスを見直すと、通常、価格が欠落していることがわかります。これは氷山の一角に過ぎません。返品や在庫レベルなどの要素もしばしば欠落しています。ヴェルモレルは、在庫レベルの理解が重要であると説明し、在庫がなければ売上もありません。同様に、バックオーダーは通常の需要と同じように扱われるべきではない、ユニークな需要を表しています。

ヴェルモレルは、企業が業界固有の視点でサプライチェーンの問題に取り組むことを勧めています。彼らは自分たちの業界に最も関連性のある要素を考慮し、それに焦点を当てるべきです。たとえば、航空宇宙では、投資を最適化することにより、地上での航空機のインシデント(AOG)を最小限に抑えることが目標です。一方、生鮮食品小売業では、商品の入手可能性と新鮮さを確保することにより、長期的な顧客の忠誠心を最大化することに焦点を当てるべきです。

彼らは、過去のデータを完璧にすることや集約することに焦点を当てる代わりに、ヴェルモレルは価格、返品、バックオーダー、在庫の動向などの日常的な側面を考慮することで関連データの範囲を拡大することを提案しています。彼は、データがどのように生成されるかを理解することが重要であり、「ゴミを入れればゴミが出る」という状況を避けるために、データの生成方法を理解することを強調しています。ヴェルモレルはまた、より良い予測はドルで測定され、パーセンテージベースの指標に頼るのではなく、より良い意思決定に結び付けられるべきだと主張しています。

フルトランスクリプト

キーラン・チャンドラー: 今日は、企業が既にデータを収集している場合、それを改善し、データが機械で処理されるために完璧でなければならないという神話に取り組む方法について話し合います。では、ジョアネスさん、企業が既にデータを収集している場合、実際にできることはそれほど多いのでしょうか?

ジョアネス・ヴェルモレル: はい、まず理解するべきことは、ほとんどの企業がデータを収集しているが、完全に偶然的な方法で収集しているということです。データを収集することが意図されていたわけではなく、単に運用することが意図されていました。たとえば、ERPはデータを収集するために設計されたものではなく、会社で常に起こっている非常に日常的な操作が、集中化されたITシステムのサポートを受けて行われるようにするために設計されています。店舗の販売時に電子的なレジがあるのも、支払いをより速く行うためのものです。システムは実際には、すべての領収書のトランザクション履歴を完全に収集するためにエンジニアリングされたり導入されたりしたわけではありません。これらのシステムが長い間データを収集してきたため、企業は多くのデータを持っているのですが、最適化のために自然に設計されたものではありません。したがって、データはたくさんあり、通常、過去数十年間にわたって予測や最適化のプロセスがそれに上乗せされてきました。しかし、改善の余地は非常に大きいということです。

キーラン・チャンドラー: 企業が最初に始めたときにデータを収集するつもりはなかった場合、どこかに保管されているデータの宝庫があるということでしょうか?それについてはあまり考えられていないのでしょうか?

ジョアネス・ヴェルモレル: 問題は、通常、データは意図的に収集されていないことです。それは単なる副産物であり、トランザクションシステムのアーティファクトです。それは正確には乱雑ではありません。通常の企業システムで生成されるデータを見ると、非常に異質なものです。それは現実世界を模倣しているわけではなく、通常はITシステムの内部の配管に関係しています。その結果、大規模な組織の人々が新しいプロセス(例えばERPプロセス)を開始し、予測を行いたい場合、非常に奇妙で異質なデータが生成され、予測の課題とは何の関係もない偶発的な複雑さがたくさん含まれています。通常、企業はこのデータの非常に簡略化されたバージョンを抽出し、その上に日次売上や週次売上などを構築します。ここにはさまざまな問題があります。このデータが日次売上や週次売上として抽出されると、非常に重要な情報が大幅に失われます。これはシンプルで合理的に見えるが、実際にはビジネスの状況に関する大量の情報が失われてしまいます。

キーラン・チャンドラー: しかし、そのデータはどれくらい詳細である必要がありますか?20年以上データを収集している企業を見ている場合、そのデータを集約することで管理が容易になるのではないでしょうか?管理するために、つまりデータを集約すると、通常、データを時系列でうまく扱えるように再フォーマットします。そして、はい、時系列はとても便利です。1日ごとに1つの数字、まさにそうです。したがって、1日ごとに1つの数字の系列があり、それを将来に引きずり込みたいと思います。非常にシンプルです。移動平均から始まる非常に素敵なモデルがたくさんあります。しかし、問題は、それが簡単だからといって、実際には関連性があるわけではないということです。それが問題です。その方法でやるのは非常に簡単ですが、それが企業にとって実際に関連性があるということではありません。

ジョアネス・ヴェルモレル: それが危険です。問題は、人々が「ああ、より詳細なデータが必要なので、月次データから週次データに移行する必要がある」と考えることです。それは単に集計の時間枠を変更するだけです。彼らは「ああ、もっと良くすれば、時間ごとのデータに移行するだろう」と言うでしょう。それは全く問題ではありません。問題は、時系列データを考えるときに、既にデータが実際に存在する方法とはまったく異なる方法で問題を構築していることです。あなたのシステムでは、時系列というものは存在しません。重要なのは、トランザクションの粒度でデータを持つことです。なぜなら、それはより多くの情報を提供するからです。より良いデータでより良い予測をしたい場合、私たちの経験では、関連情報が既に失われてしまった非常に簡略化されたバージョンではなく、ITシステム内の実際の状況に非常に近づくことが重要です。

キーラン・チャンドラー: つまり、関連情報が失われ、実際に見ているデータは少し誤解を招く可能性があるということですね。見逃している可能性のあるシナリオはどのようなものですか?

ジョアネス・ヴェルモレル: 通常、それらは非常にありふれたものであり、人々はそれらについてすら忘れてしまうことがあります。例えば、食料品店のような小売チェーンを考えてみましょう。配布センターのシリーズがあるとしましょう。各配布センターは、20のスーパーマーケットなどを提供しています。どのように見えるでしょうか、このようなものは?最適化の立場を取ると、配布センターの在庫を最適化することになります。したがって、例えばスーパーマーケットのために何かの100ユニットを注文すると、配布センターでは2つのことが起こります。注文を履行し、通常は翌日に100ユニットを出荷するか、注文を履行しない場合があります。その場合、店舗は100ユニットの注文を出し、配布センターは何も送らないのです。そして、翌日、同じ店舗がさらに150ユニットの注文を出します。

さて、問題は、これら2日間の配布センターレベルでの需要を認識する場合、需要はどれくらいなのでしょうか?100ユニットプラス150ユニットですか?しかし、それは違うように感じます。なぜなら、2日目に店舗が150ユニットの注文を出す理由は、前日の100ユニットの注文が履行されなかったためです。つまり、前日の履行されなかった日の需要ともう1日分をカバーする必要があるため、より多く注文することになります。しかし、需要が250ユニットであると考えるのは間違いです。実際には、初期の100ユニットは完全に破棄すべきですので、合計需要は150ユニットだけで十分かもしれません。しかし、現実は複雑な場合もあります。

キーラン・チャンドラー: 時系列を作成し始めると、この情報は失われ、存在する曖昧さがすべてなくなります。すべての曖昧さが排除され、それは良いことと言えるでしょう。突然、私は曖昧さのないデータでデータサイエンティストに取り組むことができます。しかし、はいといいえ、曖昧さを取り除くことによって、すでにビジネスの運営方法についての声明を出してしまったという問題があります。そして、この声明は非常に間違っている可能性があります。

ジョアネス・ヴェルモレル: 企業が古いデータを集約する理由の1つは、古いERPシステムから新しいものに移行する可能性があるためです。ですので、そのすべての歴史的な情報を新しいERPシステムに再インポートすることは本当に有用なのでしょうか?最初に、私たちが今日「ヤッピー」と呼ぶものについて話していたとき、ルーチンの操作を管理するトランザクションレイヤーの目標は、歴史的なデータを収集することではありませんでした。すべてが始まったとき、つまり70年代後半または80年代のことですが、データの保存は目標ではなく、当時は単に会社の運営をスムーズにするためだけでした。

当時のコンピューティングハードウェアは、現在と比べて非常に高価であり、特にデータストレージも非常に高価であったため、多くのソフトウェアベンダーは当時正しいことをしました。彼らはヒューリスティックスのツールを実装して、さまざまな方法でデータを取り除きました。私は現在のことを話しているのではなく、それらのヒューリスティックスのほとんどまたはそれらのシステムのほとんどはもはや意味をなさないのです。なぜなら、データストレージはすでに非常に安価になっているからです。

キーラン・チャンドラー: では、これらの企業はどこかでデータクレンジングを行うべきなのでしょうか?それとも、生データをそのままにしておくべきだと言っているのですか?

ジョアネス・ヴェルモレル: データはすでにクリーンです。問題は、データクレンジングとは何を意味するのかです。もしも私があなたに問題が、世界の良い正確なイメージを持ちたいと言った場合、そして何らかの理由で、あなたが世界を見る方法はただ緑の色合いだけを見ることだと決めた場合、どうでしょうか。つまり、緑の色合いだけを取る写真があり、緑でないものはただ黒くなるだけです。それはまったく見えないのです。そして、より緑に近いものは、緑の色合いがあり、それがあなたの世界の写真です。

明らかに、「データクレンジングを行う必要があると思います。この写真は非常に正確ではありません。改善する必要があるかもしれません。」と言うでしょう。しかし、あなたは全体の色のスペクトルが必要です。問題は緑の色合いではなく、クレンジングする必要はありません。あなたの写真はただのものです。問題は、より良い世界の写真を持ちたい場合、全体の色のスペクトルが必要なことです。

Kieran Chandler: したがって、より良い予測をするためには、まず会社をそのまま見ることから始めるべきです。データは間違っているわけではなく、ただ存在しているだけです。私が言いたいのは、データの生成はすべてのシステムの最初の目的ではなかったということです。システムは、サプライチェーンが運営できるように、製品を生産し、移動し、販売することができるようにするために導入されました。したがって、あなたが持っているすべてのレイヤーは、それらのプロセスの反映にすぎません。それはまったく問題ありません。請求書や支払いなどの存在は、このデータが大部分が正しいことを証明しています。非常に正確ではありませんが、そうでなければ、請求書を作成することができず、サプライヤーにいくら支払うかわからないでしょう。

したがって、ほとんどの企業にとって、少なくとも数十年間コンピュータシステムを使用している企業にとっては、ヨーロッパ、北米、そして実際にはアジアのほとんどの地域で、すべてが整っています。問題は、単純化された予測の観点で考えると、それが売上だけではないということです。返品に関することもありますし、たとえば、人々が考える非常に基本的なことの1つである、予測をどのように改善できるかということもあります。

Joannes Vermorel: 通常、私たちはこれらの時系列を見始めると、価格を知らないことに気付きます。企業と一緒に働き、彼らの予測を改善したいと思うとき、私たちは彼らの予測を生成しているデータパイプラインを見て、価格が存在しないことに気付きます。明らかに、価格はサプライチェーンに大きな影響を与えます。突然、製品の価格を50%割引すると、需要が急増するかもしれませんが、利益も消えてしまうかもしれません。ただし、価格は通常、需要とサプライチェーンに大きな影響を与えます。私たちがS&OPプロセスや予測プロセスを見るとき、価格が存在しないことがほとんどですが、それは通常、氷山の一角にすぎません。

Kieran Chandler: 以前にも触れましたが、需要に焦点を当てている人々は、価格が注目されることがありますが、他にも興味深いことは何でしょうか?

Joannes Vermorel: 通常、返品は存在せず、在庫レベルも存在しません。なぜ在庫レベルが必要なのかと思うかもしれません。その答えは、まず、在庫切れの場合、何も売れないからです。バックオーダーが発生するかもしれませんが、それは非常に特殊なパターンです。ですから、バックオーダーを通常の販売と同じように数えることができるでしょうか?つまり、それはコミットメントが必要です。バックオーダーとは、商品がないため、ベンダーに後で出荷するように依頼し、顧客としては長い遅延を受け入れる意思があることです。したがって、これは需要ですが、通常の需要とは性質が異なる需要です。ですから、バックオーダーの1単位が通常の販売とまったく同じであると言えるでしょうか?実際には、そうではありません。

特に、例を挙げると、何らかの理由で、B2Bでの需要の大部分が、より良い価格を得るためにバックオーダーや長い納品遅延を受け入れることができるクライアントである場合があります。その場合、予測の観点からは非常に良い状況です。突然、何も予測する必要がなくなります。

Kieran Chandler: 需要とバックオーダーについて話していただけますか?

Joannes Vermorel: 後で出荷するためのバックオーダーとして、クライアントとしては、長い遅延を受け入れることができます。ですので、これは需要ですが、通常の需要とは異なる性質の需要です。ですので、バックオーダーの1単位がまったく同じであると言うのは、実際には違います。特に、例を挙げると、何らかの理由で、B2Bでの需要の大部分が、より良い価格を得るためにバックオーダーや長い納品遅延を受け入れることができるクライアントである場合があります。その場合、予測の観点からは非常に良い状況です。何も予測する必要はありません。バックオーダーを見て、予定された納品時に必要なものを用意するだけです。ただし、この需要を予測する必要はありません。なぜなら、この需要は事前に既に注文されているため、既知であるからです。

Kieran Chandler: 現在のデータを最大限に活用するためのアドバイスはありますか?

Joannes Vermorel: 最初に必要なことは、非常にドメイン固有の視点から問題を考えることです。自分自身に問いかける必要があります。「私はサプライチェーンを持っています。本当に重要なのは何ですか?」そして答えは、「状況によります。」運営しているサプライチェーンのタイプによって本当に異なります。航空宇宙産業の場合、問題は実際には「サプライチェーンに投資するごとに、最大限のAOG(地上に停止した航空機)インシデントを回避するためにどのようにすればよいか?」ということになります。つまり、通常の質問は、「投資するドルごとに最大限のAOGインシデントをどのように得ることができるか?」ということです。これが航空宇宙産業の視点です。生鮮食品の場合、まったく異なる問題になります。それは、「顧客の長期的なロイヤリティをどのように最大化できるか?」ということになります。食品は完全にリピートビジネスに関わるため、1つの製品のサービスレベルにはあまり意味がありません。それはあまり気にしないでください。なぜなら、代替品がたくさんあるからです。重要なのは、忠実な顧客があなたの店舗に来て、1つの製品ではなく、バスケット一杯を購入する際に非常に良い体験をすることです。ですので、何かが欠けている場合、常に代替品があり、彼らがあなたの店舗から非常に満足して去ることができること、そして、全体的な可用性だけでなく、購入するものの新鮮さにも非常に満足していることを確認したいのです。これが世界の体験の一部であり、再び、質問は投資するドルごとにそれを最適化する方法です。質問は本当にドメイン固有のものです。どのアイデアが最も関連性があり、注意を払うべきか。それはあなたのドメインの専門知識だけが判断することができ、通常、高度なデータサイエンスのスキルは必要ありません。それは、ドメインの直接的な理解だけで、何かが「必要なもの」なのか、「超愚かな決定を避けるために完全に重要なもの」なのかを判断できるからです。

Kieran Chandler: 今日のコアメッセージは何ですか?

Joannes Vermorel: ですので、このエピソードの目標を考えると、より良い予測を持つためのより良いテールを持つ方法です。それが私たちが望むものですし、より良いデータは通常、予想しているものではありません。

Kieran Chandler: つまり、予測にははるかに優れたデータがあるかもしれませんが、問題は「より良い」とはどういう意味かということです。通常、私たちが非常に具体的なものを意味するのは、ほとんどの人が予想していないものです。まず、より良いデータとは、見るべきすべての要素の完全な画像を持つことです。通常、それはInstagramやソーシャルネットワーク、天気予報のようなものではありません。それはもっと日常的なものであり、すでにシステム内に存在しているものです。多くの人々、おそらくあなたの前の人々が、それらを見る価値さえないと判断していたものです。

Joannes Vermorel: さて、私たちのメッセージは、それらのデータは非常に重要であるということです。私は価格、返品、バックオーダー、在庫の動きなどについて話しています。それらは重要であり、良いニュースは、すでにあなたのシステムのどこかに存在しているということです。まず、関連データとして考慮するものについての視野を広げてください。2番目のことは、データの準備という考えを忘れることです。データがどのように生成されるかを理解する必要があります。なぜなら、そうしないと、ゴミの入力、ゴミの出力の状況になってしまうからです。データを理解することは難しいです。なぜなら、それは2つのことから成り立っているからです。ソフトウェアの理解と、ソフトウェアの上で操作している人々のプロセスの理解です。

通常、データの意味論には2つの要素があります。それは、ソフトウェアを操作する人の頭の中の半分と、最初にエンタープライズソフトウェアを設計したソフトウェアエンジニアの頭の中の半分です。私が「人」と言うとき、残念ながら通常は多くの人々です。最悪の場合は、これらの人々が相反する解釈を持っている場合です。そこで非常に混乱した状況になることがあります。ですので、関連データについての視野を広げてください。非常に特別なものではなく、ビジネスにとって基本的な日常的なものですが、売上だけではありません。そして、このデータを理解する必要があります。

最後に、より良い予測をしたい場合、それはどういう意味でしょうか?そして、人々は「ああ、より良い平均絶対パーセンテージ誤差、またはより良い平均絶対誤差」と言うでしょう。そして、再び私は言います、パーセントで表現されている場合、それは単に良くありません。それはドルで表現される必要があります。そして、以前のエピソードの1つで議論したように、最終的には、予測はあなたがより良い意思決定をするために導かれる場合にのみ、より良いと見なされることができます。

残念ながら、予測が良いかどうかを判断する方法は、あなたが行う最終的な決定のプリズムを通してです。それは難しいですが、これがあなたがそれを行う方法です。ただ「ああ、私はより良いMAPEを持っていて、予測が良い」と言うだけでは、それは非常に間違っており、あなたは間違いなく、私が言うには、ナショナリズムの間違い、ある種の間違いを犯す道にはなりません。

Kieran Chandler: はい、わかりました。それについては我慢しなければなりませんが、おそらくいくつかのITマネージャーは私たちに感謝するでしょう。彼らは今アーカイブを探し回ることになるでしょう。それでは、今週は以上です。ご視聴いただき、ありがとうございました。次のエピソードでお会いしましょう。さようなら。