00:00:09 ニコラ・ヴァンデプトの紹介と背景.
00:01:21 ニコラの著書:『Data Science for Supply Chain Forecast』.
00:03:29 オープンソースの統計ツールキットの進歩.
00:05:36 現代の予測ツールの実験の容易さ.
00:06:17 オープンソースソフトウェアの幅広い業界への影響.
00:08:03 データサイエンスにおけるPythonとRの活用.
00:10:35 オープンソースツールがベンダーに与える影響.
00:13:22 予測ソリューションにおけるベンダーの役割.
00:14:26 理論の実運用環境への応用.
00:15:38 本番移行:データの課題.
00:16:29 サプライチェーンのデータ問題への対処.
00:18:05 より良い意思決定のためのデータ統合.
00:19:56 サプライチェーンにおけるデータ文化の必要性.
00:22:14 より良いサプライチェーン管理のための教育.
00:24:01 最適化ルールと測定の重要性.
00:24:15 サプライチェーンにおけるオープンソースの欠点.
00:25:37 Lokadの将来の役割と専門家の価値.
00:28:34 Pythonとオープンソースの進化に伴う課題.
00:31:37 データサイエンスでのシンプルな出発の奨励.

概要

ニコラ・ヴァンデプトとジョアンネス・ヴェルモレルは、サプライチェーン予測におけるdata scienceの変革的役割について議論します。ヴェルモレルは、サプライチェーンの意思決定に対して分析的なオーバーレイを提供するLokadの取り組みを強調しながら、急速に進化するオープンソースツールキットの課題にも触れます。ヴァンデプトは、自身の著書がサプライチェーン予測のためのデータサイエンスとmachine learningの複雑さを簡素化し、基本的なモデルからスタートして徐々に複雑性を加えていくことを読者に奨励していると安心させます。両者は、この急速に変化する分野における継続的な学習と適応の重要性に同意しています。ヴァンデプトは、彼の著書が読者に自信を持ってサプライチェーン業務にデータサイエンスを応用する力を与え、定量的でデータ主導の意思決定の新時代を切り開くことを望んでいます.

詳細な概要

インタビューでは、ホストのキアラン・チャンドラーが教育に強い関心を持つサプライチェーンサイエンティストのニコラ・ヴァンデプトと、Lokadの創設者ジョアンネス・ヴェルモレルを紹介します。議論は主に、ヴァンデプトの新刊『Data Science for Supply Chain Forecast』を中心に展開されます.

ヴァンデプトは、学びと教育への情熱を強調することから始め、それが著書執筆のきっかけとなったと述べます。彼は、急成長するデータサイエンスの分野と、それがサプライチェーン管理に応用される可能性に魅了されており、サプライチェーンは現代のデータ主導の手法から大きな恩恵を受ける独自かつ複雑なビジネス領域であると指摘します。彼の著書は、こうした洞察を取り込み、データサイエンスをどのように活用してサプライチェーン分野の予測を改善できるかに焦点を当てています.

ヴァンデプトは、従来はサプライチェーン予測がいわゆる「旧式」の統計手法に主に依存していたと説明します。しかし、データサイエンスの新たな世界に突入した今、一部の疑問は残るものの、新たな疑問も生じています。私たちはデータを扱う新しい方法を見つける必要があり、本書は人々をこの新時代に備えさせるためのものです.

ヴェルモレルは自身の見解を加え、データサイエンスにまだ踏み込んでいないサプライチェーンマネージャーにとって、ヴァンデプトの著書が非常に有用であると強調します。彼は、マネージャー自身がこの本に精通し、チームにも同様の取り組みを促すべきだと提案しています.

ヴェルモレルは、過去10年間にわたるオープンソースの統計ツールキットの大幅な進歩に触れ、これらのツールキットは10年ほど前は入手可能であったものの、主に研究者向けに設計されており、その複雑さとユーザーフレンドリーなドキュメントの欠如から生産現場での使用には適さなかったと振り返ります.

しかし、過去5~10年でデータサイエンスの台頭に伴い、状況が一変したと彼は述べます。多くの大学教授がこれらの統計パッケージの使いやすさに着目し、学生が扱いやすいように整備するようになりました。その結果、ドキュメントの質が向上し、異なるパッケージ間での用語の一貫性が保たれるようになり、広く適用可能な主流の手法に焦点が当てられるようになりました.

ヴェルモレルは、オープンソースコミュニティが学界の支援を受けて、高品質でアクセスしやすく、使いやすい統計パッケージの数々を生み出し、サプライチェーン管理を含む様々な業界のプロフェッショナルに提供していることを認め、これが現代のビジネス慣行におけるデータサイエンスの重要性の高まりを示していると結論づけます.

ヴァンデプトは、著書によってラップトップと無料のソフトウェアがあれば誰でも高度な予測を始められるようになると述べました。オープンソースツールの容易な入手性は、ユーザーが実験を行い、自分の特定のニーズに合わせて予測モデルを微調整することを可能にしており、これは以前ははるかに困難なことでした.

その後、会話はオープンソースソフトウェアのより広範な影響へと移りました。ヴェルモレルは、ほぼすべての現代ソフトウェアがオープンソースプログラミングの影響を受けており、クラウドコンピューティングプロバイダーがLinuxのようなオープンソースプラットフォームに大きく依存している点を強調しました。さらに、Lokad自体が業務で90%のオープンソースソフトウェアを利用していることを明らかにしました。現代のオープンソースソフトウェアの革命的な側面は、そのアクセスのしやすさだけでなく、パッケージングとドキュメントの質にあると言えます.

ヴァンデプトは、PythonやRでのプログラミングが、従来のVBAやExcelマクロのようなフレームワークよりも容易になったと強調しました。この容易なアクセスと使いやすさは、彼の著書の中心的なメッセージだと言います。オープンソースソフトウェアへの移行が彼に不安を与えるかと問われた際、ヴェルモレルは、ベンダーが自らの価値を示す上で挑戦となる一方、それ自体がイネーブラーとしての役割も果たすと答えました.

ヴェルモレルは、もしベンダーの価値が半ば複雑な予測モデルの実装だけであるならば、オープンソースエコシステムと競合するのは困難であると指摘しました。彼が示唆する真の付加価値は、単なる正確な予測に留まらず、サプライチェーンの課題に対する本格的な生産グレードの解決策を提供することにあると言えます.

ホストのキアラン・チャンドラーは続いて、Joannes Vermorelに対し、生産ベースへの移行とそこに伴う課題について質問を投げかけます。ヴェルモレルはまず、質の高いデータの重要性を強調し、それがなければいかなるデータ駆動プロセスも『ゴミが入ればゴミが出る』結果になりかねないと指摘します。このデータ品質への懸念は、サプライチェーンにおいて見過ごされがちな、プロモーション品切れなどの分野にも及びます。彼は、これらのデータを活用するモデルを理解することが、サプライチェーンの専門家がこれらの見過ごされた領域に気づく助けになると論じます.

しかし、ヴェルモレルは、サプライチェーンの主要な目的は正確な履歴データベースを作成することではなく、それは二次的な目標であると認めています。Lokadは、複数の拠点やシステムにまたがる質の高いデータ統合への移行を加速させるためにクライアントを支援します。このデータがどのように活用できるかを理解することが重要です。さらに、Lokadは、これらの予測をサプライチェーンの意思決定に変換する手助けをし、予測の有用性を具体的な行動に拡大しています.

その後、会話はサプライチェーン分野におけるデータ文化と機械学習の理解不足に移ります。ヴァンデプトは、これが多くの企業にとって重大な障壁であると示唆します。しばしば、サプライチェーンプロジェクトは、データ不足や機械学習が何を達成できるかの誤解により遅延します。これにより、この文化を変革し、正確なデータを持つことの重要性を高める必要性について議論が始まります.

ヴェルモレルは、教育が前進の道であると示唆し、自身とヴァンデプトがそれぞれの著書やその他の出版物を通して市場に啓蒙活動を行っている点に触れます。彼は、定量的かつエンジニアリング的な考え方でこの分野に取り組む新たなサプライチェーンの実務者の波を見ることを望んでいます.

ジョアンネス・ヴェルモレルは、同社がERP在庫管理のリポジトリとして機能するのではなく、サプライチェーンの意思決定に対して分析的なオーバーレイを提供するという企業ビジョンを強調します。また、急速に進化するPythonエコシステムにおける、最先端ツールキットの維持という課題を含むリスクについても議論します。一方、ニコラ・ヴァンデプトは、サプライチェーン予測におけるデータサイエンスと機械学習が過度に複雑であるわけではないと保証します。彼の著書は、読者がシンプルなモデルから始め、徐々に複雑性を追加していくためのガイドとなることを目指しています。両者は、継続的な学習と適応の必要性を強調し、ヴァンデプトは、読者がサプライチェーンの文脈でデータサイエンスを適用する自信を得ることを望んでいると述べています.

完全なトランスクリプト

Kieran Chandler: こんにちは、今週のLokad TVでは、需要予測を専門とするサプライチェーンサイエンティスト、ニコラ・ヴァンデプトをお迎えしています。多国籍サプライチェーンの管理において強力な技術的背景を持つだけでなく、彼は教育にも強い関心を寄せています。彼はブリュッセル大学で講義を行った経験もあり、著書『Data Science for Supply Chain Forecasts』を発売したばかりです。では、ニコラ、本日はご来場いただきありがとうございます。いつものように、ゲストについて少し知ることができてとても嬉しいです。まずは、ご自身について少しご説明いただき、どのようにしてサプライチェーンの世界に関わるようになったのかをお話しいただけますか?

Nicolas Vandeput: はい、おっしゃる通り、私は教育と学びに非常に関心があります。本を読んだり、記事やブログをチェックしたりして時間を過ごすのが好きです。多くのことを学ぶ機会に恵まれ、今はその知識を応用できることに非常に喜びを感じています。ある時点で、学んだことを共有する必要性を感じたため、この新たなデータサイエンスの分野をまとめるために本を書きました。これは本当に新しいものであり、サプライチェーンという特定のテーマに適用するのはユニークだと思います。人々はオンラインマーケティングにデータサイエンスを利用しますが、サプライチェーンは別の分野ですので、両者を融合させるために時間をかけました.

Kieran Chandler: さて、本のタイトルは『Data Science for Supply Chain Forecasts』です。少々長いタイトルですが、内容はどのようなものでしょうか?

Nicolas Vandeput: タイトルにある通り、サプライチェーンと、サプライチェーン内で予測を得るためにデータサイエンスをどのように適用するかについてです。これまで、人々は私が「旧式の統計」と呼ぶ手法を用いており、多くの疑問が伴っていました。しかし、データサイエンスの新たな世界に突入した今、一部の疑問は残るものの、新たな疑問も生じています。我々はデータを扱う新しい方法を見つける必要があり、本書は人々をこの新時代に備えさせるためのものです.

Kieran Chandler: いつも通り、Lokadの創設者であるジョアンネス・ヴェルモレルも参加しています。ジョアンネス、本の一部を拝見されたと聞きましたが、どのようにお感じになりましたか?

Joannes Vermorel: はい、一部拝見し、原稿を確認する機会がありました。非常に良い内容だと思います。チームにデータサイエンスの専門家がいないサプライチェーンマネージャーには、是非一冊手に取り、少なくとも最初の数章を読んでいただき、その後、チームの他のメンバーにも残りの章を読んでもらい、実践してもらうことをお勧めします。非常に興味深いのは、open sourceの統計ツールキットが素晴らしい進歩を遂げている点です。10年前までは、これらは主に研究者同士で物事を示すために使用されていました。コードは存在していたものの、乱雑で研究向け、つまりプロダクション向けではなく、ドキュメントもほとんど存在しませんでした.

ここ5~10年で本当に変わったのは、データサイエンスの登場により、多くの大学教授が統計パッケージの品質に注目し始めたことです。彼らは、学生が利用しやすいように、完璧なドキュメント、パッケージ間での一貫した用語、そして多くの状況で機能する主流の手法に焦点を当てたものにすることを目指しました。学界の支援を受けたオープンソースコミュニティは、ユーザーのニーズに基づいた一連のオープンソースパッケージを生み出しました.

Kieran Chandler: ジョアンネス、ニコラの新刊『Data Science for Supply Chain Forecast』について、もう少し詳しく教えていただけますか?

Joannes Vermorel: 本書では、ニコラはPythonの優れた部分と最も関連性の高いパッケージを活用し、最小限の労力で最新に近い予測を実現する方法を示しており、非常に印象的です.

Kieran Chandler: ニコラ、オープンソースコミュニティで何が変わり、それが既存のものの品質向上にどう寄与したのでしょうか?

Nicolas Vandeput: 予測を作成する容易さという点が大きいと思います。10年前では、状況は混沌としており、本書のようなものは実現不可能でした。それは、非常に意欲的なプロフェッショナル向けのものとなっていたでしょう。しかし、今日では、少しの好奇心と情熱を持つあらゆるプロフェッショナルが取り組めるようになっています。非常に簡単で、自分専用のノートパソコンさえあれば、無料のソフトウェアを用いて、簡単な言語から始めることができます。数年前ではそれは不可能で、もっと複雑だったでしょう。今では、自分で簡単に無料で試験を行い、そこから実験を重ね、特定のケースに合わせて予測、コード、及びデータサイエンスを微調整する能力があるのです。以前はそれは不可能でした.

Kieran Chandler: ジョアンネス、予測の世界だけでなく、オープンソースソフトウェアの恩恵を受けている業界は他にもありますか?オープンソースツールキットが利用可能であることで実際に恩恵を受けた他の業界の例はありますか?

Joannes Vermorel: オープンソースムーブメントは極めて広大で、今日のソフトウェア業界のほぼすべてがオープンソースの影響を受けています。主要なクラウドコンピューティングプロバイダーはすべて、Linuxベースの自社クラウドを運用しており、Lokadにおいても使用しているソフトウェアの90%がオープンソースです。私たちが利用しているMicrosoftでさえ、Azure上で多くのLinuxを活用しています。.NETフレームワーク自体もオープンソースであり、私たちが使用するディープラーニングツールキットであるCNTKもまたMicrosoftのオープンソース製品です。Lokadでは、いくつかのソフトウェアコンポーネントをオープンソースとして公開しています。このムーブメントは数十年にわたり堅調に続いています。

予測やサプライチェーンに関して興味深いのは、ソフトウェアがオープンソースであるという事実だけでなく、使いやすく、ドキュメントが充実したオープンソースコンポーネントが揃っている点です。これは完全に画期的な変化をもたらします。つまり、20行のシンプルなコードで始められる線形回帰のような単純な実装と、200行にも及ぶコードと1ヶ月かけてソフトウェア各部を統合しなければならない場合との違いを意味します。以前は、組み合わせるとクラッシュする互換性のないコードが存在し、他者が作成したものを動作させるために1ヶ月分の調整が必要でした。現在では、データサイエンス用のPython環境を整えるのは、書籍の数ページ分の手順で済み、Anacondaをインストールするだけで完了します。

Kieran Chandler: Joannes、Windows上のLinuxサブシステムについて教えていただけますか?そして、それがこれらのツールへのアクセスの容易さにどのような影響を与えているのかについてもお聞かせください。

Joannes Vermorel: Windows上のLinuxサブシステムにより、これらのツールはほぼすべてのLinuxディストリビューションやWindowsシステム上で動作可能となっています。本書は、オープンソースや実運用レベルのパッケージの普及によって大幅に改善されたこれらのツールへのアクセスの容易さを示しています。

Nicolas Vandeput: さらに付け加えると、本書では従来ExcelのVBAやマクロに依存していたプロフェッショナルについても論じています。私にはそれらが常に複雑でバグが多いように思えました。Pythonや他の言語の利用を提案すると、多くの人はそれを過度に複雑だと感じます。しかし、本書で伝えたいのは、実際にはVBAやExcelマクロよりも、PythonやRといったオープンフレームワークを利用する方がずっと扱いやすいということです。

Kieran Chandler: Joannes、これらの使いやすいオープンソースの予測ツールを前に、企業向けソフトウェアベンダーとしてのLokadにとって不安になることはありませんか?

Joannes Vermorel: 企業向けソフトウェアベンダーとして、我々はエコシステムの一部であり、その促進者でもあります。我々もこれらのオープンソースツールを活用しているため、全てを一から構築する必要はありません。課題は、我々独自の付加価値を見出すことです。もし付加価値が半ば複雑な予測モデルの実装にとどまるのであれば、エコシステム全体と比較して実質的な優位性は得られません。本書では、いくつかの予測モデルを搭載したツールキットを販売するベンダーは、人気のPythonライブラリに比べて大きな価値を提供していないことが強調されています。しかし、生産運用レベルのソリューションを提供し、大規模なサプライチェーンの課題に対処するにはまだ可能性があり、これこそがLokadが目指すところです。

Nicolas Vandeput: 私もJoannesに同意します。サプライチェーンの世界では、多くのプロフェッショナルや学生が機械学習を流行語あるいは一過性のものと見なしていますが、実際にはそれは定着するものです。もし私の本を読み、学ぶ時間を取れば、サプライチェーン最適化においてどれほど有用で利用しやすいかが実感できるはずです。

Kieran Chandler: つまり、本書を読むと、より一歩進んだソリューション、例えばLokadのような製品を導入する準備が格段に整うということですね。おっしゃる通り、エンドツーエンドで全体のソリューションを機能させることができます。当然、スーパーエージェント環境で予測を実行するには、人によるレビューなどを含む完全なプロセスが必要です。予測に数値を盛り込む作業は全体プロセスの一部にすぎません。本書のアイディアをどのように実装できるかについてお話しいただけますか?

Nicolas Vandeput: 本書の目的は、その特定の工程について論じることにあります。本書を読んだからといって、すべてを自分で実装しなければならないわけではありません。Lokadのような他のベンダーに問い合わせて、「本書で読んだのですが、御社ではどのように機能しているのか?どう実装すればよいのか?このアイディアは機能するのか?テストは可能か?」と確認することもできます。そうしていくうちに、Lokadのようなソフトウェアベンダーが実際に何をしているのかが見えてくるはずです。

Kieran Chandler: これらのアイディアの多くは理論的な視点から発展してきましたが、それを実際の運用に適用することは可能でしょうか?

Nicolas Vandeput: はい、全くその通りです。これらの新しい予測手法は古くから存在しています。例えば、ニューラルネットワークの理論は1960年代に初めて提唱され、本書で紹介されている最初の手法も同じ時代のものです。今日、予測環境でそれらを利用し始めたのは、実行が容易になったからです。おそらく10年前はそうではなく、現在では人々の認識も高まっています。確実に利用可能です。データサイエンスの本当に興味深い点、そして本書の大きな目的のひとつは、データサイエンスが真の科学であるということです。実験を何度も行い、検証することができるからこそ、「これは機能するのか?はい、それともいいえか?」と自ら証明できるのです。もし上手くいかなくても、「新たな実験を設計し、必要な要素を追加または削除して、より良い結果が得られるか試す」ということが可能です。つまり、自分の予測がより優れていると証明してから使い始める、まさに科学的なプロセスなのです。

Kieran Chandler: つまり、これはLokadのような企業にアプローチする前の、別の概念実証としても利用できるということですね。「Joannes、生産運用に移行し、日常的に使用する際にどのような課題に直面する可能性があるのか、そしてLokadがその全体プロセスにおいてどの部分で実際に支援できるのか」を問う前段階として。

Joannes Vermorel: まず第一に、良質なデータを確保する必要があります。十分に品質の保証されたデータがなければ「ゴミを入れればゴミが出る」という結果になってしまいます。本書の面白い点は、サプライチェーン担当者に対して、モデルが何を行っているのか、どのような要素を活用できるのかを体験させ、なぜ今、プロモーションのようなサプライチェーンにおけるグレーな領域に注目する必要があるのかを理解させるところにあります。一般的に、プロモーションに関するデータは非常に混乱していますし、在庫切れの場合も同様です。しばしば、すべての在庫切れを反映する適切な履歴データが存在しないため、需要がなかったのか、在庫不足だったのかが不明確になります。

そのため、データを活用できるモデルに精通することで、既存のプロセスが適切かどうかを見極める感度が高まります。サプライチェーンの第一の目的は、商品の流れを途切れさせずに維持することです。

Kieran Chandler: つまり、サプライチェーンの第一の目標は正確な履歴データベースの構築です。それが第一のターゲットとなります。第二のターゲットは、すべての関係者にサービスを提供し、生産を継続させ、顧客満足を確保することです。しかし、第二の目標の実行は、第一の目標ほど品質が高くないことが多いのです。この移行を加速し、複数拠点での大規模なデータ統合を実現するためには、視野を広げる必要があります。Joannes、この点について詳しく説明していただけますか?

Joannes Vermorel: クライアントとの仕事を始めると、データ統合とその実行という課題に直面することがよくあります。多くのクライアントは、より高度な数値的手法を予測に適用してより良い意思決定をもたらすことができるという事実に気付いていません。データサイエンスに関する書籍を読むことで視野が広がり、サプライチェーンをより効率的に実行するための洞察を得ることができます。これにより、生産から予測を活用したスマートな意思決定に至るまでの全体像が見えてくるのです。

Nicolas Vandeput: サプライチェーンのリーダーは、データサイエンスや機械学習から実行可能な洞察を引き出すための、2つの重要な要素を欠いています。第一はデータ文化ですが、これは世界中の約99%の企業で不足しています。多くの企業は依然として乱雑なスプレッドシートに頼っており、適切なデータの重要性に気づいていません。本書は、適切なデータがあれば、適切な科学、正確な予測および効果的な実験が可能になることを示すことを目指しています。データがなければ、多くのプロジェクトが遅延し、ジャーナリストもそれを確認しています。第二の要素は、サプライチェーン管理における機械学習とデータサイエンスの才能と理解の不足です。この文化を変革し、データの価値に対する認識を高める必要があります。

Kieran Chandler: 確かに、正確なデータを持つことは極めて重要です。それは「データをきれいにせよ」という戒めのようなものです。しかし、どのようにしてこの文化の変革を実現するのでしょうか? 市場に対してデータの重要性をどのように伝え、正しいデータを持つことの重要性を強調できるのでしょうか?

Joannes Vermorel: 冗談めかして言えば、より良いデータが必須であるというカルト集団を始めても良いかもしれませんが、冗談はさておき、理解と意識を醸成する必要があると考えています。市場を教育し、クリーンで正確なデータの価値にもっと重きを置くことで、文化の変革を促し、正しいデータを持つことがサプライチェーン管理の最優先事項となるようにできるのです。

Kieran Chandler: ディープラーニングで何ができるかという認識が乏しく、経験もないと、その意義すら見えにくいものですよね。

Joannes Vermorel: 確かに、それは挑戦的です。重要なのは、技術的な細部に没頭するのではなく、実際にデータを扱って手を汚すことだと思います。環境構築にITチームを必要とするほどの作業ではありません。これらの手法がどのように機能するのか、その原理を理解することが非常に重要であり、決して魔法ではないのです。

この謎を解明することは重要です。Lokadでは市場への啓蒙活動に努めてきました。教育こそが前進への道です。Nicolasは素晴らしい書籍を出版しており、私たちもまた書籍やLokadのウェブサイト上の広範なナレッジベースなど、多くの資料を公開しています。結局のところ、重要なのは教育です。

私が見ているのは、より定量的なエンジニアリングマインドを持った新たなサプライチェーン実務者たちが登場しているということです。彼らは、繰り返し可能な数値に基づく判断を求めています。サプライチェーンでは、多くの人々、国、拠点が関わるため、リーダーシップは不可欠です。しかし、エンジニアリング的または定量的な視点が伴わなければ、何一つ最適化することは難しいのです。「最適化」という言葉が出た瞬間、最適化の根本原則は、測定しなければ何も最適化できないという事実につながります。そこで疑問となるのは、どうやって測定するかという点であり、そこにはやはりデータが必要なのです。

Kieran Chandler: Nicolas、これらのオープンソースツールキットの利点については多く語りましたが、欠点に関してはどうお考えですか?これらのツール使用におけるネガティブな側面はどこにあると思われますか?

Nicolas Vandeput: 前述の通りですが、これこそ非常に重要な点です。サプライチェーンの世界は、製品、人物、異なるチーム間の多くの相互作用で成り立っています。予測プロセスは、多くのステークホルダーが関わる非常に長いプロセスです。私の書籍では、過去数十年にわたり同じ技術が使われ続けていると述べています。80年代や90年代に遡ってみれば、今日と同じ予測エンジンが存在していることに気づくでしょう。つまり、何も変わっていないのです。

私は、この特定の部分だけを変革することは可能だと提案していますが、もちろんそれだけでは不十分です。全体のプロセスが生き、進化していく必要があります。単にPythonを使用するだけでは、うまく機能していないプロセスを解決することはできません。それは単に予測の数値を改善するに過ぎず、依然として全体のプロセスを見直す必要があるのです。

Kieran Chandler: Joannes、あなたはLokadに常に居場所があると自信を持っているように感じます。将来的に、市場におけるLokadの存在はどの位置にあるとお考えですか?

Joannes Vermorel: まず、純粋な予測の領域においても、より良い予測を実現するための手法はまだ存在すると信じています。しかし「より良い」というのはこれまで以上に難しい問題です。平均絶対誤差の観点からより良い予測ができると言うのと、確率論的な世界に踏み込むと、全く別の局面となるのです。

もし「需要を予測したいのは明日ではなく、例えばコンテナが到着するという確率的な期間において」と言い始めた場合、未来の不確定な時点で始まり、また別の不確定な時点で終了する需要予測となります。次元が増えれば状況は非常に複雑になります。さらに、競合他社が価格を下げる可能性といった要因を組み込むと、需要の形状に特定の影響が出るため、予測の精度は一面的なものではなく、解決すべき複雑な側面が浮かび上がるのです。

Kieran Chandler: 突然、非常に優れたオープンソースツールキットを持っていたとしても、モデルは複雑化し、それらをバグのない実運用レベルで、かつスケーラブルな形に統合するには、多くの作業が必要となります。

Joannes Vermorel: はい、純粋な予測の観点からすれば、それもひとつのアプローチだと思います。しかし、Lokadにおける我々のビジョンは、特定のサプライチェーンに対してスマートな意思決定を生み出すための、より深いエンドツーエンドの分析オーバーレイを提供することにあります。我々はサプライチェーンシステムを管理するわけではなく、ERPでもありません。全ての在庫移動のリポジトリになろうとはしていません。確かにそのデータのコピーは保有していますが、我々はあくまでスマートな分析オーバーレイなのです。

これが我々のビジョンです。そして、たとえLokadが完全にオープンソースツールで構築されていたとしても、それらすべてを一体化することには大きな価値があります。例えば、今日利用可能なクラウドコンピューティングプラットフォームは、オープンソースの要素を膨大に組み合わせたものですが、人々は自分で構築できるはずにも関わらず、Amazonを選ぶ傾向にあります。自前のプライベートクラウドを持つことは可能ですが、これらすべてを統合するのは膨大な労力を要するため、専門家に任せる価値があるのです。

私がこのPythonおよびオープンソースのエコシステムに特に感じる一つの欠点は、その進化の速さです。自分で取り組む場合、一つのPythonのバージョンやツールキットを選んだとしても、2年後には劇的に改良された何かが登場している可能性があります。かつては最先端だったものが、世界の変化とともに、ある研究所で新たなツールキットが生み出されたことで、一転して時代遅れになってしまうのです。

例えば、数年前までは Scikit がほぼすべての面でリードしていましたが、今では PyTorch がディープラーニングと differentiable programming を取り入れることで全体に大きな挑戦を仕掛けています。そこで疑問が生じます。2年前に実装したものを誰が再検討し、その時々の流行に合わせて刷新する責任を負うのでしょうか? 信頼できるベンダーは、あなたのデータサイエンスソリューションが定期的に見直され、最新の状態を維持するために書き直されるよう管理するはずです。

このデータサイエンスの進歩の黄金時代がどれほど続くのかは分かりませんが、今後10年ほどの間に、2年ごとに新たなアプローチが従来よりもはるかに優れているという素晴らしい進展が見られても驚かないでしょう。非常に対処が難しいと思われる問題分野も、実は手の届くものになるかもしれません。

Nicolas Vandeput: ここで一言付け加えるなら、Joannes が Lokad の取り扱える複雑性について言及したのは非常に興味深いと思います。実際に Lokad のチームと仕事をした経験があるので、彼らの能力はよく知っています。私の著書のメッセージの一つ、そして私にとって非常に重要な点は、人々に「あなたにもできる」と伝えることです。

Joannes の言葉を聞いて「わぁ、データサイエンスと機械学習はとても複雑で、自分には向いていないかもしれない」と考える人もいるかもしれません。しかし、私は「いや、そんなに複雑ではない。シンプルなモデルから始められる」と強く伝えたいのです。そして実際、著書が示すように、非常にシンプルなモデルからでも十分に強力な成果をあげることができるのです。そこからレイヤーを追加したり、システムやデータを微調整したり、さらに別のモデルを導入したりすることも可能です。

つまり、すでに十分に機能するシンプルなものから始め、そこからより複雑なものへと進むことができるのです。これこそが私の著書で伝えたいメッセージ、すなわち「シンプルに始めて、そこから発展させていく」ということです。

Kieran Chandler: モデルが正常に動作しているかどうか、どのように判断すればよいのか教えていただけますか?テストは可能でしょうか?再現性はあるのでしょうか?これらの原則はシンプルなモデルでは当てはまるようですが、基本を理解した上で、より複雑なモデルにも適用できるのでしょうか?

Nicolas Vandeput: その通りです。まずはシンプルに始めることを強くお勧めします。基本をしっかりと押さえた後で、より複雑なものへと進むことが可能です。

Kieran Chandler: それでは、最後の質問に移らせてください。著書の読者や今後のオープンソースツールキットの利用について、どのような期待をお持ちですか?

Nicolas Vandeput: 私のビジョンであり希望でもあるのは、人々がこの本を読んで自分の能力に自信を持つようになることです。著書の最後には、「やればできる。そんなに複雑に見えない」と自分に言えるようになってほしいのです。もしかすると2週間前はコードが書けなかったかもしれませんが、最終的にはすべてが非常にシンプルに見えるようになることを望んでいます。読者自身が実験を始め、データサイエンスを真に体験し、新たなモデルに挑戦するようになることを願っています。そして、彼らがサプライチェーン管理の新しいリーダーとなることを期待しています。これは Lokad のメッセージの一つでもあります。私たちはすでに、定量的なサプライチェーンの世界で、実験と一貫して機能するソリューションの実装が可能な環境にいます。それにはデータサイエンスが不可欠です。ですから、この本が人々に自ら実践する力を与えることを心から望んでいます。

Kieran Chandler: そろそろ終わりにしなければなりませんが、本日はお時間をいただきありがとうございます、Nicolas。

Nicolas Vandeput: ありがとうございます。

Kieran Chandler: 『Data Science for Supply Chain Forecast』という本が現在発売中です。Amazonでぜひチェックしてみてください。ここLokad TVでは、またすぐに新しいエピソードをお届けします。それでは、次回まで、ご視聴ありがとうございました。

Joannes Vermorel: ありがとうございました。