00:00:09 Nicolas Vandeputの紹介と経歴。
00:01:21 Nicolasの著書:サプライチェーン予測のためのデータサイエンス。
00:03:29 オープンソースの統計ツールキットの進歩。
00:05:36 現代の予測ツールの実験の容易さ。
00:06:17 オープンソースソフトウェアの広範な業界への影響。
00:08:03 データサイエンスにおけるPythonとRの使用。
00:10:35 オープンソースツールのベンダーへの影響。
00:13:22 予測ソリューションにおけるベンダーの役割。
00:14:26 本番環境での理論の適用。
00:15:38 本番環境への移行:データの課題。
00:16:29 サプライチェーンデータの問題の処理。
00:18:05 より良い意思決定のためのデータの統合。
00:19:56 サプライチェーンにおけるデータ文化の必要性。
00:22:14 より良いサプライチェーン管理のための教育。
00:24:01 最適化のルールと測定の重要性。
00:24:15 サプライチェーンにおけるオープンソースの欠点。
00:25:37 Lokadの将来の役割と専門家の価値。
00:28:34 Pythonとオープンソースの進化の課題。
00:31:37 データサイエンスにおける簡単な始まりの奨励。

概要

Nicolas VandeputとJoannes Vermorelは、サプライチェーン予測におけるデータサイエンスの変革的な役割について議論します。Vermorelは、サプライチェーン意思決定のための分析的なオーバーレイを提供するLokadの重点について言及しながら、急速に進化するオープンソースのツールキットの課題に取り組んでいます。Vandeputは、彼の本がデータサイエンスと機械学習をサプライチェーン予測に応用するための複雑さを簡素化しており、読者に基本モデルから始めて徐々に複雑さを追加することを奨励しています。両者は、この速変化する分野での継続的な学習と適応の重要性について合意しています。Vandeputは、彼の本が読者に自信を持ってデータサイエンスをサプライチェーンの運用に適用する力を与えることを望んでおり、定量的でデータに基づいた意思決定の新時代を告げています。

詳細な概要

インタビューでは、ホストのKieran Chandlerが、教育に強い関心を持つサプライチェーン科学者であるNicolas Vandeputと、Lokadの創設者であるJoannes Vermorelを紹介しています。議論は主に、Vandeputの新刊『サプライチェーン予測のためのデータサイエンス』に焦点を当てています。

Vandeputは、自身の学習と教育への情熱を強調し、それが彼の本を執筆するきっかけになったと述べています。彼は、データサイエンスの新興分野とそのサプライチェーン管理への潜在的な応用に魅了されており、これをビジネスのユニークで複雑な領域と位置付け、現代のデータ駆動技術が大いに役立つと指摘しています。彼は、自身の本がこれらの洞察を具体化し、サプライチェーンセクターにおける予測の改善にデータサイエンスを活用する方法に焦点を当てていると述べています。

Vandeputは、従来、サプライチェーンの予測は主に彼が「旧来の」統計的手法と呼ぶものに基づいていました。しかし、データサイエンスの登場と進化により、データの処理と解釈の新しい方法が現れました。彼の本は、プロフェッショナルがこの新しい時代に備え、データサイエンスを活用してサプライチェーンの予測を向上させることを目指しています。

Vermorelは自身の視点を加え、特にデータサイエンスに未だ取り組んでいないサプライチェーンマネージャーにとって、Vandeputの本が非常に価値があると強調しました。彼はマネージャーがこの本に精通し、チームにも同様にするよう奨励すべきだと提案しています。

Vermorelは、過去10年間におけるオープンソースの統計ツールキットの重要な進展についても言及しています。彼は、約10年前、これらのツールキットは利用可能であったものの、主に研究者向けに設計され、複雑さとユーザーフレンドリーなドキュメンテーションの欠如のために本番用途には適していませんでした。

しかし、彼は、過去5〜10年間にデータサイエンスの台頭とともに変化が起こったと指摘しています。多くの大学教授がこれらの統計パッケージの使いやすさに注意を払い、学生にアクセス可能にするようになりました。これにより、ドキュメンテーションの品質の向上、異なるパッケージ間での用語の統一、および主流で広く適用可能な技術への焦点が当たるようになりました。

Vermorelは、オープンソースコミュニティと学術界の協力により、さまざまな産業、サプライチェーン管理を含むプロフェッショナルに利用可能な高品質でアクセスしやすい統計パッケージが提供されていることを認めながら、データサイエンスの成長する重要性を強調しています。

Vandeputは、彼の本によって、ラップトップと無料のソフトウェアを持つ人々が洗練された予測を開始することができるようになったと述べています。オープンソースツールの利用可能性により、ユーザーは自分の特定のニーズに合わせて予測モデルを実験し、微調整することができます。これは過去に比べてはるかに困難だったことです。

その後、会話はオープンソースソフトウェアの広範な影響に移りました。Vermorelは、ほぼすべての現代のソフトウェアがオープンソースプログラミングの影響を受けており、クラウドコンピューティングプロバイダーがLinuxなどのオープンソースプラットフォームに大いに依存していることを強調しました。彼自身のLokadも、その運営において90%のオープンソースソフトウェアを利用していることを明らかにしました。現代のオープンソースソフトウェアのゲームチェンジングな側面は、アクセシビリティだけでなく、パッケージングとドキュメンテーションの品質にあります。

Vandeputは、PythonやRのような古いフレームワーク(VBAやExcelマクロなど)よりも、今ではプログラミングが簡単になったと強調しました。この簡単なアクセスと使いやすさが、彼の本の中心的なメッセージであると述べています。オープンソースソフトウェアへのこの移行が彼にとって心配なことになっているか尋ねられた際、Vermorelは、それがベンダーが自身の価値を示すための課題を提起する一方で、イノベーターとしての役割も果たしていると答えました。

Vermorelは、ベンダーの唯一の価値が半ば複雑な予測モデルの実装である場合、彼らはオープンソースエコシステムと競争するのは困難だと指摘しました。彼は、本当の付加価値は、サプライチェーンの課題に対する本格的なプロダクショングレードのソリューションを提供することであり、それは単に正確な予測以上のものであると提案しています。

ホストのKieran Chandlerは、Joannes Vermorelにプロダクションベースへの移行とそれに伴う課題について質問を投げかけます。Vermorelは、品質の高いデータの重要性を強調し、それに欠ける場合、どんなデータ駆動プロセスも「ゴミを入れればゴミが出る」となる可能性があると示唆しています。このデータ品質の懸念は、サプライチェーンにおいてしばしば見落とされるプロモーションや在庫切れなどのデータにも広がると彼は主張し、このデータを活用するモデルを理解することで、サプライチェーンのプロフェッショナルがこれらの見落とされた領域により意識的になることができると述べています。

しかし、Vermorelはまた、サプライチェーンの主な目標は正確な歴史的データベースを編成することではないことも認めています。それは二次的な目標です。Lokadは、クライアントが品質の高いデータ統合に移行するのを加速するのを支援し、複数のサイトやシステムを横断して可能です。このデータをどのように活用できるかを理解することは重要です。さらに、Lokadはこれらの予測をサプライチェーンの意思決定に変換するのを支援し、予測の有用性を行動に拡張します。

その後の会話は、サプライチェーン部門におけるデータ文化と機械学習の理解の欠如についてです。Vandeputは、これが多くの企業にとって重要な障害であると指摘しています。しばしば、サプライチェーンのプロジェクトはデータが不十分であるか、機械学習の実現可能性を誤解しているために遅延します。これについて、この文化を変え、正しいデータの重要性を高める必要性についての議論が行われます。

Vermorelは、教育が前進する道であると提案し、彼とVandeputの両氏がそれぞれの書籍や他の公開資料を通じて市場を啓蒙する取り組みを指摘しています。彼は、サプライチェーンの分野に数値的なエンジニアリングのマインドセットで取り組む新しい波のサプライチェーンの実践者を見たいと望んでいます。

Joannes Vermorelは、会社のビジョンをサプライチェーンの意思決定に分析的なオーバーレイを提供することとし、ERP在庫移動のリポジトリとしての役割を果たすことではないと述べています。また、Pythonエコシステムの急速な進化に伴うリスクについても議論しており、最新のツールキットの維持の難しさを挙げています。一方、Nicolas Vandeputは、サプライチェーンの予測におけるデータサイエンスと機械学習は過度に複雑ではないと保証しています。彼の本は、読者が単純なモデルから始めて徐々に複雑さを追加することを目指しています。両者は、継続的な学習と適応の必要性を強調し、Vandeputは読者がサプライチェーンの文脈でデータサイエンスを適用する能力に自信を持つことを望んでいます。

フルトランスクリプト

Kieran Chandler: こんにちは、今週のLokad TVでは、需要予測に特化したサプライチェーンの科学者であるNicolas Vandeputが参加しています。多国籍サプライチェーンの管理における強力な技術的バックグラウンドを持つだけでなく、Nicolasは教育にも強い関心を持っています。彼はブリュッセル大学で講義を行った経験があり、“Data Science for Supply Chain Forecasts"というタイトルの新刊を発表しました。だから、Nicolas、今日は来てくれて本当にありがとう。いつものように、ゲストについて少し知ることができるのは本当に嬉しいです。まずは、自己紹介とサプライチェーンの世界にどのように関わったのかを教えていただけますか。

Nicolas Vandeput: はい、言った通り、私は教育と学習に非常に興味があります。本を読んだり、記事を読んだり、オンラインのブログをチェックしたりするのが好きです。たくさん学ぶ機会があり、その知識を応用できることに非常に満足しています。ある時点で、自分が学んだことを共有したいと感じ、この新しいデータサイエンスの分野をまとめるために本を書きました。これは本当に新しいことであり、サプライチェーンに適用することもユニークです。人々はオンラインマーケティングのためにデータサイエンスを使用していますが、サプライチェーンは異なるテーマですので、それらを結びつけるために時間をかけました。

Kieran Chandler: では、その本のタイトルは「Data Science for Supply Chain Forecasts」となっていますね。少し長いですが、それは何についての本なのでしょうか?

Nicolas Vandeput: タイトル通り、サプライチェーンにおけるデータサイエンスを活用して予測を得る方法についての本です。過去には、私が「旧世代の統計」と呼ぶものが使われていましたが、それにはさまざまな問題がありました。今や私たちはデータサイエンスの新しい世界に移行しましたが、いくつかの問題は残り、新たな問題も生じています。データを扱う新しい方法を見つける必要があり、この本は人々をこの新しい時代に備えるためのものです。

Kieran Chandler: いつものように、Lokadの創設者であるJoannes Vermorelも参加しています。Joannesさん、その本をちょっとだけ見ることができましたね。あなたの視点はどうですか?

Joannes Vermorel: はい、ちょっとだけ見ることができましたし、原稿もレビューする機会がありました。とても良い本です。データサイエンスの専門知識を持たないサプライチェーンマネージャーには、少なくとも最初の数章を読んでみることをお勧めします。その後、他の人に他の章を読んでもらい、行動に移すかもしれません。非常に興味深いのは、オープンソースの統計ツールキットの素晴らしい進歩です。10年前までは、それらは主に研究者が他の研究者に何かをデモンストレーションするために使用されていました。コードはあったものの、乱雑で、研究用のものであり、本番用ではなく、ドキュメントもほとんど存在しませんでした。

過去5〜10年間で本当に変わったことは、データサイエンスの台頭により、多くの大学教授が統計パッケージの品質に注意を払い始めたことです。彼らはそれらを自分の学生にアクセス可能にすることを目指し、完璧なドキュメンテーション、パッケージ間の一貫した用語、さまざまな状況で機能する主流の手法に焦点を当てました。アカデミックの助けを借りて、オープンソースコミュニティはユーザーのニーズに基づいた一連のオープンソースパッケージを生み出しました。

Kieran Chandler: Joannesさん、Nicolasの新しい本「Data Science for Supply Chain Forecast」についてもっと教えていただけますか?

Joannes Vermorel: この本では、NicolasがPythonの良い部分と最も関連性のあるパッケージを取り上げ、最小限の努力で最新の予測を実現する方法を示しています。非常に印象的です。

Kieran Chandler: Nicolasさん、オープンソースコミュニティで何が変わったのでしょうか?それによって品質が向上しましたか?

Nicolas Vandeput: 予測を作成することがどれだけ簡単になったかという問題だと思います。10年前ならば、それは混乱していて、この本は存在しなかったでしょう。非常に意欲的な専門家を対象にしていたでしょう。しかし、今日では、少しの好奇心と情熱を持つ専門家なら誰でもできます。非常に簡単です。自分のラップトップと無料のソフトウェアがあれば、簡単な言語で始めることができます。数年前では、それは不可能でした。もっと複雑でした。だから、自分自身で無料で何かを簡単にテストする能力があり、そこから実験する能力があります。実験しやすいので、より多くの実験ができ、予測やコード、データサイエンスを特定のケースに合わせて微調整することができます。過去にはそれは不可能ではありませんでした。

Kieran Chandler: Joannesさん、予測だけでなく、他の産業もオープンソースツールキットの恩恵を受けているのですね。利用可能な他の産業の例はありますか?

Joannes Vermorel: オープンソースの動きは非常に広範であり、現在ではほとんどのソフトウェア界が影響を受けています。主要なクラウドコンピューティングプロバイダーはすべてLinuxをベースにしたクラウドを運営しており、Lokadでも使用しているソフトウェアの90%はオープンソースです。私たちが使用しているMicrosoftでさえ、AzureでLinuxを多く利用しています。.NETフレームワーク自体もオープンソースであり、私たちが使用しているディープラーニングツールキットであるCNTKもMicrosoftのオープンソース製品です。Lokadでは、いくつかのビットもオープンソースとして公開しています。この動きは数十年にわたって続いています。

興味深いことに、予測とサプライチェーンに関連するのは、ソフトウェアがオープンソースであるだけでなく、パッケージ化されていて、ドキュメントが整っているオープンソースのコンポーネントがあることです。これはまったくゲームチェンジです。線形回帰のようなシンプルなものを始めるためには、20行のコードで済むかもしれませんが、コンパイルさえできるものを作るためには、200行のコードと1ヶ月かかるかもしれません。以前は、組み合わせるとクラッシュする互換性のないコードがあり、他の誰かが公開したものを動作させるためには、配管工事に1ヶ月かかる必要がありました。今では、データサイエンスのためのPython環境全体を本の数ページでセットアップできます。Anacondaをインストールするだけで完了です。

Kieran Chandler: Joannesさん、Windows上のLinuxサブシステムについて、これらのツールへのアクセスの容易さについて教えていただけますか?

Joannes Vermorel: Windows上のLinuxサブシステムにより、これらのツールはほとんどのLinuxのバリエーションやWindowsシステムでも動作するようになりました。本では、オープンソースと本番向けのパッケージによって、これらのツールへのアクセスの容易さが大幅に変わったことを示しています。

Nicolas Vandeput: 本の中では、ExcelのVBAやマクロに頼っていたプロフェッショナルについても触れています。それは常に複雑でバグが多いように思えました。Pythonや他の言語を使用することを提案すると、人々はそれが複雑すぎると考えることがよくあります。しかし、私の本のメッセージは、VBAやExcelのマクロよりもPythonやRのようなオープンフレームワークを使用する方が実際にはずっと簡単だということです。

Kieran Chandler: Joannesさん、使いやすいオープンソースの予測ツールがこれだけあると、Lokadのようなエンタープライズソフトウェアベンダーとしては不安になりませんか?

Joannes Vermorel: エンタープライズソフトウェアベンダーとして、それはエコシステムの一部であり、またエンエーブラーでもあります。私たちもこれらのオープンソースツールを使用しているため、すべてを再構築する必要はありません。課題は、自社の付加価値を見つけることです。もし付加価値が半ば複雑な予測モデルの実装だけであれば、エコシステムと比べて実際の付加価値はありません。本では、数少ない予測モデルを提供するベンダーは、人気のあるPythonライブラリと比べてあまり価値を提供していないことが強調されています。しかし、供給チェーンの課題をスケールで処理する本格的なソリューションを提供し、取り組むことにはまだ潜在的な可能性があります。それがLokadの目指すものです。

Nicolas Vandeput: Joannesさんの意見に同意します。サプライチェーンの世界の多くのプロフェッショナルや学生は、機械学習をバズワードや一時的なものと見なしています。実際には、それは定着しています。私の本を読んで学び、その有用性とアクセシビリティを理解すれば、サプライチェーンの最適化に非常に役立つことがわかるでしょう。

Kieran Chandler: ですから、本を読むことで、Lokadのようなソリューションをより良く理解し、一歩進んだ解決策を得る準備ができるのですね。もちろん、スーパーエージェント環境で予測を実行するためには、人々とのレビュープロセスも必要です。したがって、予測の数値の集計は全体のプロセスの一部に過ぎません。本のアイデアがどのように実装されるかについて話していただけますか?

Nicolas Vandeput: 本の目的は、その特定のステップについて議論することです。本を読んだからといって、自分でやらなければならないわけではありません。Lokadのような他のベンダーに行って、「本でこれを読んだけど、あなたたちはどうですか?それを実装するにはどうすればいいですか?私にはこのアイデアがありますが、うまくいくでしょうか?テストできますか?」と尋ねることもできます。そうすることで、Lokadのようなソフトウェアベンダーが実際に何をしているのかを理解し始めることができます。

Kieran Chandler: これらのアイデアの多くは理論的な観点から開発されてきました。それらは実際の生産に適用できるでしょうか?

Nicolas Vandeput: はい、完全に可能です。これらの新しい予測手法は長い間存在しています。つまり、ニューラルネットワーク理論は60年代に最初に公開され、本の中の最初の手法も60年代に発表されました。ただし、実際には今日の予測環境でそれらを使用し始めたのは最近のことです。それを実行するのが以前よりも簡単になったからです。10年前ではそうではなかったかもしれませんし、人々は今ではそれについてより認識しています。もちろん、それを使用することができます。データサイエンスの本当に興味深い点は、それが本当に科学であるということです。実験を行い、データを使用して何度も何度もテストすることができます。それがデータサイエンスと呼ばれる理由です。自分自身に証明することができます。「それは機能しますか?はいまたはいいえ?」機能しないかもしれませんが、その後、「新しい実験を設計し、新しい要素を考慮に入れるか、必要のない要素を削除して、より良い結果を得るかどうかを確認します。」ですので、それは本当に、予測がより良くなることを証明することができる科学です。そして、それを使い始めるのはその後です。

Kieran Chandler: ですから、それはLokadのような人にアプローチする前に、概念の証明として使用することができます。「ジョアネス、私たちが本格的なプロダクションベースに移行し、日常的に使用するときに直面する可能性のある課題は何ですか?そして、Lokadがその完全なプロセスにおいてどのように助けることができるのですか?」

Joannes Vermorel: まず、良いデータを取得する必要があります。非常に質の高いデータがない場合、ゴミを入力し、ゴミを出力することになります。この本の興味深い点は、サプライチェーンの人々にモデルが何をしているのか、どのようなことを活用できるのかを知らせることであり、それによって彼らがなぜ今、サプライチェーンのさまざまなグレーゾーンに注意を払う必要があるのかをよりよく理解することができます。例えば、プロモーションに関するデータは完全な混乱です。同様に、在庫切れについても同じです。在庫切れのすべての履歴データを正確に反映するための適切なデータが頻繁に存在しないため、売上がゼロだったのは需要がゼロだったのか、在庫切れだったのかわかりません。

ですので、データを活用できるモデルの種類により詳しくなることで、既存のプロセスが適切かどうかを判断しやすくなります。サプライチェーンの主な目標は、商品の流れを維持することです。

Kieran Chandler: ですから、サプライチェーンの主な目標は正確な履歴データベースを作成することです。それが最初の目標です。2番目の目標は、誰にでもサービスを提供し、生産を継続し、顧客満足を確保することです。ただし、2番目の目標の実行は、最初の目標ほど高い品質ではないことがよくあります。この移行を加速し、複数のサイトでスケールの大きなデータ統合を実現するには、視野を広げる必要があります。ジョアネス、これについて詳しく説明していただけますか?

Joannes Vermorel: クライアントとの作業を開始すると、データ統合と実行の課題に直面することがよくあります。多くのクライアントは、予測により良い意思決定を生成するために高度な数値レシピが適用できることを知らないのです。データサイエンスの本を読むことで、視野を広げ、サプライチェーンをより効率的に実行する方法についての洞察を得ることができます。予測から生産まで、よりスマートな意思決定のために予測を活用するまで、予測の前後の大局を見ることができます。

Nicolas Vandeput: サプライチェーンのリーダーは、データサイエンスと機械学習から実行可能な洞察を抽出するために欠けている2つの重要な要素があります。1つ目はデータの文化であり、世界中の企業の約99%に欠けています。多くの企業はまだ散らかったスプレッドシートで火事を消している状況であり、適切なデータの重要性に気付いていません。この本は、適切なデータを持つことで適切な科学、正確な予測、効果的な実験を実現できることを示すことを目指しています。データがないと、多くのプロジェクトが遅延し、ジャーナリストがそれを確認できます。2つ目の要素は、サプライチェーン管理における機械学習とデータサイエンスの理解と才能の不足です。この文化を変え、データの価値についての認識を高める必要があります。

Kieran Chandler: 確かに、正しいデータを持つことは重要です。それはまるで戒律のようになるべきです、「データをきれいにする」ということです。しかし、この文化の変革をどのように実現するのでしょうか?市場を布教し、正しいデータの重要性を強調する方法はありますか?

Joannes Vermorel: まあ、冗談めかして、私たちはより良いデータが必須であるようなカルトを始めることができます。まるで神聖な戒律のようなものです。しかし真剣な話として、私は理解と認識を育む必要があると考えています。私たちは市場を教育し、きれいで正確なデータの価値をより重視することができます。それによって、文化の変革を生み出し、正しいデータをサプライチェーン管理の最優先事項にすることができます。

Kieran Chandler: 深層学習で何ができるのかを認識しておらず、それに対する経験もないと、その意義を見出すのは非常に難しいですよね?

Joannes Vermorel: 確かに、それは困難です。私は良い出発点はデータの解析に手を染めることであり、タスクの純粋な技術的側面に完全に埋もれることではないと考えています。環境を設定するためにITチームが必要なわけではありません。これらの手法がうまくいく理由、何がそれらを動かすのかを理解することが非常に重要です。それは魔法ではありません。

これを解明することは重要です。Lokadでは、市場を布教しようと努力しています。教育が前進する道です。Nicolasは本を出版しており、それは素晴らしいことです。私たちも本やLokadウェブサイトの広範な知識ベースなど、さまざまなものを出版しています。しかし、結局のところ、教育が重要です。

私が見ているのは、より工学的なマインドセットを持つ新しい波のサプライチェーンの実践者がこの分野に参入していることです。数値や繰り返し可能なものが必要です。サプライチェーンには多くの人々、国々、場所が関与しているため、リーダーシップは不可欠です。しかし、工学的なマインドセットや定量的なマインドセットがないリーダーシップでは、何も最適化することは難しいです。最適化という言葉を使い始めると、最適化の基本ルールは、測定しないものは最適化できないということです。これは次の質問につながります。どのように測定するのか、そしてデータが必要です。

Kieran Chandler: Nicolas、これらのオープンソースのツールキットを使用する利点についてはたくさん話しましたが、いくつかの欠点はどこに見られますか?

Nicolas Vandeput: 私たちが話し合ったように、サプライチェーンの世界は製品、人々、異なるチームなどの多くの相互作用に関わるものです。予測のプロセスは非常に長いプロセスであり、多くの異なるステークホルダーが関与しています。私の本は、過去数十年間、同じ技術が使用されていることを述べています。80年代や90年代を振り返ると、今日と同じ予測エンジンが見つかります。つまり、何も変わっていないのです。

これは非常に具体的な部分を変えることができると提案していますが、もちろんそれだけでは十分ではありません。全体のプロセスが生きて進化する必要があります。Pythonを使うだけでは、うまく機能しないプロセスを解決することはできません。予測の数値を改善するだけです。しかし、全体のプロセスを見る必要があります。

Kieran Chandler: Joannes、Lokadには常に場所があると非常に自信を持っていますね。将来を見据えて、実際の市場でのその場所はどこにあると思いますか?

Joannes Vermorel: まず、私は純粋な予測について話す場合でも、より良い予測を得るためのカードを持っていると信じています。しかし、「より良い」というのは今まで以上に難しいものです。平均絶対誤差の観点でより良い予測ができると言うことは一つのことですが、確率的な世界に入ると別のゲームになります。

「需要を予測したいが、明日ではなく、私のコンテナが到着する確率的な時間軸で予測したい」と言い始めると、未来の不確定な時点から始まり、別の不確定な時点で終わる需要になります。より多くの次元があると、事態は非常に複雑になることがあります。そして、私の競合他社が価格を下げる確率を含めるように始めると、それが需要の形状に非常に具体的な影響を与える可能性があることがわかります。予測の正確さは一次元のものではありません。これには全体の複雑さがあります。

Kieran Chandler: 突然、モデルが複雑になります。非常に素晴らしいオープンソースのツールキットがあっても、それらをバグフリーで本番向けに組み合わせることはまだまだ他の多くのことがあります。

Joannes Vermorel: はい、純粋な予測の観点を取るなら、それは一つのアプローチだと思います。しかし、Lokadでは、私たちのビジョンは、特定のサプライチェーンに対してスマートな意思決定を生成するためのより深いエンドツーエンドの分析オーバーレイを持つことです。私たちはサプライチェーンシステムを管理していませんし、ERPではありません。在庫の移動のすべてのリポジトリになることは望んでいません。このデータのコピーは持っていますが、私たちはスマートな分析オーバーレイです。

それがビジョンです。そして、たとえLokadが完全にオープンソースのツールで構築されていたとしても、それをすべて組み合わせることにはまだ価値があります。たとえば、現在利用可能なクラウドコンピューティングプラットフォームは、オープンソースのものを巨大なマッシュアップしたものですが、人々はAmazonを選ぶことが好きです。自分でやることもできますが、それらをすべて組み合わせるのは非常に大きな努力が必要です。だから、専門家にやってもらうことには価値があります。

Pythonとオープンソースのこのエコシステムについて私が見る欠点の一つは、非常に速い進化を遂げていることです。自分でやる場合、危険があります。Pythonのバージョンやツールキットを選び、そして数年後には劇的に改善されたものが出てくるかもしれません。突然、最先端だったのに、今はそうではなくなってしまいます。世界が動き続け、研究所が新しいツールキットを作成したためです。

たとえば、Scikitは数年前まではほとんどすべての面でリーディングでしたが、今ではPyTorchが深層学習と差分可能プログラミングを取り入れることで完全に挑戦しています。したがって、疑問が生じます。2年前に実装したものを誰が見直し、最新のものに更新する責任があるのでしょうか?良いベンダーは、データサイエンスのソリューションが定期的に見直され、おそらく定期的に書き直されて最先端の状態を保つことを確認することになります。

データサイエンスの進歩の黄金時代がどれくらい続くかはわかりませんが、次の10年のようなものでは、2年ごとに前のものよりもはるかに優れた進歩が見られるかもしれません。アクセスが困難に思える問題のカテゴリがあるかもしれませんが、アクセス可能になるかもしれません。

Nicolas Vandeput: 付け加えさせていただければ、Lokadが扱える複雑さについてJoannesが言及したことは非常に興味深いと思います。私は個人的にLokadのチームと一緒に働いたことがあるので、彼らが何ができるかを知っています。私の本のメッセージの一つは、人々にそれができると伝えることです。

Joannesが言っていることを聞いて、「わあ、データサイエンスと機械学習は本当に複雑そうだけど、私には向いていないかもしれない」と思う人もいるかもしれません。私は「いいえ、それほど複雑ではありません。簡単なモデルから始めることができます」と言って人々を安心させたいと思っています。実際、この本が示しているように、非常にシンプルなモデルから始めることができますが、それだけで非常に強力です。そして、そこからさらにレイヤーを追加したり、システムを微調整したり、データを変更したり、別のモデルを導入したりすることができます。

ですから、本当にうまく機能するシンプルなものから始めて、そこからより複雑な問題に進むことができます。それが私が本で伝えたいメッセージです:シンプルに始めてから進んでいくことができます。

Kieran Chandler: モデルが機能しているかどうかを判断する方法を教えていただけますか?テストすることはできますか?複雑なモデルにもこれらの原則は適用されるように思えますが、基本的なモデルを理解した後、より複雑なモデルにも理解することができますか?

Nicolas Vandeput: 絶対に、私は人々にシンプルに始めることを強く勧めます。基本を押さえたら、より複雑なものに進むことができます。

Kieran Chandler: それは私の最後の質問に非常にうまくつながります。あなたの本の読者とオープンソースのツールキットの使用に対するあなたの希望は何ですか?

Nicolas Vandeput: 私のビジョン、そして実際には私の希望は、人々がこの本を読んで自信を持つことです。本の最後に、彼らが自分自身に言えるようにしたいのです。「はい、私は本当にこれができます。それほど複雑ではないように見えます。」2週間前までコーディングができなかったかもしれませんが、最後には非常にシンプルに見えるようにしたいのです。これらの人々には、自分自身で実験を始めて、本当にデータサイエンスを生きて、新しいモデルを試してほしいと思っています。彼らが供給チェーン管理の新しいリーダーになってくれることを願っています。これもLokadのメッセージの一つです。私たちはすでに供給チェーンの量的な世界にいます。一貫して機能するソリューションを実験し、実装することができます。そのためにはデータサイエンスが必要です。だから、本が人々にそれを自分自身でやってみる力を与えることを本当に願っています。

Kieran Chandler: 今日は時間がなくなってしまいましたが、Nicolas、ありがとうございました。

Nicolas Vandeput: ありがとうございます。

Kieran Chandler: 本「Data Science for Supply Chain Forecast」はすでに発売されています。Amazonでチェックしてみてください。Lokad TVでは、また別のエピソードで戻ってきます。それまで、ご視聴ありがとうございました。

Joannes Vermorel: ありがとうございました。