00:00:08 データサイエンスプロジェクトが日常の業務に影響を与えないという厳しい現実についての真実。
00:00:55 多くの企業におけるデータサイエンスの一般的な理解としての統計モデリングの称賛。
00:02:17 クラシックな統計モデリングとGoogle、Microsoft、Amazonなどの企業が行っていることの違い。
00:03:51 電磁気学の歴史とデータサイエンスとの比較。
00:07:04 データサイエンスにおけるKaggleのマインドセットの問題。
00:08:01 テクノロジーイノベーションが現実世界でどのように機能するかについての議論。
00:09:01 Amazonが電子商取引を革新した例。
00:10:01 データサイエンス部門の大半が学術的な方法に固執していることの説明。
00:12:34 企業にとって最大のリスクは時代遅れになることであるという説明。
00:14:06 AIとディープラーニングの将来的な重要性についての議論。
00:16:01 自動運転車の進歩は驚異的だが、産業化できるかどうかは疑問である。
00:16:17 技術のサプライチェーンや金融への応用についての議論が展開される。
00:17:37 企業のデータサイエンスチームが同社の生存に十分な重要性を持つかどうかを判断するための基準。
00:20:07 重役がデータサイエンスを効果的に活用するためには「機械的な共感」を持つことが重要であることの説明。
00:22:34 大学を卒業したばかりの若者を雇って企業を革新するという考えは甘い考えであり、知的な怠惰である。

要約

キーラン・チャンドラとのインタビューで、ジョアネス・ヴェルモレルは、多くの企業が新しい統計モデルの開発ではなく既存の統計モデルに焦点を当てているため、データサイエンスのフルポテンシャルを活用していないと指摘しています。彼は企業がプロセスを再発明し、革新的な統計手法を取り入れることの重要性を強調しています。ヴェルモレルは、技術的な能力を受け入れ、それを重役レベルで「機械的な共感」として取り入れることの重要性を主張しています。彼は、企業の変革には新卒エンジニアの雇用だけでは不十分であり、重役は新しい技術を真に活用するためには機械的な共感を持つ必要があると述べています。成功した起業家は非常に若いか経験豊富であり、後者は新しい会社を設立することでしばしば得られます。企業の変革に新卒者を頼ることは甘い考えであり、知的な怠惰です。

詳細な要約

このインタビューでは、キーラン・チャンドラがLokadの創設者であるジョアネス・ヴェルモレルと、古典的な統計モデリングのデータサイエンスにおける不足点について話し合い、企業がこの分野で成功するためにアプローチを見直す必要があるということについて議論しています。

ヴェルモレルは、多くの企業がデータサイエンスを称賛された統計モデリングと見なしており、既存の統計モデルをデータに適用していると説明しています。しかし、Google、Microsoft、Amazonなどの本気のデータサイエンスに取り組んでいる企業は、既存のモデルを単に適用するのではなく、統計手法の性質を見直し、新しい手法を創造しています。

彼は、現在の企業におけるデータサイエンスの考え方はあまりにも単純化されていると主張し、それを19世紀の電磁気学の導入と比較しています。当時、人々はそれを品質保証など特定のタスクに役立つ便利なツールとしか見ていませんでした。しかし、電気が利用されるようになると、産業全体が変革されました。同様に、ヴェルモレルはデータサイエンスがビジネスを革新する可能性を持っていると考えていますが、企業が異なるアプローチで取り組む場合に限ります。

彼は、データサイエンスへの一般的なアプローチを批判し、データの収集とクリーニング、統計モデルの適用、結果の提供という方法について述べています。彼は、この方法は過度に単純化されており、Kaggleコミュニティによって代表されることが多く、与えられたデータセットと問題に対して最適なモデルを見つけることに焦点を当てており、実際にはデータの本質やその潜在的な応用を真に理解することにはあまり関心がないと主張しています。

それに代わり、ヴェルモレルは、企業がデータサイエンスを産業を革新する手段として捉えるべきだと提案しています。これには、既存のモデルを単にデータに適用するのではなく、データサイエンスの真の可能性を引き出すために新しい統計手法やアプローチを開発するという考え方の転換が必要です。

ジョアネス・ヴェルモレルは、ほとんどの企業が新しい統計モデルを開発するのではなく、既存の統計モデルを適用することに焦点を当てているため、データサイエンスの真の可能性を最大限に活用していないと主張しています。データサイエンスの真の恩恵を受けるためには、企業がアプローチを見直し、プロセスを再発明し、革新的な統計手法を開発する必要があります。

ヴェルモレルは、新しい技術の導入が企業が単に大学から学び、革新を実施する線形のプロセスではないと主張しています。代わりに、ビジネスは新しい技術との持続的な議論に参加し、これらの技術が提供する機能に基づいて洞察を得て、将来のニーズを予測する必要があります。

ヴェルモレルは、Amazonが電子商取引の開発に取り組んだ例を挙げて、同社が将来の商業のあり方を見直し、要件を確立し、革新的な解決策を見つける必要があったことを強調しています。彼は、成功したイノベーションの鍵は問題を明確に理解し、適切な質問をすることだと強調しています。

データサイエンスの部門がなぜまだ学術的なアプローチを追求しているのかという質問に対して、ヴェルモレルは怠惰さが主要な要因だと述べています。企業はしばしば「バズワード的な」アプローチを選択し、最新のトレンドに投資するが、これらの技術がビジネスモデルを根本的に変える可能性を考慮しないことがあります。ヴェルモレルは、ビジネスが新しい技術が組織にもたらす深刻な変化を理解することに焦点を当てるべきだと提案しています。

チャンドラーは、新しい技術を採用し、ビジネスモデルを変えるリスクが変革への抵抗の理由かもしれないと疑問を呈します。ヴェルモレルは、リスクがあることを認めつつも、イノベーションを行わない企業が時代遅れになるリスクも指摘しています。彼は10年前の経験を共有し、小売業者にAmazonの破壊的な可能性について警告しています。これらの小売業者の多くは当初Amazonを無視していましたが、現在ではこの電子商取引の巨人と競争するのに苦労しています。

ヴェルモレルによれば、Amazonとアリババは、直面する「規模の経済の逆境」にもかかわらず、持続的な成長を遂げていることから、彼らは競争相手よりもはるかに先を行っているとのことです。経営者はリスクを最小限に抑えるために現状維持を図ることに誘惑されるかもしれませんが、ヴェルモレルはそれを継続的に行うことが会社の没落につながる可能性があると警告しています。代わりに、企業は新しい技術と積極的に関わり、破壊に対抗するために自社のモデルを適応させるべきです。

彼らは高度な統計技術の役割、サプライチェーン管理の将来、および企業がデータ駆動型の文化をチームに浸透させる方法について議論しています。

ヴェルモレルはまず、高度な統計技術の重要性を無視する企業の考え方について言及しています。彼は、1990年代初頭にインターネットに適応しなかった企業の例を挙げ、新しい技術への投資を怠るリスクを見逃してはならないと主張しています。彼は企業が新しい技術を採用するリスクを取るか、時代遅れになるリスクを冒す必要があると強調しています。

AIやディープラーニングの将来の重要性について尋ねられた際、ヴェルモレルはGoogle、Amazon、Microsoftなどの企業がチェスや自動車などの分野で驚異的な成果を上げていることを指摘しています。彼は、これらの技術が引き続き進化し、サプライチェーン管理において重要な役割を果たすと考えています。彼はサプライチェーンの最適化と金融の量的取引の間に類似性を見出し、後者がすでに数十年前から存在していることを示しています。

データサイエンスチームにイノベーションとリスクを取る文化を浸透させるために、ヴェルモレルはリトマステストを提案しています。もし会社が一晩で全てのデータサイエンティストを解雇した場合、会社は致命的な危機に直面するか、1年以内に破産する可能性があるでしょうか?もし答えが「いいえ」であれば、その会社はおそらくデータサイエンスチームに十分なリスクを取っていないと言えます。彼はこれを、インターネットの初期の時代において、当時の技術が従来の方法に比べて見劣りするものであったにもかかわらず、企業がウェブ開発者に大きなリスクを取ったことになぞらえています。このリスクを取ることによって、これらの企業はデジタル時代に適応し繁栄することができました。

彼らは、企業が技術的な能力を受け入れ、これらの側面を経営層で組み込むことの重要性について議論しました。彼は、経営者が技術的な要素に深い理解を持ち、エンジニアと協力して教養ある意思決定をすることができる「機械的な共感」の概念を強調しています。

ヴェルモレルは、若くて優れたエンジニアを雇うだけでは企業を革新することはできないと主張しています。むしろ、新しい技術の潜在能力を十分に引き出すために、経営者が機械的な共感を持つことが重要だと述べています。彼は、成功した起業家の一般的なパターンは、非常に若いか、または新しい会社を設立することによって得られる経験と知恵を持っていることであり、これはしばしば大学卒業生に会社を変革させることは甘い考えと知的な怠惰さだと強調しています。

フルトランスクリプト

キーラン・チャンドラー: 今日のLokadTVでは、古典的な統計モデリングを超えて、データサイエンスの部門がデータを収集し、操作し、結果を提供するだけでなく、もっと多くのことを行う必要がある理由について考えていきます。では、ジョアネスさん、私たちのほとんどはまだ古典的な統計モデリングについて理解を深めている最中ですが、今日のキーポイントは何ですか?

ジョアネス・ヴェルモレル: いくつかのアイデアがあります。まず、このエピソードでは「統計モデリング」という用語を使用しています。なぜなら、ほとんどの企業で想定されているデータサイエンスの実践を見ると、それは単なる統計モデリングの称賛に過ぎません。一般の観客の方々に対して、もし気になることがあれば、パターンの抽出や人間の知性の一部を再現するという観点から言えば、現時点では統計学しかありません。これらの統計的手法は、ディープラーニングのような洒落た名前を持つこともあり、一部の人々はそれらをAIと呼ぶかもしれませんが、実際には私たちが持っているのは統計モデルです。

過去には、数十年前に、統計的でないアプローチでAIを試みる試みがありました。例えば、象徴的なアプローチと呼ばれるものですが、ほとんど実用的な結果は得られませんでした。この分野は衰退し、現在では意味のある程度で唯一残っているのは統計的アプローチです。ですので、データを使って何か特別なことをするために私たちが持っているのは統計的手法だけです。

興味深いことは、実際にデータサイエンスを行っているほとんどの企業のチームが何をしているのかということです。彼らは統計モデルで遊んでいるのです。それに対して、GoogleやMicrosoft、Amazonのように本気で取り組んでいる人々がやっていることとは異なります。彼らは単に統計モデリングを行っているのではなく、次の統計手法の核心的な性質を再考しています。つまり、ディープラーニングを発明することに対して、ディープラーニングで遊ぶこととは異なります。それは、勾配ブースティング木の次の段階を発明することに対して、単に勾配ブースティング木という1つの統計モデルを別のデータセットに適用するだけではありません。

キーラン・チャンドラー: つまり、一般的な理解では、これらのチームはデータを収集し、クリーニングし、統計モデルを適用し、結果を提供しているということですね。では、GoogleやAmazonがそれよりも優れているのは何ですか?

ジョアネス・ヴェルモレル: この質問に答えるためには、少し時間を遡って19世紀のことを考え直す必要があります。その頃、電磁気が新しいものとして注目されていました。

キーラン・チャンドラー: もし少し歴史を読んだら、人々がそれに取り組んでいる方法を見ると、「ああ、電磁気がある。それは非常に興味深いものだ」と言うでしょう。想像してみてください。当時の工業会社、まだ前工業化時代の会社です。半手動の製造業者がいて、そして興味を持ち始めている電磁気があります。そして、「ああ、それは本当に価値があると思います。少し洒落たことをするための小さなチームを持つ価値があると思います。そして、品質保証のために、導電性をテストするいくつかのものを持っているかもしれません。それは非常に有望です。そして、私たちが生産するいくつかのものに対して品質保証を行うために、導電性をテストすることは素晴らしい方法です」と言うでしょう。

ジョアネス・ヴェルモレル: もし1世紀後にそれを考え直すと、これはばかげたことだと思うでしょう。つまり、電気があれば、エンジンや電気照明、暖房、冷房、さらには金属を溶かすことさえできます。製造業においてオープンフレームを持つ必要性をすべて取り除くことができるのです。ですので、電力を大規模に利用できるようになれば、ほとんどすべてのことをやり直すことができます。問題の捉え方に縛られて、データサイエンスが考えられているのです。

キーラン・チャンドラー: つまり、学術界でのやり方は、データセットが明確に定義されたものであり、一連のモデルと精度指標があるというように問題を提示するということです。そして、さまざまなモデルを探索し、最も優れたモデルを見つけることを目指すのです。そして、それは以前に議論したKaggleのコンペティションに具体的に体現されています。

ジョアネス・ヴェルモレル: 人々は言います。「すべてがフレーム化されている。与えられたデータセット、特定のメトリックを持つ問題、そして無数のモデルが存在する。それらのほとんどはさまざまな方法で組み合わせることができ、持っている特徴を再設計して、モデルに対してデータセットをより良くすることもできます。それがデータサイエンスです。

キーラン・チャンドラー: そのようなKaggleの考え方には何が間違っているのでしょうか?単に過度に単純化されているだけで、正確な結果が1つだけ得られると言っているだけなのでしょうか?それとも何か他の理由があるのでしょうか?

ジョアネス・ヴェルモレル: 歴史を見ると、過去に1度だけ見ることができるものであり、明らかになります。しかし、現在の時点では、周縁部にいると見ることが難しいです。それが一般的になった後は、それが非常に明白です。ですから、データサイエンスに戻ると、私は企業が必ずしもペットプロジェクト、ペットアプリケーション、数値的に派手なガジェットを取り上げているのを見ます。AIの一部を組み込んだものです。おそらく最も馬鹿げて役に立たないものはチャットボットです。しかし、正しい入力を与えたことで48時間でナチスになることができる素晴らしい会社を開発するために多くの資金を集めた人々がたくさんいることを知っています。それはまったくばかげています。

キーラン・チャンドラー: それについて話を戻すと、新しい技術が何を意味するのか考えるとき、それは一方通行のプロセスではありません。人々は大学が何かを発見し、それを学生に教え、エンジニアリングの学位、コンピュータサイエンスの学位などを持つ卒業生が企業に入り、イノベーションを展開すると思っていますが、実際の世界ではまったくそうではありません。

ジョアネス・ヴェルモレル: 実際の世界では、例えば、Amazonはほぼ電子商取引となるものを発明しました。eBayや他のパイオニアと共にです。彼らはそのイノベーションを通じてそれを定義しました。ジェフ・ベゾスが90年代初頭にどこかに行って「ウェブマスターを雇ってウェブサイトを作る」と言ったわけではありませんでした。彼らは実際には遠隔での商取引の未来について考えなければならず、それはこれまでに行われたものとは根本的に異なるものでした。

ですから、データサイエンスは、スマートなエンジニアがソリューションを展開するためのフレームワークを持つことだと思っているのですが、実際には、それはより継続的な議論のプロセスであり、ビジネスが新しい技術の能力に洞察を得て、将来のビジネスについて自己投影することです。それから、実際に実装するために技術的に不足しているものを確立します。そして通常、イノベーションのほとんどは要件から生まれることに気付きます。必要なものが明確にわかれば、質問するべき問題がわかっていれば、解決策はそれほど難しくありません。

キーラン・チャンドラー: なぜほとんどのデータサイエンス部門がまだそのような学術的なやり方に固執していると言えるのでしょうか?つまり、なぜ彼らの多くがAmazonのような存在ではないのでしょうか?

ジョアネス・ヴェルモレル: まず、ある程度の規模の会社であれば、これらのバズワードを見ると、手抜きの方法は、予算に1行追加して、その日のバズワード的なアプローチに数百万ドルを年間で費やすことです。データサイエンスチームなら、それをやりましょう。ブロックチェーンが流行っているなら、ブロックチェーンチームも作りましょう。彼らは日々の業務として、その日のバズワードを導入し、ハイプから外れたものを段階的に廃止していきます。それはただの日常業務です。

私のメッセージは、何か本質的な変化をもたらすために何かをしたいのであれば、自分の会社における洗練された数値的手法による変化は何であるか、ということを考える必要があるということです。もし変化が見た目の改善だけである場合、例えばABCクラスをより良い方法で自動計算することなど、会社には何も変わりません。しかし、会社のビジネスモデル全体を新しい技術に適応させるために変えるのであれば、話は別です。

キーラン・チャンドラー: それは本質的にリスキーではないですか?そして、人々がそれを理解していない場合、新しい技術には多くのリスクが伴うため、それをそのままにしておく方が安全ではないでしょうか?それならば、少しの研究開発に投資する方が安全ですよね?

ジョアネス・ヴェルモレル: 問題は、時代遅れになってしまい、事業を失うという周囲のリスクです。ほとんどの企業にとって、このリスクは非常に現実的です。私は10年以上にわたり多くの小売業者と議論してきましたが、10年前には、この会社であるAmazonがやってくるし、彼らがあなたのビジネスを食いつぶすだろうと言っていました。何かしなければいけないと。しかし、人々は私に言っていました。「ああ、でも見てください、それはとても小さいです。はい、成長していますが、まだ市場シェアの1%にも達していません。私たちは気にしません。」今日、Amazonとアリババを見ると、彼らは絶対に巨大であり、まだ成長しています。これは狂気です。彼らが受けている規模の経済効果を考えると、ある程度のサイズを超えると、経済のスケールメリットではなく、経済のディススケールメリットが得られます。Amazonは経済のディススケールメリットの段階を過ぎているため、彼らが成長するためには、絶対に巨大な経済のディススケールメリットを克服しなければなりません。つまり、彼らは他のほとんどの企業よりもわずかに優れたことをしているのではなく、光年先にいるのです。ですから、確かに、経営者としては、何もしないか、常に現状に挑戦しないことが最も安全な手段です。しかし、このカードを数十年間継続的にプレイすると、会社はただ通り過ぎていくだけです。私のメッセージはCEOに対してです。あなたの会社でこの考え方が広まっていることに耐えられますか?将来に問題が見えていませんか?もし見えていないのであれば、ドードーのように去っていくことについて誰も涙を流さないでしょう。

キーラン・チャンドラー: では、これらの高度な統計的手法は今のところ非常に注目されていますが、10年後にこれがこれらの企業にとって重要なトピックであるという自信はどれくらいありますか?

ジョアネス・ヴェルモレル: それは良い質問です。まず、GoogleやAmazon、Microsoftなどの企業の成果は驚くべきものです。例えば、チェスのグランドマスターを上回るのは非常に困難だったプログラムから、チェスのチャンピオンを打ち負かすようになりました。Googleの最新の研究を見ると、チェスに関しては、ゼロから人間を超えるレベルになるまで、わずか4時間で学習するプログラムを設定することができます。それは文字通り非人間的なレベルであり、生きている人間全てに勝つことができます。コンピュータがゲームをプレイする方法は理解不能であり、まったく意味をなさないのです。ですから、非常に狭い範囲で非常に優れた成果があります。しかし、自律型車両を見ると、それもまた驚くべきものです。うまく機能しています。

キーラン・チャンドラー: 問題は、産業化できるかどうかです。まだいくつかの迷いがありますが、進歩の量は本当に驚くべきものです。

ジョアネス・ヴェルモレル: この飛躍を信じることができるという事実と、これらの技術が長い一連のケースで実証されているという事実があります。供給チェーンの方法を完全に再発明する可能性は非常に高いと言える非常に合理的な信念です。ちなみに、供給チェーンの場合、これは非常に新しいものではありません。Lokadを見てみると、私たちは量的な供給チェーンのビジョンを提唱しています。しかし、現在の銀行や金融業界で行われていることを見てみると、すべてが量的な取引に関して行われています。彼らは量的アナリストを持っており、これは未来ではなく、すでに存在しており、20年以上前から存在しています。ですので、このアプローチは供給チェーンには2、3十年遅れていますが、金融業界ではすでに数十年間存在しています。

キーラン・チャンドラー: もし誰かがこれを見て、データサイエンスチームにそのような文化を植え付けるために何をすべきか疑問に思っている場合、どのような手順を踏むべきでしょうか?彼らのチームにリスクを取り、画期的なアプローチを取るように促すにはどうすればよいでしょうか?

ジョアネス・ヴェルモレル: 簡単なリトマステストができます。もし会社が一晩ですべてのデータサイエンティストを解雇した場合、会社は絶望的な困難に直面するでしょうか?会社は1年で破産するでしょうか?もし答えが「いいえ」であれば、おそらくそれらの人々は重要ではなく、それらの人々と何をしているかは重要ではありません。あなたは言うでしょう、「ああ、でもそれはとてもリスクがありますし、それはとても残酷です。」しかし、再考してみてください。Amazonが90年代初頭のWebの状況を考えてみてください。人々は言ったでしょう、「ああ、でも私たちはこれらのWebエンジニアに非常に依存しています。この見た目がとてもクソみたいな技術に依存することは狂気です。接続を確立するのに3分かかる超遅いモデムがあります。これはクソの山の上にあるクソの山です。そして、解像度の低い画像があります。まず、製品の画像を取得するために1分待ちますが、それはとてもクソです。この紙のカタログの方がはるかに優れています。すべての製品にリアルタイムでアクセスでき、高解像度の画像があります。このWebのものはただの無意味な大きな山です。なぜ私たちはこのWeb開発者に会社全体でのハードな依存関係をリスクにするのでしょうか?」まあ、答えは、それをしないと、10年後、20年後にはもう存在しないからです。

明らかに、私は後知恵で遊んでいます。今ではもっと明らかです。それを伝えるのは難しいですが、私は多くの企業がそれに気付いていると思います。それが彼らがこれらのデータサイエンティストを雇った理由です。しかし、彼らは、コアの幹部が本当に最善の技術的能力を発揮する戦略を持っているかどうかに気付いていません。それには戦略的な思考が必要です。

キーラン・チャンドラー: では、会社のエンジンを構築しているエンジニアとの知識を持った議論ができる機械的な共感を持っていますか?それは企業のデータサイエンスにおいて本当に大きな障害となっている要因の一つだと言えるでしょうか?

ジョアネス・ヴェルモレル: 正直に言って、24歳の人を雇って彼らに魔法をやらせることで会社を再発明できるなら、それは素晴らしいことです。しかし、会社の歴史を見てみると、50年以上続いている会社を内部から完全に革新した一人の優れたエンジニアを雇った回数は非常に少ないです。支配的なパターンは、若い人々または45歳以上の人々です。彼らは通常、資本、経験、そしておそらくある程度の知恵を持っています。それを得るには新しい会社が必要です。

私のアドバイスは、大学を卒業した人々を雇うことで会社を革新できると思うなら、それは望ましいことではありません。それは真剣ではなく、最善の場合には知的に怠惰です。

キーラン・チャンドラー: では、ここで終わりにしましょう。お時間をいただきありがとうございました。今週は以上です。ご視聴いただきありがとうございました。次のエピソードでお会いしましょう。ご視聴ありがとうございました。