00:00:08 データサイエンスプロジェクトが日常業務に影響を与えられないという厳しい現実.
00:00:55 ほとんどの企業でデータサイエンスが誇張された統計モデリングとして理解されているという現実.
00:02:17 古典的な統計モデリングと、Google、Microsoft、Amazonといった企業が実践している方法との違い.
00:03:51 電磁気学の歴史とデータサイエンスとの比較.
00:07:04 データサイエンスにおけるKaggleマインドセットの問題.
00:08:01 テクノロジーの革新が実際の世界でどのように機能するかについての議論.
00:09:01 Amazonがどのようにeコマースを革命的に変革したかの例.
00:10:01 ほとんどのデータサイエンス部門が学術的な手法に固執しているという説明.
00:12:34 企業にとって最大のリスクは陳腐化することであるという説明.
00:14:06 企業におけるAIとディープラーニングの将来的な重要性についての議論.
00:16:01 自律走行車の進展は驚異的だが、工業化できるかが問題.
00:16:17 議論はサプライチェーンや金融分野における技術の応用へとシフト.
00:17:37 企業のデータサイエンスチームが企業存続にどれほど重要であるかを見極めるためのリトマス試験.
00:20:07 経営幹部が自社でデータサイエンスを効果的に活用するために「機械的共感」を持つことの重要性.
00:22:34 企業を革新するために大学卒業直後の若者を採用するという考えは、空想に過ぎず知的怠慢であるという指摘.
Summary
キーロス・チャンドラーとのインタビューで、ジョアンヌ・ヴェルモレルは、多くの企業が既存の統計モデルに頼るあまり、データサイエンスの本来の潜在能力を十分に活用できていない点について論じています。彼は、企業がプロセスを再構築し、革新的な統計手法を採用すべきだと考えています。ヴェルモレルは、技術的能力を取り入れ、経営層に「機械的共感」を組み込むことの重要性を強調しています。彼は、若いエンジニアを雇うだけでは企業の変革に不十分であり、本当に新技術を活用するためには、経営層が機械的共感を持つ必要があると主張しています。成功する起業家は非常に若いか、または新会社の設立を通じて得た豊富な経験を持つかのいずれかであり、新卒者に依存して企業を変革しようとするのは空想に過ぎず知的怠慢です.
Extended Summary
このインタビューで、キーロス・チャンドラーはLokadの創設者であるジョアンヌ・ヴェルモレルと、データサイエンスにおける古典的な統計モデリングの欠点および、企業がこの分野で成功するためにどのようにアプローチを見直す必要があるかについて語ります.
ヴェルモレルは、多くの企業がデータサイエンスを誇張された統計モデリングとみなし、既存の統計モデルをデータに適用していると説明します。しかし、Google、Microsoft、Amazonのように本当にデータサイエンスに真剣な企業は、既存モデルの単なる適用に留まらず、統計手法の本質を再考し、新たな手法を発明しています.
彼は、現在多くの企業で採用されているデータサイエンスのアプローチがあまりにも単純であると主張し、これを19世紀に電磁気学が導入された際の状況に例えます。当時、人々は電磁気学を品質管理など特定のタスクに有用な道具としか見なしていませんでした。しかし、一旦電気が利用可能になると、産業全体が変革されました。同様に、ヴェルモレルは、データサイエンスにも企業を革新する可能性があるが、企業がアプローチを変えた場合にのみその可能性が発揮されると考えています.
彼は、データを収集・クレンジングし、統計モデルを適用して結果を出すという、一般的なデータサイエンスのアプローチを批判します。彼によれば、この手法は(しばしばKaggleコミュニティに代表されるように)単純すぎ、与えられたデータセットと問題に対して最適なモデルを探すことに偏り、基礎となるデータやその潜在的応用を真に理解していないのです.
その代わりに、ヴェルモレルは、企業が電気が産業を革新したように、データサイエンスを自社プロセスの再発明の手段として捉えるべきだと示唆します。これは、単に既存モデルをデータに適用するのではなく、データサイエンスの潜在力を完全に引き出すための新たな統計手法やアプローチを実際に開発するという、マインドセットの転換を必要とします.
ジョアンヌ・ヴェルモレルは、多くの企業が新たな手法の開発ではなく既存の統計モデルの適用に留まっているため、データサイエンスの本来の潜在力を十分に活用できていないと主張します。データサイエンスから真に利益を得るためには、企業はアプローチを見直し、プロセスの再構築と革新的な統計手法の開発に注力する必要があります.
ヴェルモレルは、新技術の採用は単に大学から学びイノベーションを実装するという直線的なプロセスではないと主張します。むしろ、企業は新技術と継続的に対話し、その技術が提供する能力に基づいて洞察を得、将来のニーズを予測する必要があります.
ヴェルモレルは、Amazonによるeコマースの発展の例を挙げ、同社が商取引の未来を再考し、要件を確立し、革新的な解決策を打ち出さなければならなかったことを強調します。彼は、成功するイノベーションの鍵は問題を明確に理解し、適切な質問をすることにあると説いています.
なぜ多くのデータサイエンス部門が依然として学術的アプローチに固執するのかと問われると、ヴェルモレルは主な要因として怠慢を挙げます。企業はしばしば「バズワード的」な手法を選び、これらの技術が自社のビジネスモデルを根本から変革する可能性を考慮せず、最新のトレンドに投資します。ヴェルモレルは、企業が化粧的な改善を追求するのではなく、新技術がもたらす根本的変化の理解に注力すべきだと示唆します.
チャンドラーは、新技術の採用やビジネスモデルの変革のリスクが変革への抵抗につながっているのではないかと疑問を呈します。ヴェルモレルはその固有のリスクを認めつつ、革新に失敗した企業が陳腐化するリスクを指摘します。彼は10年前の経験を踏まえ、小売業者にAmazonの破壊的可能性について警告しました。最初はAmazonを取るに足らないものと見なしていた小売業者も、今ではeコマース大手と競争するのに苦労しています.
ヴェルモレルによれば、AmazonやAlibabaが直面する規模の不経済にもかかわらず成長を続けていることは、彼らが競合他社に比べて圧倒的に先行していることを示しています。経営層はリスクを最小限に抑えるため現状維持に走りがちですが、ヴェルモレルはそれを続けることが企業の没落につながると警告します。むしろ、企業は新技術に積極的に取り組み、破壊に直面しても競争力を維持できるよう、モデルを適応させるべきです.
彼らは、高度な統計手法の役割、サプライチェーン管理の未来、そして企業がどのようにデータ主導の文化をチームに根付かせるかについて議論しています.
まずヴェルモレルは、先進的な統計手法の重要性を軽視する企業のマインドセットに言及します。彼は、90年代初頭にインターネットに適応しなかった企業の例を挙げ、新技術へ投資しないリスクを企業が見過ごすべきでないと主張します。企業は新技術を採用するというリスクを取らなければ、時代遅れになる危険性があると彼は強調します.
AIやディープラーニングの将来の重要性について問われた際、ヴェルモレルは、チェスや自律走行車などの分野でGoogle、Amazon、Microsoftのような企業が成し遂げた驚異的な成果を例に挙げました。彼は、これらの技術が今後も進化し、サプライチェーン管理において不可欠な役割を果たすと信じています。また、サプライチェーン最適化と、数十年にわたって行われている金融の定量取引との類似性にも言及します.
データサイエンスチームに革新とリスクテイクの文化を根付かせるために、ヴェルモレルは一つのリトマス試験を提案します。もし企業が一夜にして全データサイエンティストを解雇した場合、その企業は致命的なダメージを受けるか、1年以内に破産するでしょうか?もし答えが「いいえ」であれば、その企業はデータサイエンスチームに十分なリスクを取らせていない可能性が高いのです。彼はこれを、インターネット黎明期に企業がウェブ開発者に大きなリスクを取らせた状況に例えます。当時、技術が従来の方法に比べ劣っていると見なされていたにもかかわらず、このリスクテイクが企業をデジタル時代に適応させ、繁栄へと導いたのです.
彼らは、企業が技術的能力を取り入れ、経営層にこれらの側面を組み込んだ戦略を持つことの重要性について議論しました。彼は「機械的共感」という概念を強調し、経営者が技術的要素を深く理解することで、エンジニアと協力して熟慮した判断を下すことが可能になると述べています.
ヴェルモレルは、若く才能あるエンジニアの採用だけでは企業を革新するには不十分であると主張します。むしろ、新技術の潜在力を真に活用するためには、経営者が機械的共感を持つことが不可欠です。彼は、成功する起業家の共通点は非常に若いか、または新会社の設立を通じて得た豊富な経験と知恵を持つことであり、新卒者に依存して企業を変革しようとするのは空想に過ぎず知的怠慢であると結論付けています.
Full Transcript
Kieran Chandler: 今日のLokadTVでは、古典的な統計モデリングの枠を超え、なぜデータサイエンス部門が単にデータを収集し、操作し、結果を提供するだけでなく、それ以上の役割を担うべきかについて議論します。ジョアンヌ、私たちの多くは未だに古典的な統計モデリングに取り組む段階にあります。今日の重要な考えは何でしょうか?
Joannes Vermorel: いくつかの考えがあります。まず、このエピソードで「統計モデリング」という用語を使っているのは、多くの企業で実践されているデータサイエンスが、実際には誇張された統計モデリングに過ぎないからです。一般の皆さんのために申し上げると、パターン抽出や人間の知能の一側面の再現に関して、現時点で我々にあるのは統計学だけなのです。これらの統計手法にはディープラーニングのような派手な名称が付くこともあり、中にはそれをAIと呼ぶ人もいますが、実際に我々が持っているのは統計モデルに過ぎません.
かつて、数十年前には、シンボリックアプローチのような非統計的手法でAIを試みる動きがありましたが、実用的な成果はほとんど得られませんでした。この分野は廃れ、現時点で有意義なレベルで存続しているのは統計的手法だけとなっています。つまり、データで何か派手なことを行うには、統計手法しかないのです.
興味深いのは、実際に多くの企業でデータサイエンスを行っているチームが何をしているかということです。彼らは単に統計モデルで遊んでいるに過ぎません。これに対して、たとえばGoogle、Microsoft、Amazonのように本気で取り組んでいる人々は、単なる統計モデリングに留まらず、ディープラーニングを単に操るのではなく、ディープラーニングを発明するように、次なる統計手法の本質を再考しています。つまり、単一の統計モデルであるグラデーションブーステッドツリーを別のデータにただ適用するのではなく、その次の段階を発明しているのです.
Kieran Chandler: 一般的な理解としては、これらのチームはデータを収集し、クレンジングし、統計モデルを適用して結果を出すとされています。では、GoogleやAmazonはそれよりも何をしていて、何がそれを優れているのでしょうか?
Joannes Vermorel: この疑問に答えるためには、少し時を遡って、例えば19世紀、電磁気学が全く新しいものであった時代について再考する必要があると思います.
Kieran Chandler: 歴史を少し読めば、人々がどのようにそれに取り組んでいたかがわかります。たとえば、「ああ、電磁気学がある。とても興味深い」と感じたはずです。当時の産業企業、つまり前工業化の企業を想像してください。半ば手作業の製造業者が存在し、そこに興味を引く電磁気学が登場し、「これは本当に小規模なチームで派手なことを行う価値がある」と考えたのです。そして、品質管理のために、導電性をテストできるいくつかの手法を持つことは非常に有望であり、生産物の品質管理の良い方法だと考えたのです.
Joannes Vermorel: しかし、1世紀後にそれを振り返ると、これがいかに馬鹿げた考えであったかがわかります。つまり、電気があれば、エンジン、電気照明、暖房、冷房、さらには金属の溶解さえ可能になります。それにより、製造業における明火の必要性はすべてなくなるのです。一度大規模に電気が利用可能になれば、事実上、運用方法そのものをほぼ再発明できるのです。問題は、データサイエンスが派手なガジェットのように捉えられ、問題が提示される枠組みに従っている点にあります.
Kieran Chandler: 学界でのやり方は、明確に定義されたデータセット、一連のモデル、そして何らかの精度指標を使って問題を提示し、何らかの予測を行うというものです。そして、様々なモデルを検証し、最も優れた性能を示すモデルを探します。これは以前に取り上げたKaggleコンペティションにそのまま表れています.
Joannes Vermorel: 「すべては既に枠組み化されている。与えられたデータセット、特定の指標付きの問題、そして無限に近い数のモデルが存在する」と言う人もいます。多くの場合、これらのモデルは様々な方法で組み合わせることができ、保有する特徴量を再構築してデータセットをより良くすることさえ可能です。これがデータサイエンスなのです.
Kieran Chandler: その種のKaggleマインドセットには何がそんなに問題なのでしょうか? 単に単純すぎるだけで、唯一正確な結果が得られるとでも言っているのでしょうか?
Joannes Vermorel: 歴史を振り返ってみると、一度しか現れなかった事例が、常態化すると明らかになります。しかし現時点では、時流の先端にいるとそれは見えにくいのです。常識になれば、問題が明白になるのです。だから、データサイエンスに話を戻すと、企業はどうしても自分たちのペットプロジェクト、つまり少しAIを組み込んだ派手な数値機器のようなアプリケーションに固執してしまいます。おそらく、最も馬鹿げて無用なものはチャットボットでしょう。しかし、ツイッターでの会話方法を動的に学習し、正しい入力を与えられるだけで48時間でナチスのようになってしまう偉大な企業を作ろうと、多額の資金を集めた人々がたくさんいるのも事実です。そしてそれは全くのナンセンスです。
Kieran Chandler: それに戻りますが、新技術が何を伴うのかを考えようとするとき、単方向のプロセスではないという問題があります。人々は大学が発見し、それを学生に教え、工学やコンピュータサイエンスの学位を持った学生が企業に入り革新を推進すると考えがちですが、実際の世界は全くそうはいきません。
Joannes Vermorel: 現実の世界では、たとえばAmazonがほぼECの原型を発明し、eBayなど他の先駆者と共にそれを定義しました。ジェフ・ベゾスが90年代初頭に「ウェブマスターを雇ってウェブサイトを作る」と言ったわけではなく、遠隔で商取引を行う未来を実現するために本質的に異なる事柄について考えなければならなかったのです。
つまり、データサイエンスについては、問題は賢いエンジニアがソリューションを展開する枠組みを持っていると思い込んでいる点にあります。しかし実際は、ビジネスが新たな技術能力を獲得し、その未来のビジネスを見定めるという絶え間ない議論のプロセスなのです。そして、技術面で何が不足しているかという要求が明確になると、ほとんどの革新はその要求から生まれると気づくのです。一度必要なことがはっきりすれば、どの質問をするべきかが分かり、解決策を考えるのは難しくなくなります。
Kieran Chandler: それで、なぜ大半のデータサイエンス部門がいまだに学術的な発想にとらわれているのでしょうか? どうしてAmazonのような企業がもっと多く現れないのでしょう?
Joannes Vermorel: まず、一定規模の企業でこれらの流行語を目にすると、怠惰な対応策としてその予算に流行語的アプローチに数百万ドルを投じる一行を加えるのが容易だからです。データサイエンスチームなら「そうだ、それをやろう」、ブロックチェーンが流行なら「ブロックチェーンチームも持とう」と、日常業務として流行語に合わせて何かを導入し、熱が冷めるとフェーズアウトするのです。それがただの日常業務なのです。
私のメッセージは、何か実質的なことをしようとするなら、本当に自分の会社が高度な数値解析手法によってどれほど根本的に変わるのかを自問自答する必要があるということです。もし変化が、例えば自動でABC classesをより良く計算するというような表面的なものでしかなければ、会社に何の変化ももたらしません。しかし、全く新しい技術に適応するために会社のビジネスモデル全体を変えるとなると、全く別の話になります。
Kieran Chandler: それは本質的にリスクが大きいと言えるのでしょうか? 人々が理解できない新技術であるために、たくさんのリスクが伴い、安全策として今の状態を維持し、少しの研究開発に投資する方がずっと安全ということではないでしょうか?
Joannes Vermorel: 問題は、単に陳腐化して廃業に至るという常在リスクです。ほとんどの企業にとって、このリスクは現実的なものです。私は10年以上にわたり多くの小売業者と議論してきましたが、10年前、Amazonという会社が現れ、彼らがあなたのランチを奪うという非現実的な議論をしていたこともありました。何か手を打わなければならない、と。しかし人々は「見てください、まだ小さいです。確かに成長はしていますが、マーケットシェアは1%にも満たない。どうでもいい」と言っていました。今日、AmazonやAlibabaを見ると、彼らは非常に巨大でなおかつ成長を続けています。これは常軌を逸しています。一定規模を超えると規模の経済が働かず、むしろ非効率が生じますが、Amazonはその非効率の段階をはるかに超えているため、成長率1%を維持するためには非常に大きな非効率を克服しなければならないのです。つまり、彼らは他のほとんどの企業よりもわずかに優れているのではなく、桁違いに先を行っているのです。だから、経営者として、何もせず現状に甘んじるのが最も安全な手というのは間違いありません。しかし、このカードを何十年も使い続けると、結局その会社は置き去りにされるのです。私のメッセージはCEOへの問いかけです。あなたの会社にこのような思考が蔓延しているのを許せますか? 何か大きな問題が迫っているとは感じませんか? もしそうでなければ、あなたがドードー鳥のような運命をたどることに誰も涙を流さないでしょう。
Kieran Chandler: つまり、これらの先進的な統計手法は今月の流行のフレーバーのようなもので、AIやディープラーニングといった流行語ばかりが取り沙汰されています。しかし10年後にも、これがこれらの企業にとって依然として重要なテーマであり続けるという自信はどれほどあるのでしょうか?
Joannes Vermorel: それは良い質問です。まず、Google、Amazon、Microsoftのような企業がこれらの技術で達成した業績は目を見張るものがあります。たとえば、かつてはチェスのグランドマスターにすら太刀打ちできなかったプログラムが、今ではチェスチャンピオンに勝っているのです。Googleの最新の取り組みを見ると、チェスのプログラムがゼロから信じられないほど、人間離れしたレベルにたった4時間で到達し、全ての人間に勝つ状態にまでなることができます。コンピューターのチェスのプレイは、正直言って全く理解に苦しむもので、全く常識外れなのです。つまり、非常に狭く定義された問題においては、目を見張る成果がすでに現れています。しかし、自律走行車を見ると、それもまた驚異的で、実際に機能しているのです。
Kieran Chandler: 問題は、これが産業規模で実現可能かどうかということですね。確かにいくつかの疑念は残りますが、その進歩の度合いは本当に驚嘆すべきものです。
Joannes Vermorel: この一か八かの挑戦をして、これまでの多数のケースで実証されている技術が存在するというのは、とても合理的な信念です。サプライチェーンが完全に再構築される可能性はかなり高いといえるのです。ちなみに、サプライチェーンの場合、実はそれほど新しい話ではありません。Lokadでは定量的サプライチェーンというビジョンを提唱していますが、銀行や金融業界で行われている定量的トレーディングは、もはや未来の話ではなく、20年以上にわたって実践されているのです。つまり、このアプローチはサプライチェーンに導入されるのが2、3十年遅れているに過ぎず、金融ではすでに長年定着しているというわけです。
Kieran Chandler: もしこれを見ている誰かが、データサイエンスチームにそのような文化を根付かせるために何をすべきか悩んでいるとしたら、どのようなステップを踏めば良いのでしょうか? チームにもっとリスクを取らせ、革新的で簡単な現状維持的アプローチに反抗させるには、どうすれば良いでしょうか?
Joannes Vermorel: 単純なリトマス試験があると思います。もし会社が一晩で全てのデータサイエンティストを解雇したとして、会社は絶体絶命の危機に陥るでしょうか? 1年以内に破産するでしょうか? もし答えが「いいえ」なら、その人たちは取るに足らない存在であり、彼らに頼った活動は何の意味も持たないということです。「ああ、でもリスクが大きすぎる、あまりにも過酷だ」と言われるでしょう。しかし、90年代初頭のウェブに対するAmazonの状況を考え直してみてください。あの時、人々は「ウェブエンジニアに依存するなんて狂気の沙汰だ。モデムがとても遅く、接続確立に3分もかかる。画像も低解像度で、製品画像が表示されるまでに1分も待たなければならない。紙のカタログの方がずっとマシだ」と言っていたのです。しかし答えは、そうしなければ10年後、20年後には存在すらできなくなるというものでした。
Joannes Vermorel: もちろん、私は後知恵で語っています。今では状況は明らかですが、多くの企業がそれに気付き、データサイエンティストを採用したというのが現実です。しかし彼らは、経営陣がこれらの技術能力を最大限に活用する戦略を持っているかどうかが本質的な問題だと理解していません。
Kieran Chandler: それでは、あなたは自社のエンジンを作るエンジニアと知的で教育的な議論ができる「メカニカルシンパシー」を持っていますか? 現在のところ、経営陣にそのような「メカニカルシンパシー」が欠けていることが、企業におけるデータサイエンスの本当の大きな障壁の一つだと言っても過言ではないのでは?
Joannes Vermorel: 正直なところ、もし24歳の若者を採用して彼らに魔法のような力を発揮させて会社を再構築できるなら、それは素晴らしいことです。しかし、企業の歴史を振り返ると、たった一人の優秀なエンジニアが50年続いた会社の内部から完全に革命を起こすというケースは非常に稀です。主流のパターンは、非常に若い者か、45歳以上である者で、通常、資本や経験、そしてある程度の知恵を持っている者です。新しい会社でなければ、それは成立しにくいのです。
私のアドバイスは、大学を出たばかりの人材が会社を革命的に変えると考えるのは、夢物語であり、真剣な考えとは言えず、知的に最も怠惰な考え方だということです。
Kieran Chandler: では、ここで締めくくりましょう。本日はお時間をいただきありがとうございました。今週の内容はこれで全てです。ご視聴ありがとうございました。また次回お会いしましょう。