00:00:08 Суровая правда о том, что проекты в области науки о данных не влияют на ежедневную работу бизнеса.
00:00:55 Общее представление о науке о данных в большинстве компаний сводится к преувеличенному статистическому моделированию.
00:02:17 Разница между классическим статистическим моделированием и тем, чем занимаются такие компании, как Google, Microsoft и Amazon.
00:03:51 История электромагнетизма и сравнение её с наукой о данных.
00:07:04 Проблема мышления, присущего сообществу Kaggle, в науке о данных.
00:08:01 Обсуждение того, как инновации в технологиях работают в реальном мире.
00:09:01 Пример того, как Amazon произвел революцию в электронной коммерции.
00:10:01 Объяснение того, что большинство отделов науки о данных застряли в академическом подходе.
00:12:34 Объяснение того, что самый большой риск для компаний — стать устаревшими.
00:14:06 Обсуждение будущей значимости ИИ и глубокого обучения в компаниях.
00:16:01 Прогресс в области автономных транспортных средств ошеломляет, но вопрос в том, удастся ли их индустриализировать.
00:16:17 Обсуждение переходит к применению технологий в цепочках поставок и финансах.
00:17:37 Критерий, позволяющий определить, насколько команда по науке о данных компании значима для её выживания.
00:20:07 Важность того, чтобы руководители обладали “механической симпатией”, чтобы эффективно использовать науку о данных в своей компании.
00:22:34 Идея нанимать молодых специалистов, только что закончивших колледж, для революционных преобразований компании — это мечтательность и интеллектуальная леность.

Резюме

В интервью с Кираном Чэндлером Жоаннес Верморель обсуждает, как большинство компаний не используют весь потенциал науки о данных, сосредотачиваясь на существующих статистических моделях вместо разработки новых. Он считает, что компании должны переосмыслить свои процессы и принять инновационные статистические методы. Верморель подчеркивает важность освоения технических возможностей и их интеграции на уровне руководства через “механическую симпатию”. Он утверждает, что наем молодых инженеров недостаточен для преобразования компании, и что руководители должны обладать механической симпатией, чтобы действительно использовать новые технологии. Успешные предприниматели либо очень молоды, либо обладают значительным опытом, часто приобретенным через основание новых компаний. Опираться на только что выпускников для преобразования компании — это мечтательность и интеллектуальная леность.

Расширенное резюме

В этом интервью Киран Чэндлер беседует с Жоаннесом Верморелем, основателем Lokad, о недостатках классического статистического моделирования в науке о данных и о том, как компаниям необходимо переосмыслить свой подход, чтобы добиться успеха в этой области.

Верморель объясняет, что большинство компаний рассматривают науку о данных как прославленное статистическое моделирование, применяя существующие статистические модели к данным. Однако компании, которые действительно серьезно относятся к науке о данных, такие как Google, Microsoft и Amazon, переосмысливают природу статистических методов и изобретают новые, а не просто применяют уже существующие модели.

Он утверждает, что текущее представление о науке о данных в большинстве компаний слишком упрощено и сравнивает его с введением электромагнетизма в XIX веке. В то время люди видели в нем лишь полезный инструмент для конкретных задач, таких как контроль качества. Однако, как только электричество было освоено, оно преобразило целые отрасли. Таким же образом Верморель считает, что наука о данных имеет потенциал для революционных преобразований в бизнесе, но только если компании подойдут к ней по-другому.

Он критикует общий подход к науке о данных, который заключается в сборе и очистке данных, применении статистических моделей и предоставлении результатов. Он утверждает, что этот метод, часто ассоциируемый с сообществом Kaggle, слишком упрощен и слишком сосредоточен на поиске лучшей модели для данного набора данных и проблемы, вместо того чтобы по-настоящему понимать базовые данные и их потенциальные применения.

Вместо этого Верморель предлагает, чтобы компании рассматривали науку о данных как способ переосмыслить свои процессы, подобно тому как электричество произвело революцию в промышленности. Это требует изменения подхода от простого применения существующих моделей к данным к разработке новых статистических методов и подходов, способных раскрыть полный потенциал науки о данных.

Жоаннес Верморель утверждает, что большинство компаний не используют весь потенциал науки о данных, поскольку они сосредотачиваются на применении существующих статистических моделей вместо разработки новых. Чтобы по-настоящему извлечь пользу из науки о данных, компании должны пересмотреть свой подход и сосредоточиться на переосмыслении своих процессов и разработке инновационных статистических методов.

Верморель утверждает, что принятие новых технологий — не линейный процесс, в котором компании просто учатся в университетах и внедряют инновации. Вместо этого бизнесу необходимо вести постоянный диалог с новыми технологиями, получая инсайты и прогнозируя свои будущие потребности на основе возможностей, которые эти технологии предоставляют.

Верморель приводит в пример развитие электронной коммерции в Amazon, подчеркивая, как компании пришлось переосмыслить будущее торговли, установить требования и найти инновационные решения. Он акцентирует, что ключ к успешным инновациям — это четкое понимание проблемы и умение задавать правильные вопросы.

На вопрос, почему многие отделы науки о данных по-прежнему используют академические подходы, Верморель указывает на лень как на основной фактор. Компании часто выбирают подход, основанный на модных словах, инвестируя в последние тренды, не задумываясь о том, как эти технологии могут фундаментально изменить их бизнес-модели. Верморель предлагает, чтобы бизнесы сосредоточились на понимании глубоких изменений, которые новые технологии могут внести в их организации, а не искали поверхностные улучшения.

Чэндлер задается вопросом, может ли риск внедрения новых технологий и изменения бизнес-моделей быть причиной сопротивления переменам. Верморель признает присущий риск, но также указывает на риск устаревания компаний, которые не умеют внедрять инновации. Он делится своим опытом десятилетней давности, предупреждая ритейлеров о разрушительном потенциале Amazon. Несмотря на первоначальное недооценивание Amazon как незначительного, многие из этих ритейлеров теперь испытывают трудности в конкуренции с гигантом электронной коммерции.

По словам Вермореля, продолжающийся рост Amazon и Alibaba, несмотря на дисэкономию масштабов, с которой они сталкиваются, указывает на то, что они находятся на световые годы впереди своих конкурентов. Хотя руководители могут быть склонны сохранять статус-кво для минимизации риска, Верморель предостерегает, что постоянное следование этому пути может привести к краху компании. Вместо этого бизнесу следует активно взаимодействовать с новыми технологиями и адаптировать свои модели, чтобы оставаться конкурентоспособными в условиях разрушения.

Они обсуждают роль продвинутых статистических методов, будущее управления цепочками поставок и то, как компании могут привить своим командам культуру, основанную на данных.

Сначала Верморель обращает внимание на образ мышления компаний, которые отвергают важность продвинутых статистических методов. Он утверждает, что компании не должны игнорировать риски, связанные с отсутствием инвестиций в новые технологии, приводя в пример бизнес, который не адаптировался к интернету в начале 90-х. Он подчеркивает, что компании должны рискнуть, внедрив новые технологии, иначе они рискуют стать неактуальными.

На вопрос о будущей значимости ИИ и глубокого обучения, Верморель указывает на поразительные достижения таких компаний, как Google, Amazon и Microsoft, в областях, таких как шахматы и автономные транспортные средства. Он считает, что эти технологии будут продолжать развиваться и играть важную роль в управлении цепочками поставок. Он проводит параллель между оптимизацией цепочек поставок и количественной торговлей на финансовых рынках, где последнее уже применяется десятилетиями.

Чтобы привить культуру инноваций и готовности к риску в командах науки о данных, Верморель предлагает испытательный метод: если бы компанию однажды уволили всех её специалистов по науке о данных, оказалась бы она в смертельной опасности или обанкротилась в течение года? Если ответ – нет, то, вероятно, компания не рискует достаточно со своей командой. Он проводит параллель с ранними днями интернета, когда компании шли на значительные риски с веб-разработчиками, несмотря на то, что технология казалась уступающей традиционным методам. Такой подход к риску позволял этим компаниям адаптироваться и преуспевать в цифровую эпоху.

Они обсуждали важность того, чтобы компании принимали технические возможности и имели стратегию, включающую эти аспекты на уровне руководства. Он подчеркивает концепцию «механической симпатии», при которой руководители глубоко понимают технические элементы, что позволяет им принимать обоснованные решения в сотрудничестве с инженерами.

Верморель утверждает, что найма молодых, блестящих инженеров недостаточно для революционных преобразований компании. Скорее, для полноценного использования потенциала новых технологий критически важно, чтобы руководители обладали механической симпатией. Он подчеркивает, что типичная модель успешных предпринимателей заключается либо в раннем возрасте, либо в значительном опыте и мудрости, часто приобретенной через создание новых компаний. Верморель приходит к выводу, что опираться на свежих выпускников для преобразования компании — это мечтательность и интеллектуальная леность.

Полная расшифровка

Kieran Chandler: Сегодня на LokadTV мы собираемся выйти за пределы классического статистического моделирования и обсудить, почему отделы науки о данных должны делать больше, чем просто собирать данные, обрабатывать их и предоставлять результаты. Так, Жоаннес, большинство из нас еще только осваивают классическое статистическое моделирование. В чем же ключевая идея на сегодня?

Joannes Vermorel: Есть несколько идей. Во-первых, я использую термин “статистическое моделирование”, как я и предложил для этого эпизода, потому что, если взглянуть на практики науки о данных, как их видят в большинстве компаний, это просто прославленное статистическое моделирование. Для широкой аудитории, на случай если вам интересно, когда речь идет об извлечении закономерностей или воспроизведении определенного аспекта человеческого интеллекта, у нас на данный момент есть только статистика. Эти статистические методы могут иметь модные названия, такие как глубокое обучение, и некоторые будут называть их ИИ, но фактически, что у нас есть — это статистические модели.

Несколько десятилетий назад предпринимались попытки создавать ИИ с помощью не статистических подходов, таких как символический подход, который дал практически нулевые практические результаты. Это направление исчезло, оставив статистический подход единственным, который по-прежнему существует в значимой мере в настоящее время. Таким образом, все, что нужно для работы с данными на высоком уровне — это статистические методы.

Интересно, что же делают те команды в большинстве компаний, которые действительно занимаются наукой о данных? Они играют со статистическими моделями. Я противопоставляю это тому, чем, скажем, действительно серьезно занимающиеся делом, такие как Google, Microsoft и Amazon. Они не просто занимаются статистическим моделированием; они переосмысливают суть следующего статистического метода, например, изобретая глубокое обучение, а не просто экспериментируя с глубоким обучением. Речь идет о создании следующего этапа градиентного бустинга деревьев, а не о том, чтобы взять модель градиентного бустинга деревьев и просто применить ее к другому набору данных.

Kieran Chandler: Итак, общее представление таково, что эти команды собирают данные, очищают их, применяют свои статистические модели и предоставляют результаты. В чем же тогда заключается то, что делают Google и Amazon, что превосходит это?

Joannes Vermorel: Думаю, чтобы ответить на этот вопрос, нам нужно вернуться немного назад во времени и переосмыслить, скажем, XIX век, когда электромагнетизм был совершенно новой вещью.

Kieran Chandler: Если вы немного изучите историю, как к этому относились, вы скажете: “О, есть электромагнетизм. Это невероятно интересно.” Представьте, что вы — промышленная компания того времени, доиндустриальная компания. У вас есть производитель, работающий частично вручную, а затем появляется этот фактор электромагнетизма, который начинает привлекать внимание, и вы думаете: “О, я считаю, что стоит сформировать небольшую команду для выполнения каких-то прорывных задач с его помощью.” И, возможно, для контроля качества у нас будут несколько способов тестирования проводимости, и это очень перспективно. Мы займемся несколькими интересными проектами, потому что, да, тестирование проводимости — отличный способ обеспечения качества нескольких производимых нами изделий.

Joannes Vermorel: Если задуматься об этом через столетие, вы бы подумали, что это чепуха. То есть, с электричеством у вас есть двигатели, электрическое освещение, отопление, охлаждение и даже возможность расплавлять металл. Это заменит необходимость открытого огня на вашем производстве. Итак, как только электричество становится массовым, вы можете буквально переосмыслить практически все в том, как вы это делаете. Проблема в том, что представление о науке о данных воспринимается как нечто вроде модного гаджета, и люди придерживаются рамок, в которых проблема представляется.

Kieran Chandler: Таким образом, в академической среде проблему представляют так, как будто у вас есть четко определенный набор данных, серия моделей и метрики точности, потому что вы хотите сделать какой-то прогноз. И мы собираемся исследовать различные модели и искать ту, которая покажет наилучшие результаты. И это буквально воплощено в соревнованиях Kaggle, о которых мы говорили ранее.

Joannes Vermorel: Люди говорят: “Все уже определено; имеется заданный набор данных, проблема с определенной метрикой, и далее идет бесконечная коллекция моделей.” Большинство из них можно даже комбинировать разными способами, и вы можете потенциально переработать имеющиеся признаки, чтобы улучшить набор данных с точки зрения имеющейся модели. Вот что такое наука о данных.

Kieran Chandler: Что не так с таким взглядом, распространённым на Kaggle? Разве он не слишком упрощённый, утверждая, что у вас будет всего один точный результат, или почему это так неправильно?

Joannes Vermorel: Если оглянуться на историю, и, повторюсь, это то, что можно увидеть единично, всё становится очевидным. Но в настоящее время, когда вы находитесь на периферии, это трудно заметить. Как только это становится нормой, всё предельно ясно. Итак, если я возвращаюсь к науке о данных, я вижу, что компании неизменно выбирают свои любимые проекты, своеобразные приложения, модные числовые устройства с примесью ИИ. Вероятно, самым абсурдно бесполезным являются чат-боты. Но я знаю, что многие люди собрали огромные суммы денег для создания великих компаний, которые могут динамически учиться вести диалог в Twitter и превращаться в нацистов за 48 часов — всё только потому, что им подали правильные входные данные. И это просто чепуха.

Kieran Chandler: Возвращаясь к этому, проблема в том, что когда вы задумываетесь, что подразумевает новая технология, процесс не является односторонним. Люди думают, что университеты что-то открывают, преподают это студентам, а выпускники с инженерными или компьютерными степенями идут в компании и внедряют инновации. Но реальный мир устроен совершенно иначе.

Joannes Vermorel: Реальный мир, например, таков: Amazon практически изобрёл то, что должно было стать электронной коммерцией, наряду с несколькими другими пионерами, такими как eBay. Они определили это посредством своих инноваций. Это не был Джефф Безос, который в начале 90-х сказал: “Я просто найму вебмастеров и создам сайт.” Им буквально пришлось подумать о том, каким будет будущее торговли на расстоянии, и это было нечто принципиально иное, чем всё, что делалось до этого.

Таким образом, в науке о данных проблема заключается в том, что вы считаете, что всё сводится к наличию рамок, в которых умные инженеры внедряют решение. На самом деле же процесс представляет собой непрерывное обсуждение, в ходе которого бизнес приобретает понимание новых технических возможностей, а затем проецирует себя в то, каким должен стать его будущий бизнес. Затем формулируются требования к тому, чего не хватает с технологической стороны для реализации этого, и обычно оказывается, что большая часть инноваций рождается именно из этих требований. Как только у вас появляется ясное представление о том, что нужно, решение не так уж сложно найти, если знать, какой вопрос задать.

Kieran Chandler: И почему вы считаете, что большинство отделов по науке о данных всё ещё застряли в академическом подходе? Разве их не должно быть больше, как у Amazon по всему миру?

Joannes Vermorel: Прежде всего, потому что если вы — компания определённого размера и слышите эти модные слова, самый простой выход — добавить строку в бюджет, где вы потратите несколько миллионов в год на актуальный модный подход. Если это команда по науке о данных — да, давайте так сделаем. Если блокчейн в моде — да, создадим и команду по блокчейну. Они постоянно внедряют то, что является модным словом дня, и выводят из употребления то, что утратило свою актуальность. Это просто обычный бизнес.

Моё послание таково: если вы хотите сделать что-то действительно существенное, вам нужно задать себе вопрос, какой глубокий сдвиг в вашей компании принесут эти модные числовые методы? Если единственное изменение носит косметический характер, например, автоматический расчёт ABC classes более эффективным способом, это ничего не изменит для вашей компании. Но, безусловно, изменение всей бизнес-модели компании для адаптации к новой технологии — совсем другая история.

Kieran Chandler: Разве это не сопряжено с высокими рисками? Не считаете ли вы, что именно поэтому так много сопротивления подобным переменам? Разве дело не в том, что если люди не понимают эту технологию, с ней связано множество рисков, и поэтому гораздо безопаснее оставить всё как есть и, возможно, вложить немного средств в исследования и разработки?

Joannes Vermorel: Проблема в том, что существует общий риск разорения просто потому, что вы устарели. Для большинства компаний этот риск вполне реален. Я обсуждал это с множеством ритейлеров на протяжении более десяти лет, и буквально десять лет назад у меня были почти сюрреалистичные беседы, когда я предупреждал их, что компания Amazon наступает, и они заберут ваш рынок. Вам нужно что-то делать. И люди отвечали: “О, но посмотрите, она такая маленькая. Да, растёт, но её доля рынка даже не достигает одного процента. Нам всё равно.” Сегодня же, если вы посмотрите на Amazon и Alibaba, они абсолютно гигантские и продолжают расти, что просто безумие. Учитывая масштабы эффекта от роста, когда вы превосходите определённый размер, эффекта экономии от масштаба уже не наблюдается, а возникает эффект дисэкономии от масштаба. Amazon давно перешёл стадию дисэкономии от масштаба, поэтому у них огромные препятствия во всём, что они делают. Если они хотят хотя бы сохранить один процент роста, им приходится преодолевать абсолютно огромные дисэкономии от масштаба. Это означает, что они не делают что-то лишь немного лучше большинства компаний; они просто находятся на несколько световых лет вперёд. Так что, действительно, для руководителя ничегонеделание или постоянное следование статус-кво — самая безопасная стратегия, в этом нет сомнений. Проблема в том, что если вы будете играть эту карту непрерывно несколько десятилетий, компания просто останется позади. Мой совет для генерального директора: способны ли вы терпеть такое мышление в вашей компании? Разве вы не видите приближающихся проблем? Если нет, то, думаю, никто не поплачется из-за того, что вы стали похожи на додо.

Kieran Chandler: Таким образом, эти продвинутые статистические методы сейчас как никогда актуальны, и постоянно звучат такие модные слова, как ИИ и глубокое обучение. Но насколько можно быть уверенным, что через десять лет это всё ещё будет важной темой для этих компаний?

Joannes Vermorel: Это хороший вопрос. Во-первых, достижения таких компаний, как Google, Amazon или Microsoft с этими технологиями, просто поражают. Например, мы перешли от программ, которым было очень трудно превзойти гроссмейстера в шахматах, к чему-то, что сейчас побеждает чемпиона. Если вы взглянете на последние разработки Google, можно за четыре часа создать программу, которая начинает с нуля и становится невероятно, сверхчеловечески хорошей в шахматах. Они могут настроить программу, которая обучается игре в шахматы, и за четыре часа достичь такого уровня, что она буквально сверхчеловеческая и побеждает каждого человека. Способ, которым компьютер играет, просто непостижим, ведь это даже отдалённо не имеет смысла. Так что, безусловно, впечатляющие достижения для очень узких, чётко определённых задач. Но если говорить об автономных транспортных средствах, то и тут результаты поразительны; система действительно работает.

Kieran Chandler: Вопрос в том, можно ли индустриализировать это? У нас всё ещё есть некоторые сомнения, но масштаб достигнутого прогресса просто поражает.

Joannes Vermorel: Тот факт, что вы можете сделать этот скачок веры и сказать, что существуют технологии, доказавшие свою эффективность в длинной серии случаев, — это вполне разумное убеждение, что вероятность того, что эти технологии полностью переработают цепочки поставок, довольно высока. Кстати, в случае с цепочками поставок это даже не будет чем-то принципиально новым, потому что если взглянуть на Lokad, мы отстаиваем видение количественной цепочки поставок. Но если посмотреть на то, что происходит в банках и финансах сегодня, всё сводится к количественной торговле. У них работают кванты, и это не будущее — это уже здесь, существует уже два десятилетия и больше. Так что сейчас идея в том, что этот подход приходит с запозданием в два-три десятилетия в цепочки поставок, но в финансах он уже внедрён десятилетиями.

Kieran Chandler: Если кто-то смотрит это и задаётся вопросом, что нужно сделать, чтобы привить такую культуру в своих командах по науке о данных, какие шаги следует предпринять? Как подталкивать команды к большему риску, быть более революционными и противостоять лёгким вариантам статус-кво?

Joannes Vermorel: Думаю, можно использовать простой тест: если бы компанию за одну ночь уволили всех специалистов по данным, оказалась бы она в критическом положении? Обанкротилась бы она в течение года? Если ответ отрицательный, то, вероятно, эти люди не играют существенной роли, и всё, что вы с ними делаете, не имеет значения. Вы можете сказать: “О, но это так рискованно, так безжалостно.” Но опять же, вспомните ситуацию с Amazon в начале 90-х с веб-технологиями. Люди говорили бы: “О, но у нас такая зависимость от этих веб-инженеров. Это безумие — зависеть от технологии, которая выглядит отвратительно. У вас модем, который работает супер медленно, соединение устанавливается за три минуты. Это куча дерьма на куче дерьма. А затем ещё и изображения с таким низким разрешением. Сначала вы ждёте минуту, чтобы увидеть изображение вашего товара, а потом оно получается ужасным. Этот бумажный каталог куда лучше. Доступ к продуктам в реальном времени, изображения высокого разрешения. Этот веб — просто куча чепухи. Почему мы должны рисковать, имея жесткую зависимость от этих веб-разработчиков по всей компании?” Ответ таков: потому что если вы этого не сделаете, через десять, двадцать лет вас уже не будет.

Очевидно, я говорю с оглядкой на прошлое. Сейчас всё гораздо яснее. Трудно передать это словами, но суть в том, что многие компании это осознали, и именно поэтому наняли специалистов по данным. Но они не понимают, что вопрос в том, есть ли у них стратегия, при которой ключевые руководители действительно максимально применяют эти технические возможности. А это требует стратегического мышления.

Kieran Chandler: Итак, есть ли у вас “механическая симпатия”, которая позволила бы вести интеллектуальный, образованный диалог с инженерами, создающими “двигатель” вашей компании? Не считаете ли вы, что одним из настоящих барьеров в науке о данных является то, что руководители, вероятно, пока не обладают тем уровнем “механической симпатии”, который им необходим?

Joannes Vermorel: Честно говоря, если бы можно было переосмыслить компании, нанимая 24-летних и позволяя им творить чудеса, это было бы фантастически. Но если посмотреть на историю компаний, случаев, когда один блестящий инженер кардинально реформировал 50-летнюю компанию изнутри, крайне мало. Доминирующая схема — либо очень молодые люди, либо те, кому за 45, ведь у них обычно есть капитал, опыт и, возможно, хотя бы капля мудрости. Для этого нужна новая компания.

Мой совет таков: если вы думаете, что найм выпускников колледжа способен революционизировать вашу компанию, вы всего лишь мечтаете. Это не серьёзно и, я бы сказал, в лучшем случае — интеллектуально лениво.

Kieran Chandler: Ладно, нам придётся на этом остановиться, но спасибо за ваше время. Это всё на эту неделю. Большое спасибо за внимание, и увидимся в следующем эпизоде. Спасибо за просмотр.