00:00:08 Жесткая правда о том, что проекты по науке о данных не оказывают влияния на повседневные операции бизнеса.
00:00:55 Общее понимание науки о данных в большинстве компаний как преувеличенного статистического моделирования.
00:02:17 Разница между классическим статистическим моделированием и тем, что делают компании, такие как Google, Microsoft и Amazon.
00:03:51 История электромагнетизма и сравнение с наукой о данных.
00:07:04 Проблема подхода Kaggle в науке о данных.
00:08:01 Обсуждение того, как работает технологическая инновация в реальном мире.
00:09:01 Пример того, как Amazon революционизировал электронную коммерцию.
00:10:01 Объяснение того, что большинство отделов науки о данных застряли в академических методах.
00:12:34 Объяснение того, что самый большой риск для компаний - устареть.
00:14:06 Обсуждение будущей важности искусственного интеллекта и глубокого обучения в компаниях.
00:16:01 Прогресс автономных транспортных средств поразителен, но вопрос в том, можно ли его индустриализировать.
00:16:17 Обсуждение применения технологий в цепях поставок и финансах.
00:17:37 Испытание на прочность, чтобы определить, насколько значима команда науки о данных для выживания компании.
00:20:07 Важность того, чтобы руководители имели “механическую симпатию”, чтобы эффективно использовать науку о данных в своей компании.
00:22:34 Идея найма молодых людей, только что закончивших колледж, для революционизации компании - это мечтательное мышление и интеллектуальная лень.

Резюме

В интервью с Кираном Чандлером Джоаннес Верморель обсуждает то, что большинство компаний не используют полный потенциал науки о данных, сосредотачиваясь на существующих статистических моделях, а не на разработке новых. Он считает, что компании должны переосмыслить свои процессы и принять инновационные статистические методы. Верморель подчеркивает важность освоения технических возможностей и их внедрения на исполнительном уровне через “механическую симпатию”. Он утверждает, что найм молодых инженеров недостаточен для трансформации компании и что руководители должны обладать механической симпатией, чтобы действительно использовать новые технологии. Успешные предприниматели либо очень молоды, либо имеют богатый опыт, часто полученный через создание новых компаний. Полагаться на выпускников для трансформации компании - это мечтательное мышление и интеллектуальная лень.

Расширенное резюме

В этом интервью Киран Чандлер беседует с Джоаннесом Верморелем, основателем Lokad, о недостатках классического статистического моделирования в науке о данных и о том, как компании должны пересмотреть свой подход, чтобы достичь успеха в этой области.

Верморель объясняет, что большинство компаний рассматривают науку о данных как преувеличенное статистическое моделирование, применяя существующие статистические модели к данным. Однако компании, которые действительно серьезно относятся к науке о данных, такие как Google, Microsoft и Amazon, пересматривают характер статистических методов и изобретают новые, а не просто применяют существующие модели.

Он утверждает, что способ, которым наука о данных в настоящее время представлена в большинстве компаний, слишком упрощенный, и сравнивает его с введением электромагнетизма в 19 веке. В то время люди видели его только как полезный инструмент для конкретных задач, например, контроля качества. Однако, как только электричество было освоено, оно преобразило целые отрасли. Точно так же Верморель считает, что наука о данных имеет потенциал для революции в бизнесе, но только если компании подходят к ней по-другому.

Он критикует общий подход к науке о данных, который включает сбор и очистку данных, применение статистических моделей и предоставление результатов. Он утверждает, что этот метод, часто представленный сообществом Kaggle, слишком упрощенный и слишком сосредоточен на поиске лучшей модели для заданного набора данных и проблемы, а не на истинном понимании базовых данных и их потенциальных применений.

Вместо этого Верморель предлагает компаниям рассматривать науку о данных как способ переосмысления своих процессов, подобно тому, как электричество революционизировало промышленность. Это требует изменения мышления от простого применения существующих моделей к данным к разработке новых статистических методов и подходов, которые могут раскрыть полный потенциал науки о данных.

Джоаннес Верморель утверждает, что большинство компаний не используют полный потенциал науки о данных, так как они сосредоточены на применении существующих статистических моделей, а не на разработке новых. Чтобы действительно получить выгоду от науки о данных, компании должны пересмотреть свой подход и сосредоточиться на переосмыслении своих процессов и разработке инновационных статистических методов.

Верморель утверждает, что принятие новых технологий не является линейным процессом, в котором компании просто учатся у университетов и внедряют инновации. Вместо этого бизнесы должны вступить в постоянный диалог с новыми технологиями, получая понимание и прогнозируя свои будущие потребности на основе возможностей, которые эти технологии предлагают.

Верморель использует пример развития электронной коммерции Amazon, подчеркивая, как компания должна была переосмыслить будущее коммерции, установить требования и найти инновационные решения. Он подчеркивает, что ключевым моментом успешной инновации является ясное понимание проблемы и правильное постановление вопросов.

На вопрос о том, почему многие отделы науки о данных все еще следуют академическим подходам, Верморель называет лень основным фактором. Компании часто выбирают “модный” подход, инвестируя в последние тенденции, не задумываясь о том, как эти технологии могут фундаментально изменить их бизнес-модели. Верморель предлагает бизнесам сосредоточиться на понимании глубоких изменений, которые новые технологии могут принести в их организации, а не стремиться к косметическим улучшениям.

Чандлер задает вопрос, может ли риск принятия новых технологий и изменения бизнес-моделей быть причиной сопротивления переменам. Верморель признает наличие внутреннего риска, но также указывает на риск устаревания для компаний, которые не инновируют. Он делится своими опытоми десятилетней давности, предупреждая розничных торговцев о потенциале разрушения со стороны Amazon. Несмотря на то, что изначально они не придавали значения Amazon, многие из этих розничных торговцев теперь оказались в затруднительном положении в борьбе с гигантом электронной коммерции.

По мнению Вермореля, продолжающийся рост Amazon и Alibaba, несмотря на дезэкономию масштаба, с которой они сталкиваются, указывает на то, что они опережают своих конкурентов на световые годы. В то время как руководители могут быть искушены сохранить статус-кво, чтобы минимизировать риск, Верморель предостерегает, что постоянное сохранение статус-кво может привести к гибели компании. Вместо этого бизнесы должны активно взаимодействовать с новыми технологиями и адаптировать свои модели, чтобы оставаться конкурентоспособными в условиях разрушения.

Они обсуждают роль передовых статистических методов, будущее управления цепями поставок и то, как компании могут внедрить культуру, основанную на данных, в свои команды.

Верморель в первую очередь обращается к менталитету компаний, которые не придают значения передовым статистическим методам. Он утверждает, что компании не должны пренебрегать рисками, связанными с невложением средств в новые технологии, используя пример бизнесов, которые не адаптировались к интернету в начале 90-х годов. Он подчеркивает, что компании должны рисковать, принимая новые технологии, или рискуют стать неактуальными.

Когда ему задали вопрос о будущей актуальности искусственного интеллекта и глубокого обучения, Верморель указывает на потрясающие достижения компаний, таких как Google, Amazon и Microsoft, в областях, таких как шахматы и автономные транспортные средства. Он считает, что эти технологии будут продолжать развиваться и играть важную роль в управлении цепями поставок. Он проводит параллель между оптимизацией цепей поставок и количественной торговлей в финансовой сфере, где последняя уже существует десятилетиями.

Чтобы внедрить культуру инноваций и риска в команды по науке о данных, Верморель предлагает литмусовый тест: если бы компания уволила всех своих ученых по данным за одну ночь, она оказалась бы в смертельной опасности или столкнулась бы с банкротством в течение года? Если ответ отрицательный, то, вероятно, компания недостаточно рискует со своей командой по науке о данных. Он сравнивает это с ранними днями интернета, когда компании рисковали с веб-разработчиками, несмотря на то, что технология казалась менее превосходной по сравнению с традиционными методами в то время. Это рискованное поведение позволило этим компаниям адаптироваться и процветать в цифровую эпоху.

Они обсудили важность того, чтобы компании принимали технические возможности и имели стратегию, которая включает эти аспекты на исполнительном уровне. Он подчеркивает концепцию “технического сочувствия”, когда руководители имеют глубокое понимание технических элементов, что позволяет им принимать обоснованные решения в сотрудничестве с инженерами.

Верморель утверждает, что найм молодых, талантливых инженеров недостаточно для революции в компании. Вместо этого важно, чтобы руководители имели техническое сочувствие, чтобы по-настоящему использовать потенциал новых технологий. Он подчеркивает тот факт, что общий шаблон для успешных предпринимателей - это либо быть очень молодым, либо иметь значительный опыт и мудрость, часто приобретенные через создание новых компаний. Верморель приходит к выводу, что полагаться на свежих выпускников колледжей для трансформации компании - это мечтательное мышление и интеллектуальная лень.

Полный транскрипт

Кирен Чандлер: Сегодня на LokadTV мы собираемся отойти от классического статистического моделирования и обсудить, почему отделы науки о данных должны делать больше, чем просто собирать данные, обрабатывать их и предоставлять результаты. Итак, Джоаннес, большинство из нас все еще только начинают осваивать классическое статистическое моделирование. Какая сегодня ключевая идея?

Джоаннес Верморель: Есть несколько идей. Во-первых, я использую термин “статистическое моделирование”, как я предложил для этой серии, потому что, когда вы смотрите на практики науки о данных, как они представлены в большинстве компаний, это просто превознесенное статистическое моделирование. Для широкой аудитории, если вы задаетесь вопросом, когда речь идет о выявлении закономерностей или воспроизведении некоторых аспектов человеческого интеллекта, все, что у нас есть сейчас, это статистика. Эти статистические методы могут иметь фантастические названия, такие как глубокое обучение, и некоторые люди называют их искусственным интеллектом, но буквально у нас есть только статистические модели.

В прошлом несколько десятилетий назад были попытки создать искусственный интеллект с помощью нестатистических подходов, таких как символический подход, который привел к практически нулевым результатам. Эта область умерла, оставив статистический подход единственным, который до сих пор существует в значительной степени. Так что все, что у нас есть для работы с данными, это статистические методы.

Интересно, что делают эти команды в большинстве компаний, которые на самом деле занимаются наукой о данных? Что они делают? Они играют с статистическими моделями. Я противопоставляю это тому, что, скажем, делают люди, которые действительно серьезно относятся к этому, такие как Google, Microsoft и Amazon. Они не просто занимаются статистическим моделированием; они переосмысливают основную природу следующего статистического метода, такого как изобретение глубокого обучения по сравнению с игрой с глубоким обучением. Речь идет о создании следующего этапа градиентного бустинга деревьев по сравнению с применением градиентного бустинга деревьев, одной статистической модели, к другому набору данных.

Кирен Чандлер: Так что общее понимание заключается в том, что эти команды собирают данные, очищают их, применяют свои статистические модели и предоставляют результаты. Что делают Google и Amazon, что делают они гораздо лучше?

Джоаннес Верморель: Чтобы ответить на этот вопрос, нам нужно вернуться немного назад во времени и пересмотреть, скажем, 19-й век, когда электромагнетизм был совершенно новым явлением.

Кирен Чандлер: Если вы почитаете немного истории, то узнаете, как люди подходили к этому. Вы бы сказали: “О, это электромагнетизм. Это так невероятно интересно.” Представьте себе, что вы являетесь промышленной компанией того времени, прединдустриальной компанией. У вас есть производитель, который работает полуручным способом, и есть эта штука с электромагнетизмом, которая становится интересной. И вы говорите: “О, я думаю, что стоит создать небольшую команду, занимающуюся этими интересными вещами.” И, возможно, для контроля качества, у нас будет несколько вещей, где мы можем проверить проводимость, и это очень многообещающе. И мы будем делать несколько вещей, которые интересны, потому что, да, проверка проводимости - отличный способ контроля качества нескольких вещей, которые мы производим.

Джоаннес Верморель: Если вы переосмыслите это через столетие, вы подумаете, что это бессмыслица. Я имею в виду, с помощью электричества можно создавать двигатели, электрическое освещение, отопление, охлаждение и даже плавить металл. Оно заменит все необходимость в открытом пламени в вашем производстве. Так что, когда у вас есть электричество в масштабе, вы буквально можете переосмыслить практически все то, что вы делаете. Проблема заключается в том, что представление о науке о данных - это нечто фантастическое, и люди придерживаются рамок, в которых представляется проблема.

Кирен Чандлер: Таким образом, в академической среде проблема представляется так: у вас есть четко определенный набор данных, ряд моделей и метрики точности какого-то вида, потому что вы хотите сделать прогноз какого-то вида. И мы будем исследовать различные модели и искать модель, которая показывает лучшие результаты. И это буквально воплощается в соревнованиях Kaggle, о которых мы ранее говорили.

Джоаннес Верморель: Люди говорят: “Ну, все уже определено; есть заданный набор данных, проблема с заданной метрикой, и затем есть бесконечная коллекция моделей.” Большинство из них даже могут быть составлены разными способами, и вы можете потенциально перестраивать признаки, чтобы сделать набор данных более удобным для модели, которую у вас есть. Это и есть наука о данных.

Кирен Чандлер: Что так неправильно в таком подходе, как в Kaggle? Это просто слишком упрощенно, и он говорит вам, что у вас будет только один точный результат, или почему это так неправильно?

Джоаннес Верморель: Если вы посмотрите на историю, и снова, это то, что вы видите только в прошлом, становится очевидным. Но в настоящее время, когда вы находитесь на грани, это трудно увидеть. Когда это становится нормой, это настолько очевидно. Так что сейчас, когда я возвращаюсь к науке о данных, я вижу, что компании неизменно берут пет-проекты, пет-приложения, своего рода фантастический числовой гаджет, в который вставлен немного искусственного интеллекта. Вероятно, самая абсурдно бесполезная вещь - это чат-боты. Но я знаю, что есть много людей, которые собрали много денег, чтобы развить отличные компании, которые могут динамически учиться общаться в Twitter и становиться нацистами за 48 часов, просто потому что люди подали правильные входные данные. И это просто бессмыслица.

Кирен Чандлер: Вернемся к этому, я имею в виду, проблема заключается в том, что когда вы хотите представить себе, что представляет собой новая технология, это не односторонний процесс. Люди думают, что университеты открывают что-то новое, они обучают студентов, а студенты, которые теперь являются выпускниками с инженерными степенями, степенями в области компьютерных наук и т. д., идут в компании и внедряют инновации. Но это совершенно не так работает в реальном мире.

Жоанн Верморель: Реальный мир, например, Amazon практически изобрел то, что впоследствии стало электронной коммерцией, вместе с несколькими другими, такими как eBay и другими пионерами. Они определили это через свои инновации. Джефф Безос не говорил в начале 90-х годов: “Я просто найму веб-мастеров и создам сайт”. Они действительно должны были задуматься о том, что будет будущее коммерции на расстоянии, и это было нечто глубоко отличающееся от того, что было сделано до этого.

Итак, data science, вы видите, проблема в том, что вы думаете, что это связано с наличием фреймворка, в котором у вас есть умные инженеры, которые внедряют решение. На самом деле, процесс является более продолжительным обсуждением, в ходе которого бизнес получает понимание новых технических возможностей и проецирует их на свое будущее дело. Затем они определяют требования к отсутствующей технологии для реализации этого, и обычно вы понимаете, что большая часть инноваций исходит от требований. Как только у вас есть четкое представление о том, что вам нужно, решение не так сложно придумать, когда вы знаете, какой вопрос задать.

Кирен Чандлер: И почему бы вы не сказали, что большинство отделов data science все еще застряли в академических методах? Я имею в виду, почему больше не таких, как Amazon?

Жоанн Верморель: Во-первых, потому что если вы являетесь компанией определенного размера и видите эти модные слова, легкий способ справиться с этим - это добавить строку в свой бюджет, где они потратят несколько миллионов в год на модный подход дня. Если это команда data science, да, давайте сделаем это. Если блокчейн - это что-то, да, давайте также создадим команду по блокчейну. Они регулярно внедряют что-то, что является модным словом дня, и устраняют то, что вышло из моды. Это просто дело обычное.

Мое сообщение заключается в том, что если вы хотите сделать что-то значимое, вам действительно нужно задать себе вопрос, какие глубокие изменения произойдут в вашей компании из-за этих модных численных методов? Если единственное изменение - это косметическая вещь, например, автоматическое вычисление классов ABC лучшим образом, это ничего не изменит для вашей компании. Но, конечно, изменение всей бизнес-модели компании для адаптации к какой-то новой технологии - это уже другая история.

Кирен Чандлер: Это по своей сути рискованно, и не могли бы вы сказать, что именно поэтому существует такое сопротивление такого рода изменениям? Это потому, что, фундаментально, если люди не понимают этого, с этим связано много рисков, потому что это новая технология? Так что намного безопаснее просто оставить все как есть и, возможно, инвестировать в небольшое исследование и разработку?

Жоанн Верморель: Проблема заключается в окружающем риске выхода из бизнеса только потому, что вы устарели. Для большинства компаний этот риск довольно реален. Я общался с многими розничными компаниями более десяти лет назад, и буквально десять лет назад я вел нереальные дискуссии, где говорил им, что эта компания, Amazon, приходит и съест ваш обед. Вам нужно что-то делать. И люди говорили мне: “О, но посмотрите, она такая маленькая. Да, она растет, но у нее даже нет одного процента рыночной доли. Нам все равно.” В настоящее время, если вы посмотрите на Amazon и Alibaba, они абсолютно гигантские и по-прежнему растут, что безумно. Учитывая количество экономии масштаба, которую они испытывают, вы знаете, когда вы достигаете определенного размера, вы больше не получаете экономию масштаба, вы получаете дезэкономию масштаба. Amazon давно преодолела стадию дезэкономии масштаба, поэтому у них огромные препятствия для всего, что они делают, потому что у них такие дезэкономии масштаба. Если они хотят сохранить хотя бы один процент роста, им придется преодолеть абсолютно огромные дезэкономии масштаба. Это означает, что они не делают что-то, что немного лучше, чем большинство других компаний; они просто опережают их на световые годы. Так что, действительно, для руководителя не делать ничего или никогда не вызывать статус-кво - это самая безопасная карта, которую вы можете сыграть, без сомнения. Проблема в том, что если вы играете этой картой постоянно в течение нескольких десятилетий, компания просто отстает. Мое сообщение для генерального директора: вы можете терпеть то, что такое мышление преобладает в вашей компании? Разве вы не видите никаких проблем, надвигающихся вперед? Если нет, то, я бы сказал, никто не прольет слезы о том, что вы пошли по пути додо.

Кирен Чандлер: Такие передовые статистические методы сейчас очень популярны, и люди всегда говорят о таких модных словах, как искусственный интеллект и глубокое обучение. Но насколько можно быть уверенным, что через десять лет это все еще будет актуальной темой для этих компаний?

Жоанн Верморель: Это хороший вопрос. Во-первых, достижения компаний, таких как Google, Amazon или Microsoft, с использованием этих технологий просто поразительны. Например, мы перешли от программ, которые с трудом превосходили шахматного гроссмейстера, к чему-то, что теперь побеждает чемпиона по шахматам. Если вы посмотрите на последние работы Google, вы можете стать невероятно хорошим в шахматах за четыре часа. Они могут создать программу, которая научится играть в шахматы и за четыре часа достигнет точки, которая буквально непостижима для человека, где она победит каждого живого человека. Способ, которым компьютер играет в игру, просто непостижим, потому что он даже отдаленно не имеет смысла. Таким образом, у вас есть поразительные достижения, конечно, для очень узких, четко определенных проблем. Но если вы посмотрите на автономные транспортные средства, это также поразительно; это работает.

Кирен Чандлер: Вопрос в том, можно ли это индустриализировать? У нас все еще есть некоторые сомнения, но прогресс впечатляет.

Жоанн Верморель: То, что вы можете сделать этот скачок веры и сказать, что есть эти технологии, которые доказали свою эффективность на долгом ряде случаев. Это очень разумное убеждение, что шансы на то, что эти вещи полностью переизобретут способ организации поставок. Кстати, в случае цепочки поставок это даже не будет очень новым, потому что если вы посмотрите на Lokad, мы отстаиваем эту концепцию количественной цепочки поставок. Но если вы посмотрите на то, что делается в банках, в финансах сегодня, это все о количественной торговле. У них есть кванты, и это даже не будущее, это уже есть, это было уже два десятилетия или даже больше. Так что теперь идея заключается в том, что этот подход приходит в цепочку поставок с опозданием в два или три десятилетия, но он уже давно применяется в финансах.

Кирен Чандлер: Если кто-то смотрит это и задается вопросом, что им нужно сделать, чтобы внедрить такую культуру в своих командах по науке о данных, какие шаги они должны предпринять? Как они должны побудить свои команды рисковать больше и быть немного более новаторскими и двигаться против простых вариантов статус-кво?

Жоанн Верморель: Я думаю, у вас может быть простой тест на прочность: если бы компания уволила всех научных сотрудников за одну ночь, оказалась бы компания в отчаянном положении? Обанкротилась бы компания за год? И если ответ “нет”, то, вероятно, эти люди несущественны, и то, что вы делаете с этими людьми, не имеет значения. Вы можете сказать: “О, но это такой риск, это такое жестокое решение”. Но снова переосмыслите ситуацию с Amazon в начале 90-х годов с веб-технологией. Люди говорили: “О, но у нас такая зависимость от этих веб-разработчиков. Безумно зависеть от этой технологии, которая выглядит ужасно. У вас есть этот модем, который очень медленно устанавливает соединение, это просто груда дерьма на груде дерьма. И затем у вас есть изображения с таким плохим разрешением. Я имею в виду, сначала вы ждете одну минуту, чтобы получить изображение вашего продукта, а затем оно выглядит ужасно. Этот бумажный каталог намного лучше. Мгновенный доступ ко всем продуктам, изображения с высоким разрешением. Эта веб-технология - это просто груда нелепости. Почему бы нам не рисковать и не зависеть от этих веб-разработчиков на всю компанию?” Ну, ответ заключается в том, что если вы этого не сделаете, то через десять лет, через двадцать лет вас уже не будет существовать.

Очевидно, я играю с помощью здравого смысла. Сейчас все гораздо очевиднее. Мне трудно передать это, но дело в том, что я думаю, что многие компании осознали это, и вот почему они наняли этих научных сотрудников. Но они не понимают, что вопрос в том, есть ли у вас стратегия, в которой основные руководители действительно используют эти технические возможности наилучшим образом? И это требует стратегического мышления.

Кирен Чандлер: Итак, у вас есть механическое сочувствие, которое позволит вам вести разумные, образованные дискуссии с инженерами, которые создают двигатель для вашей компании? Можно ли сказать, что это один из основных препятствий, когда дело доходит до науки о данных в компаниях, тот факт, что руководители, вероятно, в настоящее время не обладают таким уровнем механического сочувствия, который им нужен?

Жоанн Верморель: Честно говоря, если бы вы могли переосмыслить компании, нанимая 24-летних и позволяя им делать волшебство, это было бы фантастически. Но если вы посмотрите на историю компаний, то количество случаев, когда все происходило таким образом - найм одного гениального инженера, который случайно полностью революционизировал 50-летнюю компанию изнутри, - очень редко. Доминирующим шаблоном являются либо очень молодые люди, либо те, кому за 45, так как у них обычно есть некоторый капитал, опыт и, возможно, некоторая мудрость. Для этого требуется новая компания.

Мой совет будет таким: если вы думаете, что найм людей, только что окончивших колледж, изменит вашу компанию, вы заблуждаетесь. Это несерьезно и, я бы сказал, интеллектуально лениво, в лучшем случае.

Кирен Чандлер: Хорошо, нам придется закончить здесь, но спасибо за ваше время. Вот и все на этой неделе. Большое спасибо за просмотр, и увидимся в следующем эпизоде. Спасибо за просмотр.