00:00:09 Вступление и биография Николаса Вандепута.
00:01:21 Книга Николаса: Data Science for Supply Chain Forecast.
00:03:29 Прогресс в открытых статистических инструментах.
00:05:36 Легкость экспериментирования с современными инструментами прогнозирования.
00:06:17 Широкое влияние программного обеспечения с открытым исходным кодом на отрасль.
00:08:03 Использование Python и R для науки о данных.
00:10:35 Влияние инструментов с открытым исходным кодом на поставщиков.
00:13:22 Роль поставщиков в решениях прогнозирования.
00:14:26 Применение теории в производственных средах.
00:15:38 Переход к производству: проблемы с данными.
00:16:29 Решение проблем с данными в цепи поставок.
00:18:05 Консолидация данных для принятия лучших решений.
00:19:56 Необходимость культуры данных в цепи поставок.
00:22:14 Образование для лучшего управления цепями поставок.
00:24:01 Правило оптимизации и важность измерения.
00:24:15 Недостатки открытого исходного кода в цепи поставок.
00:25:37 Будущая роль Lokad и ценность специалистов.
00:28:34 Проблемы развития Python и открытого исходного кода.
00:31:37 Поощрение простых начинаний в науке о данных.

Резюме

Николас Вандепут и Жоанн Верморель обсуждают трансформационную роль науки о данных в прогнозировании цепей поставок. Верморель подчеркивает, что фокус Lokad на предоставлении аналитического слоя для принятия решений в цепи поставок, учитывая вызовы быстро развивающихся инструментов с открытым исходным кодом. Вандепут заверяет, что его книга упрощает сложности науки о данных и машинного обучения для прогнозирования цепей поставок, побуждая читателей начать с базовых моделей и постепенно добавлять сложность. Оба соглашаются о важности непрерывного обучения и адаптации в этой быстро меняющейся области. Вандепут надеется, что его книга даст читателям уверенность в применении науки о данных в их операциях цепей поставок, возвещая новую эру количественного, основанного на данных принятия решений.

Расширенное резюме

В интервью ведущий Киран Чандлер представляет Николаса Вандепута, специалиста по цепям поставок с большим интересом к образованию, и Жоанна Вермореля, основателя Lokad. Обсуждение в основном крутится вокруг недавно выпущенной книги Вандепута “Data Science for Supply Chain Forecast”.

Вандепут начинает с подчеркивания своей страсти к обучению и преподаванию, что привело его к написанию книги. Он выражает свое восхищение развивающейся областью науки о данных и ее потенциальными применениями в управлении цепями поставок, которую он определяет как уникальную и сложную сферу бизнеса, которая может значительно выиграть от современных методов, основанных на данных. Он говорит, что его книга воплощает эти идеи, фокусируясь на том, как можно использовать науку о данных для улучшения прогнозирования в секторе цепей поставок.

Вандепут объясняет, что традиционно прогнозирование в цепях поставок в основном основывалось на том, что он называет “старой школой” статистических методов. Однако с появлением и развитием науки о данных появились новые способы обработки и интерпретации данных. Его книга стремится подготовить специалистов к этой новой эпохе, давая им возможность использовать науку о данных для улучшения прогнозирования в цепях поставок.

Верморель добавляет свою точку зрения, подчеркивая, что он нашел книгу Вандепута очень ценной, особенно для менеджеров цепей поставок, которые еще не используют науку о данных. Он предлагает менеджерам ознакомиться с книгой и побудить свои команды сделать то же самое.

Верморель расширяет обсуждение, отмечая значительные достижения в открытых статистических инструментах за последнее десятилетие. Он вспоминает, что около десяти лет назад такие инструменты, хотя и были доступны, были в основном предназначены для исследователей и не были промышленного уровня из-за своей сложности и отсутствия дружественной пользователю документации.

Однако он отмечает, что с появлением науки о данных за последние пять-десять лет произошла трансформация. Многие профессора университетов начали обращать внимание на удобство использования этих статистических пакетов, чтобы они были доступны своим студентам. Это привело к улучшению качества документации, согласованности терминологии в разных пакетах и акценту на широко применимых техниках.

Верморель заключает свою мысль, признавая усилия сообщества открытого исходного кода с помощью академии в создании широкого спектра высококачественных, доступных и удобных в использовании статистических пакетов, которые теперь доступны профессионалам в различных отраслях, включая управление цепями поставок. Это подчеркивает растущую важность науки о данных в современных бизнес-практиках.

Как отметил Вандепут, благодаря книге любой человек с ноутбуком и бесплатным программным обеспечением может начать создавать сложные прогнозы. Широкий доступ к инструментам с открытым исходным кодом позволяет пользователям экспериментировать и настраивать свои модели прогнозирования под свои конкретные потребности, что раньше было гораздо сложнее.

Затем разговор перешел к более широкому влиянию программного обеспечения с открытым исходным кодом. Верморель подчеркивает, что почти все современное программное обеспечение оказывает влияние открытого программирования, а провайдеры облачных вычислений сильно полагаются на открытые платформы, такие как Linux. Сама Lokad, как он рассказал, использует 90% программного обеспечения с открытым исходным кодом в своей деятельности. Основным изменяющим игровым аспектом современного программного обеспечения с открытым исходным кодом является не только его доступность, но и качество его упаковки и документации.

Вандепут подчеркивает, что сейчас проще программировать на Python или R, чем в старых фреймворках, таких как VBA или макросы Excel. Этот легкий доступ и удобство использования, говорит он, являются центральными идеями его книги. На вопрос, вызывает ли этот переход к программному обеспечению с открытым исходным кодом беспокойство, Верморель отвечает, что хотя это представляет собой вызов для поставщиков, чтобы продемонстрировать свою ценность, это также действует как средство облегчения.

Верморель отмечает, что если единственная ценность поставщика заключается в реализации полусложной модели прогнозирования, ему будет трудно конкурировать с экосистемой открытого исходного кода. Реальная добавленная стоимость, предлагает он, заключается в предоставлении полноценных решений промышленного уровня для вызовов цепей поставок, которые включают не только точные прогнозы.

Кирен Чандлер, ведущий, затем задает вопрос Жоанну Верморелю о переходе к производственной основе и возможных проблемах, которые могут возникнуть. Верморель начинает с акцента на важности качественных данных, указывая, что без них любой процесс, основанный на данных, может привести к “мусору на выходе”. Эта проблема качества данных распространяется на области, часто игнорируемые в цепях поставок, такие как данные о акциях и дефиците товара. Он утверждает, что понимание моделей, использующих эти данные, может помочь профессионалам в области цепей поставок быть более внимательными к этим заброшенным областям.

Однако Верморель также признает, что основная цель цепи поставок - не собрать точную историческую базу данных; это второстепенная цель. Lokad помогает клиентам ускорить переход к качественной консолидации данных, потенциально на нескольких сайтах и системах. Важно понимать, как эти данные могут быть использованы. Кроме того, Lokad помогает превратить эти прогнозы в решения в области цепей поставок, расширяя полезность прогнозов до действий.

Затем разговор переходит к отсутствию культуры данных и понимания машинного обучения в секторе цепей поставок. Вандепут считает, что это значительное препятствие для многих компаний. Часто проекты в области цепей поставок задерживаются из-за недостаточных данных или непонимания того, что может достичь машинное обучение. Это приводит к обсуждению необходимости изменения этой культуры и увеличения важности правильных данных.

Верморель предлагает образование как путь вперед, указывая на свои и усилия Вандепута по пропаганде рынка через их соответствующие книги и другие публикации. Он надеется увидеть новую волну практиков в области цепей поставок, подходящих к этой области с количественным, инженерным мышлением.

Жоанн Верморель подчеркивает видение компании о предоставлении аналитического наложения на принятие решений в области цепей поставок, а не действовать как хранилище ERP или движение запасов. Он также обсуждает риски быстро развивающейся экосистемы Python, включая сложность поддержания современных инструментальных средств. Николя Вандепут, в свою очередь, заверяет, что наука о данных и машинное обучение в прогнозировании цепей поставок не являются чрезмерно сложными. Его книга стремится помочь читателям начать с простых моделей и постепенно добавлять сложность. Оба спикера подчеркивают необходимость непрерывного обучения и адаптации, с Вандепутом, выражающим надежду, что читатели получат уверенность в своей способности применять науку о данных в контексте цепей поставок.

Полный текст

Кирен Чандлер: Привет, на этой неделе на Lokad TV мы поговорим с Николя Вандепутом, ученым в области цепей поставок, специализирующимся на прогнозировании спроса. Помимо сильного технического фона в управлении международной цепью поставок, Николя также проявляет большой интерес к образованию. Он провел время преподавая в Университете Брюсселя и только что выпустил свою книгу под названием “Наука о данных для прогнозирования цепей поставок”. Итак, Николя, большое спасибо за то, что сегодня пришли. Как всегда, очень приятно познакомиться с нашими гостями. Возможно, вы могли бы начать с того, чтобы рассказать нам немного о себе и о том, как вы попали в мир цепей поставок.

Nicolas Vandeput: Да, как вы сказали, я очень интересуюсь образованием и обучением. Мне нравится проводить время, читая книги, статьи и проверяя блоги в Интернете. У меня была возможность многое узнать, и теперь я очень рад применять эти знания. В какой-то момент я почувствовал необходимость поделиться тем, что я узнал, поэтому я написал книгу, чтобы подвести итоги в этой новой области науки о данных. Я думаю, что это действительно новое и уникальное применение в сфере поставок, которая является специфической темой. Люди используют науку о данных для интернет-маркетинга, но поставки - это другая тема, поэтому я потратил время, чтобы объединить их.

Kieran Chandler: Хорошо, так как называется книга? “Наука о данных для прогнозирования поставок”? Это немного длинное название, но о чем она?

Nicolas Vandeput: Она точно такая, как говорит название: о поставках и о том, как применять науку о данных для получения прогнозов в сфере поставок. Раньше люди использовали то, что я называю “старой школой статистики”, что вызывало много разных вопросов. Теперь, когда мы перешли в новый мир науки о данных, некоторые вопросы остаются, но возникают и новые. Нам нужно найти новые способы работы с данными, и эта книга призвана подготовить людей к этой новой эпохе.

Kieran Chandler: Как всегда, с нами Джоаннес Верморель, основатель компании Lokad. Джоаннес, вы имели возможность заглянуть в книгу. Какова ваша точка зрения на это?

Joannes Vermorel: Да, я заглянул и имел возможность просмотреть рукопись. Очень хорошая книга. Я рекомендую менеджерам поставок, у которых нет специалиста по науке о данных в их команде, получить копию и прочитать хотя бы первые несколько глав. Затем пусть другие люди из вашей команды прочитают остальные главы и, возможно, действуют по ним. Очень интересным является фантастический прогресс открытых источников статистических инструментов. До 10 лет назад они в основном использовались исследователями для демонстрации вещей другим исследователям. Код был там, но он был беспорядочным, научного уровня, не предназначенным для производства, и документация зачастую отсутствовала.

То, что действительно изменилось за последние пять-десять лет, это то, что с появлением науки о данных многие профессора университетов стали обращать внимание на качество статистических пакетов. Они стремились сделать их доступными для своих студентов, обеспечивая безупречную документацию, согласованную терминологию между пакетами и сосредоточиваясь на основных методах, которые работают во множестве ситуаций. Открытое сообщество, с помощью ученых, создало ряд открытых пакетов, которые были разработаны с учетом потребностей пользователей.

Kieran Chandler: Джоаннес, можете рассказать нам больше о новой книге Николаса, “Наука о данных для прогнозирования поставок”?

Joannes Vermorel: В этой книге Николас берет лучшие части Python и наиболее актуальные пакеты, чтобы продемонстрировать, как можно достичь практически передовых прогнозов с минимальными усилиями, что очень впечатляет.

Kieran Chandler: Николас, что изменилось в сообществе открытого исходного кода, что улучшило качество существующих инструментов?

Nicolas Vandeput: Я думаю, это вопрос о том, насколько легко создать прогноз. Десять лет назад это был бы беспорядок, и эта книга не была бы возможна. Она была бы предназначена для чрезвычайно мотивированных профессионалов. Но сегодня любой профессионал с немного любопытства и страсти может сделать это. Это довольно просто; вам просто нужен собственный ноутбук с бесплатным программным обеспечением, и вы можете начать с очень простого языка. Несколько лет назад это было бы невозможно. Это было бы более сложно. Теперь у вас есть возможность легко протестировать что-то самостоятельно бесплатно, и оттуда у вас есть возможность экспериментировать. Поскольку экспериментировать легко, вы можете проводить больше экспериментов, а затем настраивать прогноз, код и науку о данных именно для вашего конкретного случая. Раньше это было бы невозможно.

Kieran Chandler: Джоаннес, не только мир прогнозирования получает пользу от программного обеспечения с открытым исходным кодом. У вас есть примеры других отраслей, которые действительно получили пользу от наличия доступных наборов инструментов с открытым исходным кодом?

Joannes Vermorel: Движение с открытым исходным кодом чрезвычайно обширно, поэтому практически весь мир программного обеспечения сегодня подвержен влиянию открытого исходного кода. Все основные провайдеры облачных вычислений работают на своих собственных облаках на основе Linux, и даже в Lokad 90% используемого нами программного обеспечения является открытым исходным кодом. Даже Microsoft, которым мы, кстати, пользуемся, активно использует Linux в Azure. Сама платформа .NET является открытым исходным кодом, и наш набор инструментов для глубокого обучения CNTK также является продуктом открытого исходного кода Microsoft. В Lokad мы также выпускаем несколько компонентов в открытом доступе. Это движение существует уже несколько десятилетий.

Интересно и актуально для прогнозирования и управления цепями поставок не только то, что программное обеспечение является открытым исходным кодом, но и то, что у вас есть хорошо упакованные и документированные компоненты с открытым исходным кодом. Это полностью меняет игру. Это означает разницу между началом работы с чем-то простым, например, линейной регрессией, в 20 простых строках кода, по сравнению с необходимостью 200 строк кода и месяца, чтобы собрать все ваши программные компоненты, чтобы даже что-то скомпилировать. Раньше у вас был несовместимый код, который вылетал при объединении, и вам требовался месяц, чтобы наладить работу с чужим опубликованным кодом. Теперь настройка всей вашей среды Python для науки о данных занимает всего несколько страниц в книге. Вам просто нужно установить Anaconda, и вы готовы.

Kieran Chandler: Джоаннес, расскажите нам о подсистеме Linux в Windows и о том, как это влияет на удобство доступа к этим инструментам?

Joannes Vermorel: Подсистема Linux в Windows позволяет этим инструментам работать практически на любой версии Linux, а также на системах Windows. В книге демонстрируется удобство доступа к этим инструментам, что существенно изменилось благодаря открытому исходному коду и пакетам производственного уровня.

Nicolas Vandeput: Я бы хотел добавить, что в книге я рассказываю о профессионалах, которые раньше полагались на VBA и макросы в Excel. Мне всегда казалось, что это сложно и полно ошибок. Когда вы предлагаете использовать Python или другой язык, люди часто думают, что это слишком сложно. Однако мое сообщение в книге заключается в том, что на самом деле намного проще использовать открытые фреймворки, такие как Python или R, чем VBA или макросы Excel.

Kieran Chandler: Джоаннес, с такими простыми в использовании инструментами прогнозирования с открытым исходным кодом, вы, как поставщик корпоративного программного обеспечения, как Lokad, не беспокоитесь?

Joannes Vermorel: Как поставщик корпоративного программного обеспечения, это является частью экосистемы и также является возможностью. Мы также используем эти инструменты с открытым исходным кодом, поэтому нам не нужно перестраивать все с нуля. Проблема заключается в том, чтобы найти нашу добавленную стоимость. Если ваша добавленная стоимость заключается только в реализации полусложных моделей прогнозирования, то у вас нет реальной добавленной стоимости по сравнению с экосистемой. В книге подчеркивается, что продавцы, предлагающие набор инструментов с несколькими моделями прогнозирования, не предоставляют много ценности по сравнению с популярными библиотеками Python. Однако здесь все еще есть потенциал в предоставлении решений производственного уровня и решении задач цепей поставок в масштабе, и именно этим Lokad стремится заниматься.

Nicolas Vandeput: Я согласен с Джоаннесом. Многие профессионалы и студенты в мире цепей поставок до сих пор считают машинное обучение модным словом или чем-то непродолжительным. На самом деле оно здесь, чтобы остаться. Если вы прочитаете мою книгу и уделите время, чтобы изучить это, вы увидите, насколько полезным и доступным оно может быть для оптимизации цепей поставок.

Kieran Chandler: Так что, читая книгу, вы гораздо лучше подготовлены к получению решения, подобного Lokad, которое может пойти еще дальше. Как вы сказали, это может сделать всю работу от начала до конца. Конечно, для запуска прогноза в суперагентной среде вам также понадобится полный процесс обзора с людьми и так далее. Так что, ввод чисел в прогноз - это всего лишь один шаг во всем процессе. Можете ли вы рассказать о том, как идеи, изложенные в книге, могут быть реализованы?

Nicolas Vandeput: Цель книги - обсудить именно этот конкретный шаг. Это не значит, что после прочтения книги вы должны делать все самостоятельно. Вы также можете обратиться к другим поставщикам, таким как Lokad, чтобы понять: “Я прочитал это в книге, как это работает у вас? Как мы можем это реализовать? У меня есть такая идея, сработает ли она? Можем ли мы ее протестировать?” Тогда вы начинаете понимать, что именно делают поставщики программного обеспечения, такие как Lokad.

Kieran Chandler: Многие из этих идей были разработаны с теоретической точки зрения. Могут ли они быть применены в производственном смысле?

Nicolas Vandeput: Да, конечно. Эти новые прогнозы существуют уже давно. Я имею в виду, теория нейронных сетей была впервые представлена в 60-х годах, и первый метод в книге также появился в 60-х годах. Мы начали использовать их только сегодня в среде прогнозирования, потому что стало проще их запускать. Может быть, десять лет назад это было не так, и сейчас люди более осведомлены об этом. Конечно, вы можете использовать это. Что действительно интересно в науке о данных, и это одна из главных целей книги, - это то, что это действительно наука. Вы можете проверить это, провести эксперименты и снова и снова проверять его с использованием данных. Вот почему это называется наукой о данных. Вы можете доказать себе: “Работает ли это? Да или нет?” Возможно, это не сработает, но тогда вы можете подумать: “Я собираюсь разработать новый эксперимент, учесть новые вещи или удалить то, что мне не нужно, чтобы увидеть, будет ли это работать лучше”. Так что это действительно наука, где вы можете доказать, что ваш прогноз будет лучше, и использовать его только после этого.

Kieran Chandler: Так что это может быть использовано как еще одно доказательство концепции, прежде чем вы обратитесь к таким людям, как Lokad, и скажете: “Джоаннес, когда мы говорим о переходе к производственной основе и использовании его ежедневно, с какими проблемами могут столкнуться люди? И в чем именно Lokad может помочь в рамках всего процесса?”

Joannes Vermorel: Во-первых, вам нужны хорошие данные. Если у вас нет качественных данных, вы получите мусор на выходе. Интересная вещь в этой книге заключается в том, что она дает специалистам по цепям поставок представление о том, что делают модели, какие вещи они могут использовать, и это поможет им лучше понять, почему им нужно начать обращать внимание на целый ряд серых зон в цепях поставок, таких как акции. Обычно данные о акциях - это полный беспорядок. То же самое с отсутствием товара на складе. Часто нет надлежащих исторических данных, отражающих все случаи отсутствия товара на складе, поэтому вы не знаете, были ли нулевые продажи из-за отсутствия спроса или из-за отсутствия товара.

Таким образом, более хорошее знакомство с моделью, которая может использовать данные, может сделать вас более подверженными тому, чтобы увидеть, является ли ваша существующая процедура адекватной. Основная цель цепи поставок - поддерживать движение товаров.

Kieran Chandler: Так что основная цель цепи поставок - составить точную историческую базу данных. Это первая цель. Вторая цель - обслуживать всех, поддерживать производство и обеспечивать удовлетворение клиентов. Однако выполнение второй цели часто не такое качественное, как выполнение первой цели. Чтобы ускорить этот переход и достичь консолидации данных в масштабе с несколькими объектами, нам нужно расширить свои горизонты. Джоаннес, можете ли вы разъяснить это?

Joannes Vermorel: Когда мы начинаем работать с клиентами, мы часто сталкиваемся с проблемой консолидации и выполнения данных. Многие клиенты не знают, что к прогнозам можно применять передовые численные методы для принятия более точных решений. Чтение книги по науке о данных может расширить ваш кругозор и дать представление о том, как эффективнее выполнять цепь поставок. Она помогает вам увидеть большую картину до и после прогноза, от производства до использования прогнозов для принятия более умных решений.

Nicolas Vandeput: Лидеры цепи поставок лишены двух важных элементов для извлечения действенных идей из науки о данных и машинного обучения. Первый - это культура данных, которая отсутствует в около 99% компаний по всему миру. Многие компании до сих пор борются с беспорядочными электронными таблицами и не осознают важность правильных данных. Эта книга стремится показать, что с правильными данными можно достичь настоящей науки, точных прогнозов и эффективных экспериментов. Без данных многие проекты задерживаются, и об этом могут подтвердить журналисты. Второй элемент - это отсутствие таланта и понимания машинного обучения и науки о данных в управлении цепью поставок. Нам нужно изменить эту культуру и повысить осведомленность о ценности данных.

Kieran Chandler: Абсолютно верно, правильные данные имеют решающее значение. Это должно быть как заповедь: “Очистите свои данные”. Но как нам добиться такой культурной изменения? Как мы можем проповедовать на рынке и подчеркнуть важность наличия правильных данных?

Joannes Vermorel: Что ж, шутя, мы могли бы создать культ, где лучшие данные являются обязательными, как священная заповедь. Но серьезно говоря, я считаю, что нам нужно способствовать пониманию и осведомленности. Мы можем образовывать рынок и уделять больше внимания ценности чистых и точных данных. Таким образом, мы можем изменить культуру и обеспечить, чтобы наличие правильных данных стало приоритетом для управления цепью поставок.

Kieran Chandler: Когда у вас нет представления о том, что можно сделать с глубоким обучением и нет опыта работы с ним, очень трудно увидеть смысл, не так ли?

Joannes Vermorel: Действительно, это вызывает трудности. Я думаю, что хорошей отправной точкой является погружение в работу с данными и не полное погружение в чистую техничность задачи. Для настройки среды не требуется целая команда ИТ. Очень важно понимать, что делает эти методы работающими. Это не магия.

Важно развенчивать это. В Lokad мы пытались проповедовать на рынке. Образование - это путь вперед. Николяс публикует книгу, что замечательно. Мы также опубликовали книгу и много других материалов, включая обширную базу знаний на сайте Lokad. Но да, главное - это образование.

Я вижу новую волну практиков цепи поставок, которые приходят в эту область с более инженерным мышлением, которое более количественное. Вы хотите иметь цифры и вещи, которые можно повторить. Лидерство является важным элементом в цепи поставок, так как в ней участвуют множество людей, стран и объектов. Но если у вас есть лидерство без какого-либо инженерного или количественного мышления, трудно оптимизировать что-либо. Как только вы начинаете использовать слово “оптимизация”, кардинальным правилом оптимизации является то, что вы не можете оптимизировать то, что вы не измеряете. Это приводит к вопросу: как измерить? И тогда вам понадобятся данные.

Kieran Chandler: Николяс, мы много говорили о преимуществах использования этих инструментов с открытым исходным кодом. Как насчет некоторых недостатков? Где вы видите негативные моменты при использовании этих инструментов?

Nicolas Vandeput: Как мы обсуждали, и я считаю, что это действительно важно, мир цепи поставок - это множество взаимодействий между продуктами, людьми, различными командами и так далее. Процесс прогнозирования - это очень долгий процесс, в котором участвуют множество заинтересованных сторон. Моя книга говорит о том, что за последние десятилетия мы использовали те же техники. Если посмотреть на 80-е и 90-е годы, вы найдете тот же прогностический двигатель, что и сегодня. Так что ничего не изменилось.

Я предлагаю, что мы можем изменить эту очень конкретную часть, но, конечно же, этого недостаточно. Весь процесс должен жить и развиваться. Просто использование Python не решит проблему, которая не работает. Он просто улучшит числа прогноза, но вам все равно нужно смотреть на весь процесс.

Kieran Chandler: Йоаннес, вы кажетесь очень уверенным, что у Локад всегда будет свое место на рынке. Как вы видите это место на самом деле?

Joannes Vermorel: Во-первых, я считаю, что даже говоря о чистых прогнозах, у нас всё еще есть козыри, чтобы получить лучшие прогнозы. Но “лучше” стало сложнее, чем когда-либо. Одно дело сказать, что у вас есть лучший прогноз с точки зрения средней абсолютной ошибки, но как только вы входите в вероятностный мир, это уже другая игра.

Если вы начинаете говорить: “Я хочу прогнозировать спрос, но не завтра, а на вероятностном горизонте, когда прибудет мой контейнер”, тогда это становится спросом, который начинается в неопределенный момент времени в будущем и заканчивается в другой неопределенный момент. Вещи могут стать очень сложными с учетом большего количества измерений. Затем, если вы начинаете включать факторы, такие как вероятность того, что мой конкурент снизит цены, что будет иметь очень конкретное влияние на форму спроса, вы видите, что точность прогноза не является одномерной вещью. У нее есть вся эта сложность, которую нужно решить.

Kieran Chandler: Внезапно ваши модели становятся сложными, даже если у вас есть очень хорошие наборы инструментов с открытым исходным кодом. Соединение всех этих вещей таким образом, чтобы это было безошибочно, готово к производству и масштабируемо, требует еще много других вещей.

Joannes Vermorel: Да, если мы рассмотрим только угол чистого прогнозирования, я считаю, что это один подход. Но в Локаде наша цель - иметь более глубокий, полноценный аналитический оверлей, чтобы принимать умные решения для определенной цепи поставок. Мы не управляем системами цепи поставок, мы не являемся ERP. Мы имеем копию этих данных, но мы являемся умным аналитическим оверлеем.

Вот такая у нас видится наша цель. И снова, даже если Локад полностью построен на инструментах с открытым исходным кодом, все равно есть ценность в том, чтобы объединить все это вместе. Например, платформы облачных вычислений, которые сейчас доступны, являются гигантским мешанием открытых исходных кодов, но люди предпочитают обратиться к Amazon, потому что вы могли бы сделать это самостоятельно. У вас могла бы быть собственная частная облачная платформа, но это такое огромное количество усилий, чтобы объединить все эти вещи, что в какой-то момент есть ценность в том, чтобы специалисты сделали это за вас.

Одним из недостатков этой экосистемы Python и открытого исходного кода является то, что она развивается так быстро. Если вы делаете это самостоятельно, есть одна опасность: вы выбираете версию Python и набор инструментов, а затем через два года появляется что-то кардинально улучшенное. Внезапно вы были передовыми, а теперь вы уже нет, просто потому что мир продолжал двигаться, и лаборатория только что создала новый инструментарий.

Например, Scikit лидировал во всем практически до нескольких лет назад, но теперь PyTorch полностью меняет всю картину, внося глубокое обучение и дифференцируемое программирование в игру. Так возникает вопрос: кто несет ответственность за пересмотр того, что вы реализовали два года назад и обновление его в соответствии с современными тенденциями? Хороший поставщик будет следить за тем, чтобы ваше решение в области науки о данных регулярно пересматривалось и, вероятно, регулярно переписывалось, чтобы оставаться передовым.

Я не знаю, как долго продлится это золотое время прогресса в области науки о данных, но я не удивлюсь, если в течение следующего десятилетия каждые два года мы увидим фантастический прогресс, когда новая версия будет намного лучше предыдущей. Могут быть категории проблем, которые кажутся очень сложными для решения, но становятся доступными.

Nicolas Vandeput: Если мне позволят добавить что-то, я думаю, что очень интересно то, о чем упомянул Йоаннес, - это сложность, с которой Локад способен справиться. Я лично работал с командой Локад, поэтому знаю, на что они способны. Одно из сообщений моей книги, и это для меня очень важно, - говорить людям, что они могут сделать это.

Некоторые люди могут услышать то, что говорит Йоаннес, и подумать: “Вау, наука о данных и машинное обучение кажутся очень сложными, может, это не для меня”. Я действительно хочу успокоить людей, сказав: “Нет, это не так сложно. Вы можете начать с простой модели”. И, на самом деле, как показывает книга, вы можете довольно легко начать с очень простой модели, которая на самом деле является очень мощной. Затем, оттуда, вы можете добавить слои, возможно, немного настроить систему, данные, возможно, внести еще одну модель и так далее.

Таким образом, вы действительно можете начать с чего-то простого, что уже будет работать очень хорошо, и оттуда перейти к более сложным вопросам. Это действительно то сообщение, которое я хочу передать в книге: вы можете начать с простого и затем продвигаться дальше.

Kieran Chandler: Можете ли вы помочь нам понять, как определить, работает ли модель? Можем ли мы ее протестировать? Можем ли мы воспроизвести ее? Эти принципы, кажется, применимы для простых моделей, но как только вы понимаете их для базовой модели, можете ли вы также понять их для гораздо более сложных моделей?

Nicolas Vandeput: Абсолютно, я настоятельно рекомендую людям начать с простого. Как только вы освоите основы, вы сможете перейти к чему-то гораздо более сложному.

Kieran Chandler: Это приводит меня к моему последнему вопросу. Какие у вас надежды на читателей вашей книги и на использование открытых инструментальных средств в будущем?

Nicolas Vandeput: Моя визия и, конечно же, моя надежда заключается в том, чтобы люди прочитали эту книгу и обрели уверенность в своих способностях. В конце книги я хочу, чтобы они могли сказать себе: “Да, я действительно могу это сделать. Это не кажется таким сложным”. Может быть, две недели назад они не умели программировать, но к концу я хочу, чтобы это выглядело очень просто для них. Я хочу, чтобы эти люди начали экспериментировать самостоятельно, чтобы они действительно жили наукой о данных и пробовали новые модели. Я надеюсь, что они станут новыми лидерами в управлении цепями поставок. Это также одно из сообщений Локад. Мы уже находимся в количественном мире цепей поставок, где вы можете экспериментировать и внедрять решения, которые работают последовательно. Для этого вам нужна наука о данных. Так что я действительно надеюсь, что книга даст людям силы сделать это самостоятельно.

Kieran Chandler: Нам придется закончить, но спасибо вам за ваше время, Николас.

Nicolas Vandeput: Спасибо.

Kieran Chandler: Книга “Наука о данных для прогнозирования цепей поставок” уже вышла. Обязательно загляните на Amazon. Здесь, на Lokad TV, мы скоро вернемся с новой серией. Но пока, спасибо за просмотр.

Joannes Vermorel: Спасибо.