00:00:09 Введение и предыстория Nicolas Vandeput.
00:01:21 Книга Nicolas: Data Science for Supply Chain Forecast.
00:03:29 Прогресс в развитии открытых статистических инструментов.
00:05:36 Легкость экспериментов с современными инструментами прогнозирования.
00:06:17 Широкое влияние программного обеспечения с открытым исходным кодом на отрасль.
00:08:03 Использование Python и R в науке о данных.
00:10:35 Влияние инструментов с открытым исходным кодом на поставщиков.
00:13:22 Роль поставщиков в решениях по прогнозированию.
00:14:26 Применение теории в производственных средах.
00:15:38 Переход к производству: проблемы с данными.
00:16:29 Решение проблем данных в цепях поставок.
00:18:05 Консолидация данных для принятия лучших решений.
00:19:56 Необходимость формирования культуры данных в цепях поставок.
00:22:14 Обучение для более эффективного управления цепями поставок.
00:24:01 Оптимизационное правило и важность измерения.
00:24:15 Недостатки открытого ПО в цепях поставок.
00:25:37 Будущая роль Lokad и ценность специалистов.
00:28:34 Проблемы эволюции Python и открытого ПО.
00:31:37 Поощрение простых начинаний в науке о данных.
Резюме
Nicolas Vandeput и Joannes Vermorel обсуждают преобразующую роль науки о данных в прогнозировании цепей поставок. Vermorel подчеркивает, что Lokad сосредоточен на предоставлении аналитического подхода к принятию решений в цепях поставок, одновременно решая проблемы стремительного развития открытых инструментов. Vandeput уверяет, что его книга упрощает сложности науки о данных и машинного обучения для прогнозирования цепей поставок, побуждая читателей начинать с базовых моделей и постепенно усложнять их. Оба соглашаются с важностью непрерывного обучения и адаптации в этой стремительно развивающейся области. Vandeput надеется, что его книга даст читателям уверенность в применении науки о данных в их операциях с цепями поставок, открывая новую эру количественного, основанного на данных принятия решений.
Расширенное резюме
В интервью ведущий Kieran Chandler представляет Nicolas Vandeput, специалиста по цепям поставок, увлеченного образованием, и Joannes Vermorel, основателя Lokad. Обсуждение в основном сосредоточено на недавно выпущенной книге Vandeput “Data Science for Supply Chain Forecast”.
Vandeput начинает с того, что подчеркивает свою страсть к обучению и преподаванию, что побудило его написать книгу. Он выражает восхищение быстро развивающейся областью науки о данных и ее потенциальными приложениями в управлении цепями поставок, которую он считает уникальной и сложной сферой бизнеса, способной получить значительную выгоду от современных методов, основанных на данных. Он отмечает, что его книга охватывает эти идеи, сосредоточиваясь на том, как с помощью науки о данных можно улучшить прогнозирование в секторе цепей поставок.
Vandeput объясняет, что традиционно прогнозирование в цепях поставок основывалось на так называемых “старомодных” статистических методах. Однако с появлением и развитием науки о данных появились новые способы обработки и интерпретации данных. Его книга призвана подготовить специалистов к этой новой эре, позволяя им использовать науку о данных для улучшения прогнозов цепей поставок.
Vermorel добавляет свою точку зрения, подчеркивая, что книга Vandeput оказалась очень ценной, особенно для менеджеров по цепям поставок, которые еще не освоили науку о данных. Он рекомендует менеджерам ознакомиться с книгой и побудить свои команды сделать то же самое.
Vermorel продолжает обсуждение, отмечая значительные достижения в области открытых статистических инструментов за последнее десятилетие. Он вспоминает, что около десяти лет назад такие инструменты, хотя и были доступны, в основном предназначались для исследователей и не были пригодны для промышленного производства из-за их сложности и отсутствия удобной документации.
Однако он отмечает, что за последние пять-десять лет, с ростом науки о данных, произошла трансформация. Многие университетские преподаватели стали уделять внимание удобству использования этих статистических пакетов, делая их доступными для студентов. Это привело к улучшению качества документации, последовательности терминологии в разных пакетах и сосредоточению на основных, широко применимых методах.
Vermorel завершает свою мысль, признавая заслуги сообщества с открытым исходным кодом, при поддержке академических кругов, в создании ряда высококачественных, доступных и удобных статистических пакетов, которые теперь доступны профессионалам в различных отраслях, включая управление цепями поставок. Это подчеркивает растущую значимость науки о данных в современных бизнес-практиках.
Как отметил Vandeput, книга позволяет каждому, у кого есть ноутбук и бесплатное программное обеспечение, начать создавать продвинутые прогнозы. Легкая доступность инструментов с открытым исходным кодом позволяет пользователям экспериментировать и настраивать модели прогнозирования в соответствии с их конкретными потребностями, что раньше было намного сложнее.
Далее разговор перешел к более широкому влиянию программного обеспечения с открытым исходным кодом. Vermorel отметил, что почти все современные программы основаны на открытом программировании, а поставщики облачных услуг значительно полагаются на открытые платформы, такие как Linux. Сам Lokad, по его словам, использует 90% ПО с открытым исходным кодом в своей работе. Главным фактором, меняющим правила игры в современном открытом ПО, является не только его доступность, но и качество упаковки и документации.
Vandeput подчеркнул, что теперь программировать на Python или R проще, чем в старых фреймворках, таких как VBA или макросы Excel. Эта простота доступа и удобство использования, по его словам, являются ключевыми посланиями его книги. Когда его спросили, вызывает ли этот переход к программам с открытым исходным кодом у него беспокойство, Vermorel ответил, что, хотя это создает вызов для поставщиков в демонстрации их ценности, это также является фактором, способствующим развитию.
Vermorel отметил, что если единственная ценность поставщика заключается в реализации полусложной модели прогнозирования, им будет трудно конкурировать с экосистемой открытого кода. Реальная добавленная ценность, по его мнению, состоит в предоставлении полноценных, готовых к производству решений для задач цепей поставок, которые включают не только точные прогнозы.
Ведущий Kieran Chandler затем задает вопрос Joannes Vermorel о переходе к производственной эксплуатации и возникающих при этом проблемах. Vermorel начинает с акцента на важности качественных данных, отмечая, что без них любой процесс, основанный на данных, может приводить к принципу «мусор на входе, мусор на выходе». Эта проблема качества данных распространяется на области, которые часто упускаются из виду в цепях поставок, такие как данные о акциях и дефиците товара. Он утверждает, что понимание моделей, использующих эти данные, может помочь специалистам по цепям поставок обратить больше внимания на эти упускаемые аспекты.
Однако Vermorel также признает, что основная цель цепей поставок — не составление точной исторической базы данных; это второстепенная задача. Lokad помогает клиентам ускорить переход к качественной консолидации данных, возможно, на нескольких площадках и системах. Понимание того, как можно использовать эти данные, имеет большое значение. Более того, Lokad помогает преобразовывать эти прогнозы в решения для цепей поставок, превращая их в действия.
Далее разговор переходит к отсутствию культуры данных и понимания машинного обучения в секторе цепей поставок. Vandeput считает, что это значительное препятствие для многих компаний. Часто проекты в цепях поставок задерживаются из-за недостаточности данных или непонимания того, чего может достичь машинное обучение. Это приводит к обсуждению необходимости изменения этой культуры и повышения значимости точных данных.
Vermorel считает, что образование является путем к решению проблемы, ссылаясь на свои усилия и усилия Vandeput по популяризации этой темы через их книги и другие публикации. Он надеется увидеть новую волну специалистов по цепям поставок, подходящих к этой области с количественным, инженерным складом ума.
Joannes Vermorel подчеркивает видение компании по предоставлению аналитического слоя для принятия решений в цепях поставок, а не действию в качестве репозитория ERP или управления запасами. Он также обсуждает риски стремительно развивающейся экосистемы Python, включая проблему поддержки современных инструментов. Nicolas Vandeput, в свою очередь, уверяет, что наука о данных и машинное обучение в прогнозировании цепей поставок не являются чрезмерно сложными. Его книга призвана направить читателей на путь начала с простых моделей и постепенного усложнения. Оба выступающих подчеркивают необходимость постоянного обучения и адаптации, при этом Vandeput выражает надежду, что читатели обретут уверенность в своей способности применять науку о данных в контексте цепей поставок.
Полная стенограмма
Kieran Chandler: Привет, на этой неделе на Lokad TV к нам присоединяется Nicolas Vandeput, специалист по цепям поставок, специализирующийся на прогнозировании спроса. Помимо сильного технического опыта в управлении многонациональными цепями поставок, Nicolas также глубоко интересуется образованием. Он преподавал в Университете Брюсселя и недавно выпустил свою книгу под названием “Data Science for Supply Chain Forecasts”. Итак, Nicolas, большое спасибо за то, что пришли сегодня. Как всегда, очень приятно узнавать наших гостей получше. Возможно, вы могли бы начать с того, чтобы рассказать немного о себе и о том, как вы оказались в мире цепей поставок.
Nicolas Vandeput: Да, как вы сказали, я очень интересуюсь образованием и обучением. Мне нравится проводить время, читая книги, статьи и просматривая блоги в интернете. У меня была возможность многое узнать, и теперь я чрезвычайно рад, что могу применять эти знания. В какой-то момент я почувствовал необходимость поделиться тем, что узнал, поэтому я написал книгу, чтобы обобщить эту новую область науки о данных. Я думаю, что это действительно что-то новое, и уникально применять это в цепях поставок, которая является специфической темой. Люди используют науку о данных для онлайн-маркетинга, но цепи поставок – это совсем другая тема, поэтому я решил объединить их.
Kieran Chandler: Хорошо, книга называется “Data Science for Supply Chain Forecasts”. Это немного громоздкое название, но о чем она?
Nicolas Vandeput: Как следует из названия, книга о цепях поставок и о том, как применять науку о данных для получения прогнозов в цепях поставок. Ранее люди использовали то, что я называю “старой школой статистики”, которое порождало множество вопросов. Теперь, когда мы перешли в новую эру науки о данных, одни вопросы остаются, а новые возникают. Нам нужно находить новые способы работы с данными, и эта книга посвящена подготовке людей к этой новой эпохе.
Kieran Chandler: Как обычно, к нам присоединяется Joannes Vermorel, основатель Lokad. Joannes, вы успели взглянуть на книгу. Каково ваше мнение о ней?
Joannes Vermorel: Да, я успел взглянуть и ознакомиться с рукописью. Она очень хороша. Я рекомендую менеджерам по цепям поставок, у которых в команде нет специалиста по науке о данных, приобрести копию и прочитать хотя бы первые несколько глав. Затем пусть другие сотрудники вашей команды прочитают оставшиеся главы и, возможно, применят полученные знания. Что очень интересно, так это фантастический прогресс open source статистических инструментов. Еще 10 лет назад они в основном использовались исследователями для демонстрации своим коллегам. Код был, но он был небрежным, исследовательским, а не промышленного уровня, и документация часто отсутствовала.
Что действительно изменилось за последние пять-десять лет, так это то, что с появлением науки о данных многие университетские преподаватели стали уделять внимание качеству статистических пакетов. Они стремились сделать их доступными для своих студентов, обеспечивая безупречную документацию, единообразие терминологии в различных пакетах и сосредоточенность на основных методах, работающих в широком спектре ситуаций. Сообщество с открытым исходным кодом при поддержке ученых создало серию пакетов, ориентированных на потребности пользователей.
Kieran Chandler: Joannes, можете рассказать нам подробнее о новой книге Nicolas “Data Science for Supply Chain Forecast”?
Joannes Vermorel: В этой книге Nicolas использует лучшие возможности Python и самые актуальные пакеты, чтобы показать, как можно достичь практически передовых прогнозов с минимальными усилиями, что весьма впечатляет.
Kieran Chandler: Nicolas, что изменилось в сообществе с открытым исходным кодом, что улучшило качество существующих решений?
Nicolas Vandeput: Думаю, все сводится к тому, насколько просто создать прогноз. Десять лет назад все было бы в беспорядке, и эта книга не была бы возможна. Она была бы рассчитана на исключительно мотивированных профессионалов. Но сегодня любой специалист с небольшой долей любознательности и страсти может это сделать. Это довольно просто: вам просто нужен собственный ноутбук с бесплатным ПО, и вы можете начать с действительно простого языка. Несколько лет назад этого было бы невозможно. Всё было бы гораздо сложнее. Сейчас же у вас есть возможность легко опробовать что-либо самостоятельно бесплатно, и затем проводить эксперименты. Поскольку эксперименты выполняются легко, можно провести больше экспериментов и затем уточнить прогноз, код и методы науки о данных, адаптировав их под вашу конкретную задачу. Раньше этого добиться было бы невозможно.
Kieran Chandler: Joannes, выгоду от open-source ПО получают не только специалисты по прогнозированию. Можешь привести примеры других отраслей, которые действительно выиграли благодаря доступности open-source инструментов?
Joannes Vermorel: Движение open-source невероятно обширно, поэтому практически весь мир программного обеспечения сегодня затронут открытым исходным кодом. Все крупные провайдеры облачных вычислений используют свои собственные облака на базе Linux, и даже в Lokad 90% используемого нами ПО — это open-source. Даже Microsoft, которую мы используем, активно применяет Linux в Azure. Сам .NET Framework является open-source, а инструмент глубокого обучения, который мы используем, CNTK, также является продуктом Microsoft с открытым исходным кодом. В Lokad мы также выпускаем немало компонентов как open-source. Это движение существует уже несколько десятков лет.
Что интересно и актуально для прогнозирования и цепочек поставок, так это не просто факт, что программное обеспечение является open-source, а наличие хорошо упакованных и документированных open-source компонентов. Это кардинально меняет правила игры. Разница заключается в том, что можно начать с чего-то простого, например, линейной регрессии в 20 простых строках кода, вместо необходимости писать 200 строк кода и тратить месяц на сборку всех частей ПО лишь для того, чтобы что-то скомпилировалось. Раньше код был несовместимым и приводил к сбоям при объединении, и требовался месяц настройки, чтобы заставить работающее решение, разработанное кем-то другим, функционировать. Сейчас настройка всей среды Python для data science занимает всего пару страниц в книге. Вы просто устанавливаете Anaconda — и всё готово.
Kieran Chandler: Joannes, можешь рассказать нам о подсистеме Linux в Windows и о том, как это влияет на легкость доступа к этим инструментам?
Joannes Vermorel: Подсистема Linux в Windows позволяет этим инструментам работать практически на любом дистрибутиве Linux и даже в системах Windows. Книга демонстрирует, насколько упростился доступ к этим инструментам благодаря open-source и пакетам промышленного уровня.
Nicolas Vandeput: Хотел бы добавить, что в книге я рассказываю о профессионалах, которые раньше полагались на VBA и макросы в Excel. Мне всегда казалось, что это сложно и подвержено ошибкам. Когда предлагаешь использовать Python или другой язык, люди часто считают, что это слишком сложно. Однако моя идея в книге заключается в том, что на самом деле использовать такие open framework, как Python или R, значительно проще, чем VBA или макросы Excel.
Kieran Chandler: Joannes, учитывая все эти удобные инструменты open-source для прогнозирования, не вызывает ли это у тебя беспокойства как у поставщика корпоративного ПО, такого как Lokad?
Joannes Vermorel: Будучи поставщиком корпоративного программного обеспечения, мы являемся частью экосистемы и в то же время её активатором. Мы тоже используем эти open-source инструменты, поэтому нам не приходится всё заново создавать. Задача — найти нашу добавленную ценность. Если ваша added value заключается лишь в реализации полусложных моделей прогнозирования, то вы не предлагаете ничего действительно ценного по сравнению с экосистемой. Книга показывает, что поставщики, продающие набор инструментов с несколькими моделями прогнозирования, не обеспечивают значительной ценности по сравнению с популярными библиотеками Python. Однако всё ещё есть потенциал в предоставлении решений промышленного уровня и решении масштабных задач цепочек поставок, на чем и делает акцент Lokad.
Nicolas Vandeput: Я согласен с Joannes. Многие профессионалы и студенты в сфере цепочек поставок до сих пор считают машинное обучение модным словом или чем-то временным. На самом деле, оно здесь надолго. Если вы прочитаете мою книгу и уделите время изучению этой темы, вы увидите, насколько оно полезно и доступно для оптимизации цепочек поставок.
Kieran Chandler: Таким образом, прочитав книгу, вы будете гораздо лучше подготовлены для получения решения вроде Lokad, которое может сделать следующий шаг. Как ты сказал, оно может обеспечить работу решения от начала до конца. Конечно, чтобы запустить прогноз в среде супер-агента, требуется также полный процесс проверки с участием людей и так далее. Заполнение цифр в прогнозе — лишь один этап всего процесса. Можешь рассказать, как идеи, изложенные в книге, могут быть реализованы?
Nicolas Vandeput: Цель книги — обсудить именно этот конкретный этап. То, что вы прочитали книгу, не означает, что вам нужно реализовывать всё самостоятельно. Вы можете обратиться к другим поставщикам, таким как Lokad, чтобы понять: «Я прочитал это в книге, как это работает у вас? Как мы можем это внедрить? У меня есть идея — сработает ли она? Можем ли мы её протестировать?» Тогда вы начинаете понимать, чем на самом деле занимаются такие поставщики программного обеспечения, как Lokad.
Kieran Chandler: Многие из этих идей были разработаны с теоретической точки зрения. Можно ли их применить в производственной среде?
Nicolas Vandeput: Да, безусловно. Эти новые методы прогнозирования существуют уже давно. Например, теория нейронных сетей была впервые представлена в 60‑х годах, и первый метод, описанный в книге, тоже относится к 60‑м. Мы начинаем использовать их в прогнозировании только сегодня, потому что выполнение стало проще. Возможно, десять лет назад это было затруднительно, но сейчас люди стали об этом больше знать. Безусловно, их можно применять. Что действительно интересно в data science — и это одна из главных идей книги — так это то, что это на самом деле наука. Вы можете тестировать, проводить эксперименты и постоянно проверять результаты с помощью данных. Вот почему это называется data science. Вы можете убедиться сами: «Работает ли это? Да или нет?» Возможно, не работает, но тогда вы можете подумать: «Я разработаю новый эксперимент, учту новые факторы или уберу ненужное, чтобы проверить, будет ли работать лучше». Таким образом, это действительно наука, где вы можете доказать, что ваш прогноз станет лучше, и только после этого начать его использовать.
Kieran Chandler: Таким образом, это может служить ещё одним доказательством концепции, прежде чем вы обратитесь к таким компаниям, как Lokad, и скажете: «Joannes, когда речь заходит о переходе к эксплуатационному использованию и ежедневной работе, с какими проблемами могут столкнуться люди? И чем конкретно может помочь Lokad в реализации всего процесса?»
Joannes Vermorel: Прежде всего, вам необходимы качественные данные. Если у вас нет действительно квалифицированных данных, то на входе получается «мусор», а на выходе — тоже мусор. Интересно то, что эта книга даёт специалистам по цепочкам поставок представление о том, как работают модели, какие возможности они предоставляют, и помогает лучше понять, почему уже сейчас необходимо обращать внимание на целый ряд «серых зон» в цепочках поставок, таких как акции и распродажи. Обычно данные о акциях представляют собой полный беспорядок. То же самое касается отсутствия товаров. Часто нет надлежащих исторических данных, которые отражали бы все случаи отсутствия товара, так что вы не знаете, были ли нулевые продажи из-за отсутствия спроса или из-за того, что товар отсутствовал на складе.
Таким образом, лучшее знакомство с моделями, способными эффективно использовать данные, помогает понять, адекватен ли ваш текущий процесс. Основная цель цепочки поставок — обеспечить непрерывное движение товаров.
Kieran Chandler: Итак, основная цель цепочки поставок — сформировать точную историческую базу данных. Это первая цель. Вторая цель — обслуживать всех, поддерживать производство и обеспечивать удовлетворённость клиентов. Однако выполнение второй цели часто оставляет желать лучшего по сравнению с первой. Чтобы ускорить этот переход и добиться консолидации данных в масштабах нескольких площадок, нам необходимо расширить наши горизонты. Joannes, можешь подробнее рассказать об этом?
Joannes Vermorel: Когда мы начинаем работать с клиентами, мы часто сталкиваемся с проблемой консолидации данных и реализации процессов. Многие клиенты не осознают, что для прогнозирования можно применять сложные числовые методы, позволяющие принимать лучшие решения. Чтение книги по data science может расширить горизонты и дать понимание того, как эффективнее реализовывать цепочку поставок. Это помогает увидеть общую картину до и после прогноза — от производства до использования прогнозов для принятия более разумных решений.
Nicolas Vandeput: Лидерам цепочек поставок не хватает двух ключевых элементов для извлечения практических выводов из data science и машинного обучения. Первый — это культура данных, которой не хватает примерно в 99% компаний по всему миру. Многие компании до сих пор борются с неструктурированными таблицами и не понимают важности качественных данных. Эта книга показывает, что при наличии правильных данных можно добиться настоящей науки, точных прогнозов и эффективных экспериментов. Без данных многие проекты затягиваются, и журналисты это подтверждают. Второй элемент — это нехватка талантов и понимания в области машинного обучения и data science в управлении цепочками поставок. Нам нужно изменить эту культуру и повысить осведомлённость о ценности данных.
Kieran Chandler: Абсолютно, наличие правильных данных крайне важно. Это должно стать своего рода заповедью: «Очистите ваши данные». Но как нам добиться такого сдвига в культуре? Как можно пропагандировать этот подход и подчеркнуть важность наличия правильных данных?
Joannes Vermorel: Ну, если шутить, можно создать культ, где качественные данные обязательны, как священная заповедь. Но если говорить серьёзно, я считаю, что нам нужно способствовать развитию понимания и осведомлённости. Мы можем обучать рынок и придавать больше значения ценности чистых и точных данных. Делая это, мы можем создать культурный сдвиг и обеспечить, чтобы наличие правильных данных стало главным приоритетом в управлении цепочками поставок.
Kieran Chandler: Когда люди не знают, что можно сделать с помощью глубокого обучения, и не имеют опыта работы с ним, очень трудно даже уловить суть, не так ли?
Joannes Vermorel: Действительно, это сложно. Я считаю, что хорошей отправной точкой является работа с данными собственными руками, а не полное погружение в технические детали выполнения задачи. Для настройки среды не требуется целая IT-команда. Очень важно понять, что заставляет эти методы работать, в чём их суть. Это не магия.
Раскрытие этой тайны очень важно. В Lokad мы пытались распространять эти идеи. Образование — это путь вперёд. Nicolas выпускает книгу, что отлично. Мы также опубликовали книгу и множество других материалов, включая обширную базу знаний на сайте Lokad. Но да, всё сводится к образованию.
Я наблюдаю новую волну специалистов по цепочкам поставок, которые приходят в эту сферу с инженерным, более количественным мышлением. Вы хотите видеть цифры и повторяемость процессов. Лидерство в цепочках поставок крайне важно, ведь оно включает множество людей, стран и площадок. Но если у вас есть лидерство без инженерного или количественного подхода, оптимизировать что-либо становится практически невозможно. Как только вы начинаете использовать слово «оптимизация», главное правило оптимизации заключается в том, что нельзя оптимизировать то, что не измеряется. Это приводит к вопросу: как же измерять? А для этого нужны данные.
Kieran Chandler: Nicolas, мы много говорили о преимуществах использования этих open-source инструментов. А что насчёт их недостатков? Где, по-твоему, проявляются негативные стороны их использования?
Nicolas Vandeput: Как мы уже обсуждали, и я думаю, это действительно важно, мир цепочек поставок связан с множеством взаимодействий между продуктами, людьми, различными командами и т.д. Процесс прогнозирования — это очень длительный процесс с участием множества заинтересованных сторон. Моя книга утверждает, что на протяжении последних десятилетий мы использовали одни и те же методы. Если заглянуть в 80‑е и 90‑е, вы обнаружите тот же прогнозирующий механизм, что и сегодня. То есть, ничего не изменилось.
Я предлагаю изменить именно этот конкретный элемент, но, конечно, этого недостаточно. Весь процесс должен функционировать и развиваться. Использование только Python не решит проблему неработающего процесса. Оно просто улучшит числовые показатели прогноза, но всё равно необходимо рассматривать весь процесс целиком.
Kieran Chandler: Joannes, ты кажешься очень уверенным, что для Lokad всегда найдется место. Как ты видишь это место на рынке в будущем?
Joannes Vermorel: Прежде всего, я считаю, что даже в чистом прогнозировании у нас ещё есть возможность улучшить прогнозы. Но понятие «лучше» становится всё сложнее. Одно дело — говорить, что ваш прогноз лучше с точки зрения средней абсолютной ошибки, но как только вы переходите в вероятностный мир, дело меняется.
Если вы начинаете говорить: «Я хочу прогнозировать спрос не на завтра, а на вероятностном горизонте, то есть, когда прибудет мой контейнер», то прогноз охватывает период, который начинается в неопределённый момент в будущем и заканчивается в другом неопределённом моменте. С ростом измерений всё может усложняться. А если добавить факторы, такие как вероятность снижения цены конкурентом, что окажет специфическое влияние на форму спроса, становится понятно, что точность прогноза — не одномерная характеристика. Ей приходится учитывать всю эту сложность.
Kieran Chandler: Внезапно ваши модели становятся сложными, даже если у вас есть удобные open-source инструменты. Соединить всё это таким образом, чтобы получилась безошибочная, промышленного уровня и масштабируемая система, — это всё ещё огромная задача.
Joannes Vermorel: Да, если рассматривать только аспект прогнозирования, я считаю, что это один из подходов. Но у Lokad наше видение заключается в создании более глубокого, комплексного аналитического слоя, который позволяет принимать разумные решения для конкретной цепочки поставок. Мы не управляем системами цепочек поставок, мы не ERP. Мы не стремимся быть хранилищем всех перемещений товаров. У нас есть копия этих данных, но мы обеспечиваем умный аналитический слой.
Вот это и есть наше видение. И, повторюсь, даже если бы Lokad был полностью построен на open-source инструментах, объединение всего этого вместе имеет свою ценность. Например, современные платформы облачных вычислений представляют собой огромную смесь open-source компонентов, но люди предпочитают Amazon, потому что вы могли бы сделать это самостоятельно. Вы могли бы иметь собственное частное облако, но объединение всех этих компонентов требует колоссальных усилий, поэтому в какой-то момент имеет смысл поручить это специалистам.
Один недостаток, который я наблюдаю в этой экосистеме Python и открытого ПО в частности, заключается в том, что она развивается так быстро. Если вы делаете всё самостоятельно, существует одна опасность: вы выбираете определённую версию Python и набор инструментов, а через два года появляется что-то кардинально улучшенное. Внезапно вы были на переднем крае, а теперь нет, просто потому что мир продолжает двигаться, и одна лаборатория только что представила новый набор инструментов.
Например, до нескольких лет назад Scikit лидировала практически во всём, но теперь PyTorch полностью бросает вызов, внедряя глубокое обучение и дифференцируемое программирование в картину. Это поднимает вопрос: кто отвечает за пересмотр того, что вы реализовали два года назад, и за обновление с учётом актуальных трендов? Хороший поставщик позаботится о том, чтобы ваше решение в области data science регулярно пересматривалось и, вероятно, переписывалось для сохранения актуальности.
Я не знаю, как долго продлится этот золотой век прогресса в data science, но меня не удивит, если, скажем, в течение следующего десятилетия каждые два года мы будем видеть фантастический прогресс, когда новая версия оказывается намного лучше предыдущей. Могут появиться категории задач, которые кажутся чрезвычайно сложными для решения, но становятся доступными.
Nicolas Vandeput: Если можно добавить, мне кажется действительно интересно, что Joannes упомянул о той сложности, с которой Lokad умеет справляться. Я лично работал с командой Lokad, так что знаю, на что они способны. Одно из посланий моей книги, и это действительно важно для меня, заключается в том, чтобы сказать людям, что они могут это сделать.
Некоторые люди могли услышать то, что говорит Joannes, и подумать: «Вау, data science и машинное обучение кажутся настолько сложными, может, это не для меня». Я действительно хочу заверить их, говоря: «Нет, это не так сложно. Вы можете начать с простой модели». И, на самом деле, как показывает книга, вы можете довольно легко начать с очень простой модели, которая уже сама по себе является чрезвычайно мощной. Затем вы можете добавлять слои, возможно, немного корректировать систему, данные, возможно, внедрять другую модель и так далее.
Таким образом, вы действительно можете начать с чего-то простого, что уже отлично работает, и затем перейти к более сложным вопросам. Это именно то послание, которое я хочу донести в книге: можно начать с простого и затем перейти к более сложному.
Kieran Chandler: Можете ли вы помочь нам понять, как определить, что модель работает? Можем ли мы её протестировать? Можем ли мы её воспроизвести? Эти принципы, похоже, применимы для простых моделей, но как только вы освоите их для базовой модели, сможете ли вы понять их в контексте гораздо более сложных моделей?
Nicolas Vandeput: Абсолютно, я настоятельно рекомендую начинать с простого. Как только вы освоите основы, вы сможете перейти к чему-то гораздо более сложному.
Kieran Chandler: Это подводит меня практически к моему последнему вопросу. Какие у вас надежды для читателей вашей книги и для дальнейшего использования инструментов с открытым исходным кодом?
Nicolas Vandeput: Моё видение и, более того, моя надежда заключаются в том, что люди прочитают эту книгу и обретут уверенность в своих способностях. В конце книги я хочу, чтобы они смогли сказать себе: «Да, я действительно могу это сделать. Это не кажется таким сложным». Возможно, две недели назад они не умели программировать, а к концу всё будет казаться им очень простым. Я хочу, чтобы эти люди начали экспериментировать самостоятельно, чтобы действительно окунуться в мир data science и опробовать новые модели. Надеюсь, они станут новыми лидерами в управлении цепочками поставок. Это также одно из посланий Lokad. Мы уже живём в количественном мире цепочек поставок, где можно экспериментировать и реализовывать решения, которые стабильно работают. Для этого нужна data science. Поэтому я очень надеюсь, что книга даст людям возможность сделать это самостоятельно.
Kieran Chandler: Нам придётся заканчивать, но спасибо за ваше время сегодня, Nicolas.
Nicolas Vandeput: Спасибо.
Kieran Chandler: Книга «Data Science for Supply Chain Forecast» уже вышла. Обязательно ознакомьтесь с ней на Amazon. Здесь, на Lokad TV, мы скоро вернёмся с новым эпизодом. А до тех пор спасибо за просмотр.
Joannes Vermorel: Спасибо.