С момента создания Lokad нашей целью было безудержное улучшение нашей технологии прогнозирования для достижения превосходных форм оптимизации цепи поставок. Почти десять лет назад, я уже указывал на то, что быть компанией машинного обучения - это странно: прогресс постоянен, но также нелинейен и непостоянен. Более того, большинство подходов, которые считаются здравым смыслом в других областях, являются ошибочными, если речь идет о машинном обучении. Однако это не означает, что этот прогресс остается на волю случая: в этом есть своя методика.

Улучшение нашей технологии прогнозирования начинается с улучшения данных. Без должной подготовки данных, процесс превращается в бесполезное занятие “мусор в мусор из”. Убедиться в том, что акции, дефициты товара, сроки поставки правильно представлены в определенном наборе данных, требует много времени и опыта. На практике, поскольку проблемы с данными обычно являются специфичными для отрасли, для консолидации различных наборов данных, представляющих такие отрасли, как авиационная промышленность, мода, продовольственная розница и т. д., в Lokad требуется целая команда специалистов по цепи поставок.

Затем, когда мы изобретаем1 новый статистический метод, обычно оказывается, что этот метод проявляет превосходную производительность на одном наборе данных и низкую производительность на другом наборе данных. К сожалению, когда это происходит, новый статистический метод обычно оказывается хрупким: он может быть в некоторой степени удачным или жертвой проблемы переобучения. Таким образом, хотя может быть соблазн создать специальный случай для определенного клиента Lokad, потому что один статистический метод кажется лучше подходит для этого клиента, мы не работаем таким образом. Наше десятилетие опыта показало нам, что эти результаты всегда оказываются хрупкими и что предполагаемый превосходный метод может не оставаться таковым надолго. Если компания-клиент претерпевает существенные изменения - которые могут быть вызваны самими действиями Lokad - производительность нового метода может развалиться.

Таким образом, мы сосредотачиваемся на поиске статистических методов, которые обеспечивают превосходные результаты для широкого спектра ситуаций, в различных отраслях, идеально обеспечивая одинаковое улучшение везде, а не смесь улучшений и регрессий, даже если эта смесь сильно склоняется в сторону улучшений. Эта методология более сложна, чем просто “переинжиниринг” данных в данном наборе данных, бесконечно перерабатывая один и тот же алгоритм(ы) машинного обучения, что делают большинство агентств по обработке данных в настоящее время.

Этот подход заставляет нас пересмотреть самые основы статистического прогнозирования. Например, переход к кросс-энтропии в качестве более превосходной метрики для измерения точности прогнозирования был решающим в использовании глубокого обучения. Более недавно мы перешли к смесевым плотностным сетям, мощному, но недостаточно используемому подходу2, чтобы учесть сложные хвостовые поведения в цепях поставок. Эти смесевые плотностные сети предоставляют решение для надежной оценки вероятности редких событий, что критично в отраслях, таких как авиакосмическая.

Наша технология прогнозирования остается работой в процессе. Есть много проблем, которые до сих пор несовершенно решены. Например, каннибализация и реакция рынка на изменение цен остаются очень сложными задачами. Тем не менее, мы не сдаемся, и даже после 10 лет исследований и разработок, мы все еще продвигаемся вперед.


  1. Мы стоим на плечах гигантов. Научные исследования и разработки Lokad обычно являются вариациями идей, полученных от широкого сообщества машинного обучения, которые обычно не работают над проблемами цепей поставок, а скорее над такими основными проблемами, как обнаружение шаблонов, распознавание речи или обработка естественного языка. ↩︎

  2. Оригинальная статья “Mixture Density Networks (MDN)” Кристофера М. Бишопа датируется 1994 годом. Однако, почти два десятилетия потребовалось, чтобы аппаратное обеспечение соответствовало возможностям, открытым этой первоначальной работой. В отличие от оригинальной статьи, которая была применена к обратной кинематике робота, мы используем MDN для предоставления вероятностных прогнозов спроса. ↩︎