Улучшение технологии прогнозирования
С момента основания Lokad нашей целью было неустанно совершенствовать технологию прогнозирования, чтобы предоставлять передовые методы оптимизации цепей поставок. Почти десять лет назад, я уже указывал на то, что быть компанией по машинному обучению странно: прогресс стабилен, но при этом нелинейный и непредсказуемый. Более того, большинство подходов, считающихся здравым смыслом в других областях, совершенно не применимы к машинному обучению. Однако это не означает, что прогресс зависит от случая: за ним стоит определённая методика.
Улучшение нашей технологии прогнозирования начинается с улучшения данных. Без надлежащей подготовки данных, процесс сводится к принципу «мусор на входе — мусор на выходе». Обеспечение корректного представления акций, дефицита товаров, сроков поставки в конкретном наборе данных требует большого количества времени и экспертизы. На практике, поскольку сложности с данными зачастую специфичны для отрасли, на Lokad требуется целая команда специалистов по цепям поставок, чтобы объединить различные наборы данных, представляющие такие разнообразные вертикали, как аэрокосмическая, мода, продуктовая розница и т.д.
Затем, когда мы [изобретаем]1 новый статистический метод, обычно оказывается, что этот метод демонстрирует превосходные результаты на одном наборе данных и уступает на другом. К сожалению, когда это происходит, новый статистический метод оказывается хрупким: его успех может быть обусловлен случайностью или проблемой переобучения. Таким образом, хотя может возникнуть соблазн создать индивидуальное решение для конкретного клиента Lokad, поскольку один статистический метод кажется наиболее подходящим для этого клиента, мы не работаем таким образом. Наш десятилетний опыт показал, что такие результаты неизбежно оказываются ненадежными, и что якобы превосходный метод может недолго сохранять такое положение. Если компания-клиент претерпевает значительные изменения — которые вполне могут быть вызваны самим воздействием Lokad — эффективность нового метода может резко снизиться.
Таким образом, мы сосредотачиваемся вместо этого на поиске статистических методов, которые обеспечивают превосходные результаты в самых разнообразных ситуациях, охватывая множество, отчасти не связанных между собой вертикалей, и, в идеале, обеспечивают равномерное улучшение повсюду, а не комбинацию улучшений и регрессий, даже если улучшения преобладают. Эта методика гораздо сложнее, чем простое чрезмерное применение [фичер инжиниринга]2 к данному набору данных, с бесконечным использованием одних и тех же алгоритмов машинного обучения, что и предлагают большинство аналитических агентств сегодня.
Этот подход вынуждает нас заново переосмыслить основы статистического прогнозирования. Например, переход к кросс-энтропии в качестве более совершенной метрики для оценки точности прогнозирования сыграл решающую роль в полном использовании возможностей глубокого обучения. Более недавно мы перешли на использование сетей смешанной плотности, мощного, но слабо используемого подхода3 для улавливания сложного поведения хвостов распределений в цепях поставок. Эти сети смешанной плотности предоставляют практическое решение для надёжной оценки вероятности редких событий, что критически важно в таких отраслях, как аэрокосмическая.
Наша технология прогнозирования остаётся в стадии разработки. Существует множество проблем, которые до сих пор решены не идеально. Например, каннибализация и реакция рынка на изменения цен остаются очень сложными задачами. Тем не менее, мы не сдаёмся, и даже после 10 лет исследований и разработок мы продолжаем делать успехи.
-
Мы стоим на плечах гигантов. Исследовательские усилия Lokad обычно представляют собой вариации идей, полученных от широкого сообщества специалистов по машинному обучению, которые, как правило, не занимаются задачами управления цепями поставок, а работают над общепринятыми проблемами, такими как обнаружение шаблонов, распознавание голоса или обработка естественного языка. ↩︎
-
Фичер инжиниринг — это процесс, предусматривающий ручное создание представления набора данных, подходящего для конкретного алгоритма машинного обучения. Фичер инжиниринг является мощным инструментом для смягчения известных недостатков алгоритмов машинного обучения. ↩︎
-
Оригинальная статья по сетям смешанной плотности (MDN) авторства Кристофера М. Бишопа датируется 1994 годом. Однако потребовалось почти два десятилетия, чтобы аппаратное обеспечение догнало возможности, открытые этой новаторской работой. В отличие от оригинальной статьи, в которой MDN применялись для обратной кинематики роботов, мы используем MDN для предоставления вероятностных прогнозов. ↩︎