Описание системы прогнозирования

Описание системы прогнозирования












Главная » Ресурсы » Здесь

Система прогнозирования — это отдельный компонент Lokad, который отвечает за базовое прогнозирование Данная система — сложная программа, которую можно отнести к системам с машинным самообучением. Кроме того, эта система значительно отличается от классических инструментов прогнозирования, которые, как правило, работают с прогнозированием временных рядов. В данной статье мы рассказываем о принципах работы системы, об ее отличиях от классических инструментов и о том, почему эти различия так важны с точки зрения цепей поставок.

Интегрированные прогнозы и периодические прогнозы

В классическом прогнозировании временных рядов используются периодические прогнозы на день, неделю или месяц. В данном случае исторические данные представляются в виде периодических временных рядов, как и прогнозы. Данный подход может давать удовлетворительные результаты для некоторых отраслей, например для прогнозирования энергопотребления или загруженности дорог, однако мы обнаружили, что он плохо работает применительно к оптимизации цепей поставки.

Периодические прогнозы не соответствуют реалиям управления цепями поставок: если время выполнения заказа составляет 10 дней, то нужно ли суммировать ежедневные прогнозы за 10 дней? Нужно ли суммировать прогноз на 1 неделю и 3 прогноза на один день? Как правило, суммирование прогнозов недопустимо со статистической точки зрения: прогноз суммы не равен сумме прогнозов. Таким образом, если время выполнения заказа равно 10 дням, то система прогнозирования должна создать прогноз на 10 дней, а не набор других прогнозов, из которых придется каким-то образом вычислить нужные значения.

Как следствие, система прогнозирования Lokad не создает ежедневные, еженедельные или ежемесячные прогнозы. Вместо этого она непосредственно рассчитывает прогнозы спроса, которые подходят под ожидаемое время выполнения заказа. Кроме того, время выполнения заказа также должно представлять собой вероятностный прогноз. Изначально такой подход может немного вводить в замешательство, но, к сожалению, сама идея того, что отдельные прогнозы можно рассчитать посредством суммирования периодических прогнозов, не работает в большинстве случаев, когда речь идет о цепях поставок.

Вероятностные прогнозы и среднестатистические прогнозы

Классические инструменты прогнозирования делают упор на среднестатистические значения. Однако если речь идет об оптимизации цепей поставок, коммерческие расходы связаны с крайними значениями. То есть когда спрос неожиданно повышается и товара не хватает, чтобы его удовлетворить. Или когда спрос неожиданно падает, что приводит к скоплению неликвидных запасов. Когда спрос примерно равен спрогнозированным значениям, уровни товарных запасов немного изменяются, но в целом цепь поставок работает без сбоев. Классические системы, использующие “среднестатистические” прогнозы (серединные или медианные), страдают от эффекта уличного фонаря. Неважно, насколько хорошим был статистический анализ, лежащий в основе прогноза — система дает ответ на неправильный вопрос.

Система прогнозирования Lokad, напротив, создает вероятностные прогнозы, где оценивается вероятность возникновения всех возможных вариантов развития событий (1). Расчет вероятности позволяет более точно оценить будущее по сравнению с прогнозами, выдающими лишь одно значение (например с серединными или медианными). Благодаря вероятностным прогнозам становится возможно с большей точностью рассчитать риски и возможности, которые есть в цепи поставок. Проще говоря, можно рассчитать финансовые последствия (2) для всех возможных решений в цепях поставок (например о покупке 1 дополнительной единицы складского хранения) для определенного уровня спроса в будущем. Таким образом, можно расставить приоритеты для всех возможных решений (3) только на основании “взвешенных” финансовых последствий (полученных путем сравнения финансовых оценок и вероятностей).

(1) На практике для повышения рациональности прогнозов все значения, которые считаются незначительными, приравниваются к нулю. Как следствие, обрабатывается только ограниченный набор значений.

(2) Например, представим, что мы приобрели 1 единицу товара сейчас, а спрос в будущем составит 5 (значит, мы продадим 5 единиц), при этом на конец периода в запасе у нас есть 2 единицы товара. Если предположить, что валовая прибыль равна 10, а расходы на содержание товара за один период для каждой не проданной единицы товара — 15, то чистая прибыль будет равна 5 x 10 – 2 x 15 = 20.

(3) Расстановка приоритетов для всех будущих решений может показаться сложной задачей, однако технология Lokad отлично справляется с данной проблемой. Данная технология отличается от непосредственно системы прогнозирования.

Образцы наборов данных и синтетические структуры изменения данных

Те, кто уже пользовался инструментами прогнозирования ранее, возможно, захотят проверить Lokad по временным рядам из нескольких десятков показателей, просто чтобы узнать, как работает система. Более того, кое-кто может захотеть посмотреть, как Lokad реагирует на простые структурные изменения, такие как линейные тренды или сезонные временные ряды. Как ни странно, в таких ситуациях наша система работает плохо. К сожалению, такая “плохая” работа системы — цена достижения качественных результатов в реальных ситуациях.

Одной из важнейших особенностей нашей системы является составление точных прогнозов без ручной статистической подгонки. Для этого система прогнозирования Lokad была специально настроена по сотням реальных и качественных наборов данных. Синтетические структуры изменения данных, такие как идеальные линейные тренды или идеальные циклические временные ряды, практически не встречаются в реальных наборах данных. Как следствие, такие структуры, несмотря на свою очевидность, не рассматриваются. В конце концов, зачем получать “хорошие” результаты на “ненастоящих” данных, если при этом не получится получить их на “реальных” данных? Наш опыт показывает, что хорошие системы прогнозирования очень консервативны при выборе моделей прогнозирования. Не стоит вводить “идеальную” модель линейной регрессии просто ради того, чтобы применять ее на образцовых данных — она может быть использована там, где не нужно.

Кроме того, чтобы избавиться от ручной корректировки данных, наша система во многом полагается на алгоритмы машинного самообучения. Именно поэтому для работы системе необходимы достаточно большие наборы данных. Система прогнозирования сама выбирает настройки, проводя множество статистических тестов по наборам данных. Тем не менее если набор данных слишком мал, она не сможет правильно себя настроить. Как правило, для получения качественных результатов необходимо не менее 1000 исторических показателей по 100 наименованиям или более. На практике даже небольшие интернет-магазины, оборот которых составляет менее 1 миллиона евро в год, могут собрать более 10 000 показателей по более чем 200 наименований. Именно поэтому требования системы прогнозирования к данным так невысоки. Тем не менее она не будет работать на “ненастоящих” наборах данных.

Требования системы прогнозирования к данным

Вот небольшой список требований к данным, которые необходимо выполнить для нормальной работы системы прогнозирования:

  • наименования: не менее 100, лучше 500, в идеале — 2000+
  • атрибуты наименований: не менее 1, лучше 3, в идеале — 5+
  • данные о продажах: не менее 1000, лучше 10 000, в идеале — 50 000+
  • данные о закупках: не менее 50, лучше 500, в идеале — 2000+
  • длительность истории в месяцах: не менее 3, лучше 18, в идеале — 36+

Под “наименованиями” понимаются SKU, товары, номера деталей, штрих-коды или любые другие элементы, по которым составляется прогнозы для конкретной компании.

Данные о закупках нужны для прогнозирования времени выполнения заказов. На начальном этапе можно обойтись и без них, однако неправильная оценка времени выполнения заказа может стать причиной хаоса в вашей цепи поставок, поэтому мы настоятельно рекомендуем указывать данный параметр, если есть такая возможность.

Входящие данные можно дополнить, прописав случаи дефицита товаров и промоакции. Система прогнозирования поддерживает и более сложные сценарии. В данном разделе описаны только “строго обязательные” данные.

Макропрогнозы и высокочастотные прогнозы

Система прогнозирования Lokad ориентирована на работу с цепями поставок в торговле и производстве. Эти сферы отличаются большим количеством наименований и нерегулярным спросом. Как раз в таких ситуациях наша система работает лучше всего. С другой стороны, существуют другие типы прогнозов, которые не подходят для нашей технологии.

Макропрогнозы, подразумевающие прогнозирование больших объединенных временных рядов, показатели в которых мало различаются (если принять во внимание цикличность), не являются коньком системы Lokad. Такие сценарии можно обнаружить в прогнозах энергопотребления, загруженности дорог, денежных потоков, входящих звонков и т. д. Наша система прогнозирования настроена на работу с большим количеством наименований, между которыми можно часто находить соответствия.

Высокочастотные прогнозы, которые составляются чаще, чем раз в день, также нельзя создавать в Lokad. К данному типу относится большинство финансовых прогнозов, в том числе прогнозы для курса ценных бумаг и обмена валют. Здесь трудность заключается в том, что статистические схемы уже используются (другими людьми) и потому влияют на развитие ситуации в будущем. Такие ситуации сильно отличаются от цепей поставок, где прогнозирование спроса мало влияет (4) на уровень спроса в будущем.

(4) Нельзя сказать, что прогнозы спроса не влияют на него вообще. Например, прогнозирование более высокого уровня спроса на товар приведет к тому, что на витрины будет выложено больше этого товара, что приведет к росту продаж. Тем не менее такие схемы редко работают в цепях поставок.