Прогнозирование с использованием категорий и иерархии

Прогнозирование с использованием категорий и иерархии












Главная » Ресурсы »

Цель Lokad — создание максимально точных прогнозов. Тем не менее доступных данных по отдельно взятому товару зачастую недостаточно для расчета точного статистического прогноза. Lokad решает эту проблему за счет широкого сопоставления предметов для корректировки прогнозов. Однако возможности установления соответствий на основе истории спроса обычно довольно ограничены из-за недостатка данных. Именно поэтому при дальнейшей оптимизации прогнозов Lokad также использует такие понятия как иерархия наименований и категории наименований. На данной странице мы рассказываем, как такие данные загружаются в систему прогнозирования Lokad.

Основной синтаксис

Категории и иерархию можно ввести в систему в виде именных аргументов, как показано ниже:
Leadtime = forecast.leadtime(
  category: C1, C2, C3, C4
  hierarchy: H1, H2, H3, H4
  // другие аргументы опущены
  )
Demand = forecast.demand(
  category: C1, C2, C3, C4
  hierarchy: H1, H2, H3, H4
  // другие аргументы опущены
  )  

Эти аргументы являются необязательными, поэтому category и hierarchy можно опустить. Там, где они не опущены, можно создать до 4 векторов, но можно задать и 1, 2 или 3 вектора.

Прогнозирование

Категории и иерархия очень похожи с точки зрения системы прогнозирования: они помогают работать с малым количеством фактических данных. Количество зафиксированных показателей по каждому отдельно взятому наименованию (1) может быть очень небольшим, возможно, всего несколько показателей за год. В таких ситуациях прогнозы, основанные на ограниченных данных, которые мы составляем для любых наименований, могут быть неточными из-за большого количества "погрешностей" в расчетах.

(1) Под наименованием можно понимать товар, штрих-код, SKU, деталь и т. д. — все зависит от конкретной рассматриваемой ситуации. Наименование с точки зрения прогнозирования определяет детализацию.

Система прогнозирования Lokad позволяет бороться с этой проблемой путем поиска и обработки соответствий между наименованиями. Тем не менее из-за малого количества показателей достаточно сложно находить соответствия между наименованиями, опираясь только на исторически данные. Как следствие система прогнозирования анализирует отношения между различными наименованиями на основании их атрибутов или свойств.

В розничной торговле такие свойства обычно собираются посредством систем управления информацией о продуктах (PIM). Будучи веб-приложением, Lokad не обладает функциями PIM, однако данные, обрабатываемые Lokad, очень часто могут быть получены из них. Эти свойства важны с точки зрения прогнозирования, потому что они косвенно содержат очень много информации о рынке: они, например, указывают на соответствующие сегменты рынка и выделяют факторы дифференциации наименований.

Иерархия

Под иерархией подразумевается иерархическая организация (в виде дерева) всех элементов. Система прогнозирования поддерживает до 4 иерархических уровней. При использовании нескольких иерархических уровней их необходимо вводить в систему в порядке убывания важности, например первый аргумент должен отражать самый высокий уровень иерархии. Система прогнозирования не поддерживает использование нескольких иерархических структур.

В большинстве компаний уже используются иерархии для организации наименований. Иерархические уровни можно называть следующим образом: рынок, сегмент, группа, подгруппа и т. д. в зависимости от принятой в компании терминологии. Например в интернет-магазинах иерархию товаров можно увидеть в меню навигации на веб-сайте компании.

Категории

Под категориями подразумеваются различные способы разделения элементов, которые важны для прогнозирования. Категории должны дополнять иерархию другими свойствами продаваемых товаров (например автор для книг). В отличие от иерархии категории могут никак не соотноситься друг с другом, поэтому одна категория не имеет преимущества перед другой.

На практике категории можно использовать, чтобы учесть различные атрибуты элементов, такие как марка, материал или цвет. Категории также можно использовать как своего рода средство вторичной иерархии. Система прогнозирования поддерживает до 4 различных категорий.

Предварительные знания о рынке

Посредством иерархии и категорий система прогнозирования пытается получить предварительные знания непосредственно о рынке. Любые атрибуты или характеристики, которые важны для экспертов в той или иной сфере деятельности, будут также важны и для системы прогнозирования. Рекомендуется использовать не менее двух атрибутов (два уровня иерархии или один уровень иерархии и одну категорию) при работе с любыми наборами данных, содержащими более ста наименований. Благодаря этому точность прогнозов значительно повысится.

Кроме того, рекомендуется создавать синтетические категории (или уровни иерархии), которые могут дать системе прогнозирования информацию, скажем, о сезонных изменениях или объемах продаж, или о погрешностях в истории продаж. Если атрибут можно рассчитать с помощью исторических данных, система прогнозирования может сделать это самостоятельно, и дополнительные действия с вашей стороны не потребуются.