Использование тегов для повышения точности прогнозирования

Повышение точности с помощью тегов


Главная » Salescast » Здесь

Сопоставляя различные фактические данные за прошлые периоды, Salescast повышает точность своих прогнозов. Однако сравнивая временные ряды, находить взаимные сходства довольно сложно, если данных недостаточно. Именно поэтому команда Salescast изобрела «теги». Теги используются для индикации атрибутов, например группы, подгруппы или категории, и они позволяют повысить качество сопоставительного анализа.

Более качественное сопоставление с тегами

С деловой точки зрения, Salescast дает советы по оптимизации товарооборота, а с технической — собственно создает прогнозы временных рядов. Для повышения точности таких прогнозов Salescast постоянно анализирует сходства и различия между временными рядами. Если брать временные ряды по отдельности, то они не содержат достаточно информации (так как эти ряды либо слишком короткие, либо в них есть ошибки); если же рассматривать множество рядов, становится возможным выделить более надежные показатели, например по сезонным изменениям спроса и предложения.

Если временной ряд слишком короткий и отслеживание товарной позиции ведется менее 3 месяцев, анализ будет сложен сам по себе из-за недостатка данных для сравнения новой информации с уже имеющейся.

В таких случаях интересно использовать «априорные» знания о товарах, например об их группах, категориях или других подобных качествах, влияющих на отношение к ним покупателя. Теги в Salescast используются как раз для того, чтобы прилагать данную информацию к входящим данным.

Например, если Salescast обнаружит, что все товары с определенным тегом испытывают одинаковые сезонные колебания, то прогнозы для нового вида товаров с тем же тегом будут составляться с учетом таких же колебаний. Таким образом, сезонные колебания сразу включаются в прогноз, не нужно ждать много месяцев, прежде чем накопится достаточно информации, чтобы ее можно было сравнить с имеющимися данными по другим товарам.

Описание товара в виде тегов

Проще говоря, тег — это всего лишь отдельная колонка в файле «Lokad_Items» (см. формат файлов в разделе Salescast), название которой начинается с префикса «Тег». Колонка «тег» может содержать любую информацию. Все товары с одинаковой информацией в колонке «тег» рассматриваются программой как предметы одной группы.

«Тег» должен отражать некоторый «априорный» принцип разделения предметов (*) на категории. Большинство компаний организовывают производимые или продаваемые товары в иерархические структуры, и такие структуры являются отличными «кандидатами в теги».

(*) «В терминологии Salescast «предмет» связан с отдельными временными рядами. В зависимости от контекста его можно заменить на товар, единицу складского хранения, штрих-код и т.д.».

Для примера давайте представим себе торговое предприятие, каталог продукции которого состоит из трех иерархических уровней: категории, группы и подгруппы. Такую структуру можно разделить на три тега: категории, группы и подгруппы.

Затем эти теги можно разделить по более узким признакам, например:
  • Цвет, размер и ткань могут использоваться для одежды.
  • Автор, коллекция и формат — для книг.

Советы по использованию тегов

В данном разделе мы дадим вам пару советов для более эффективного использования тегов в Salescast.

Теги не должны отражать предполагаемые сезонные колебания

Теги должны отражать какую-либо нестатистическую информацию о товаре. Использование тега, отражающего предполагаемые сезонные колебания спроса и предложения, а равно любую другую статистическую информацию, например о трендах, может показаться заманчивым, но мы советуем этого не делать, так как такие теги не дают Salescast полезных дополнительных данных. Salescast может найти информацию о сезонных колебаниях самостоятельно.

Каждый тег должен быть пригоден для множества предметов

Тег пригоден для Salescast, только если он объединяет множество предметов. Если тег включает в себя только один предмет, найти соответствия с другими предметами будет невозможно. В частности, номенклатура предмета обычно не подходит на роль тега, и именно потому, что у каждого предмета она своя.

Не используйте больше шести тегов

Теоретически Salescast может обрабатывать до 100 тегов (*), но на практике мы настоятельно не рекомендуем использовать более шести. Лучше использовать 3 тега, несущих действительно полезную информацию, нежели бесполезных 10 тегов.

(*) «Salescast не сможет обработать ваши данные, если они содержат более 100 тэгов».