Руководство по тегам и событиям

Руководство по тегам и событиям


Разработчики » здесь

Руководство по тегам и событиям

Эта страница является вводным руководством для понятия под названием Теги+События. Технология прогнозов Lokad выходит за рамки классических методов. В частности, мы используем продвинутые методы, которые могут улучшить качество прогнозов, принимая во внимание большее количество данных, чем классические методы. На этой странице вы узнаете как воспользоваться преимуществами тегов и событий для улучшения качества ваших прогнозов.


Теги и События являются полезным инструментом в розничной торговле или производстве для улучшения прогнозов в следующих случаях:
  • Выпуск нового продукта
  • Кампании по продвижению товара
  • Маркетинговые операции
  • Дефицит товара
  • Разукомплектование
  • ...

Для сервисных компаний, таких, как контактные центры, Теги и События могут оказаться полезными в следующих случаях:
  • Маркетинговые операции
  • Перебои в оказании услуг
  • Местные события
  • ...

На этой странице не рассматриваются технические подробности управления данными для Тегов и Событий и общения с API прогнозирования. Целью этого документа является дать вам полное понимание тегов и событий, и как их использовать в реальных ситуациях в жизни.

Классическая модель прогнозирования

Lokad предоставляет прогнозы временных рядов. Временной ряд - это всего лишь список пар значений времени и переменной. Любое явление, которое можно измерить во времени, можно представить в виде временного ряда.

Например, в розничной торговле, продажи каждого продукта (каждого артикула) можно представить в виде временного ряда, с одной значением переменной в неделю, если, к примеру, выбрано еженедельное обобщение данных.

Классические модели прогнозирования рассматривают временные ряды как входящие данные - эти временные ряды представляют данные прошлых периодов компании, а также как исходящие данные - они представляют прогнозы продаж компании.

Говоря проще, прогнозирование состоит в продлении временных рядов в будущее. Несмотря на то что может быть много способов для этого, в настоящее время признано, что для большинства прогнозов для короткого и среднего периода, если есть данные прошлых периодов, статистические прогнозы превосходят все другие подходы.

Ограничение классической модели

Наше понятие Теги+События расширяет классическую модель прогнозирования путем добавления метаданных, а именно тегов и событий. Чтобы понять, почему Lokad ввел такие дополнения, рассмотрим далее ограничения классической модели прогнозирования.

Короткие временные ряды

Классическая модель при расчете прогнозов опирается только на данные, представленные в самих временных рядах. Если мы будем рассматривать короткий временной ряд, например, еженедельные продажи товара в течение месяца, который был выпущен всего 4 недели назад, количество информации во временном ряду будет очень ограничено: в данном примере всего 4 значения. Очевидно, будет невозможно рассматривать такие сложные модели как сезонность, так как для такого анализа нам потребуется 12 месяцев данных. Далее, если бы мы попытались объединить 4 недели с другими временными рядами чтобы выявить сезонность на основании взаимозависимости данных, 4 недели все еще довольно короткий промежуток, чтобы обеспечить достаточное количество данных для выявления сезонности продукта чисто статистическими методами. В случае с короткими временными рядами классический подход к прогнозированию не работает. Очевидно, что невозможно получить прогнозы и при запуске нового продукта.

Внешние факторы

Классическая модель не воспринимает внешние факторы, влияющие на временные ряды, так как предполагается, что вся информация содержится во временных рядах. Тем не менее, если мы примем во внимание внешние факторы, как, например, рекламную акцию по продвижению товара в розничной торговле, то это приведет к двум проблемам:
  1. рекламные кампании в прошлом искусственно увеличили продажи в прошлых периодах, и, пока данные не будут скорректированы (каким-то образом), модель прогнозирования будет завышать уровень продаж в прошлом периоде, и, следовательно, завышать и прогнозируемый уровень продаж.
  2. если в будущем планируется кампания по продвижению товара, классическая модель не может принять во внимание этот факт, следовательно, прогнозные значения, соответствующие периоду проведения такой кампании, будут занижены.

Несмотря на то, что классическая модель подходит для оценки таких внутренних факторов, как тренд, она не подходит для оценки внешних факторов.

Следует отметить, что теоретически классическая модель могла бы справляться с внешними факторами, используя независимую переменную, но это в какой-то степени расширяет понятие "классический" и "широко распространенный" в прогнозировании временных рядов. Большинство инструментов прогнозирования не могут учитывать такую внешнюю информацию, а те, которые это делают, не позволяют совсем или могут лишь в незначительной степени автоматизировать процесс.

Главной целью модели Теги+События является обеспечение эффективного статистического решения проблем, описанных выше.

Решение, предлагаемое моделью Теги+События

Ограничения, перечисленные выше, можно обобщить следующим образом: просто временные ряды не являются достаточно "выразительными" для отражения сложности явлений, которые мы пытаемся спрогнозировать. Следовательно, нам нужно обогатить модель данных временных рядов дополнительными элементами. Тэги и события и являются этими дополнительными данными.

Теги

Тег - это всего лишь термин. Мы используем слово тег вместо понятия ключевое слово, чтобы подчеркнуть, что мы фокусируемся на значении ключевого слова, тег используется как идентификатор. Lokad заботится о сугубо статистическом процессе, не на семантическом или лингвистическом анализе. Каждому временному ряду может быть присвоено несколько тегов (по существующим ограничениям Lokad до 1 тыс. тегов) или ни одного тега.

Пример: для розничных продавцов конфет тег "лимон" может быть применен ко всем временным рядам по продажам конфет со вкусом "лимон".

Теги задаются пользователем, поэтому в качестве тега может быть использована любая комбинация букв. Это не обязательно должно быть слово, существующее в английском языке. Тег отражает какое-то описание, заданное самим пользователем.

Полезность тегов исходит из сравнений, которые можно сделать на основании влияния одного и того же тега в различных случаях. Это предполагает, что вам нужно несколько временных рядов (на практике 10 и более) с одним и тем же тегом. В противном случае невозможно будет выявить статистические модели (или их отсутствие) в связи с присутствием (отсутствием) тега.

Пример: для розничного продавца конфет, который присвоил тег лимон всем конфетам со вкусом лимон Lokad может максимально эффективно использовать тег лимон для того, чтобы выявить наличие особых закономерностей в продажах лимонных конфет, например, наличие распределенной сезонности.

Кроме этого, теги можно комбинировать. Несмотря на то, что мы указали, что к одному временному ряду нельзя отнести одновременно более 1000 тегов, ограничения по количеству отдельных тегов не существует. Следовательно, возможно создать достаточны полные по описанию наборы тегов. Lokad способен максимально эффективно использовать комбинации тегов, чтобы выявить едва уловимые статистические модели для улучшения точности прогнозов, а не рассматривать лишь отдельные части, основанные на единичном теге.

События

События схожи с тегами, но более сложные. Фактически событие - это датированный тег, то есть тег, который несет в себе дополнительную информацию о дате, отражающую время, когда произошло событие. Более точно, у события есть три характерных признака:
  • дата начала.
  • известно с (эта характеристика не столь очевидная и она будет подробно рассмотрена далее).
  • набор ярлыков (мы снова не используем слово тег, чтобы избежать путаницы с тегами Lokad).

Пример: розничный продавец конфет каждый год в неделю перед Рождеством проводит рекламную кампанию по продаже шоколадных конфет на палочке купите одну и получите одну бесплатно. Временной ряд, относящийся к продажам шоколадных конфет на палочке, отмечается событием с названием купи1получи2. Событие начинается 18 декабря каждого года. Если это событие отнести к временному ряду в начале декабря, розничный продавец будет знать примерное количество необходимых для акции конфет за 3 недели до ее начала, принимая во внимание эффект рекламной акции.

Если одно и то же событие (то есть события с одним и тем же ярлыком) повторяется несколько раз в рамках временного ряда, Lokad способен выделить статистическую закономерность, относящуюся к данному событию. Когда событие привязывается в временному интервалу в будущем, Lokad корректирует прогнозы, применяя в прогнозе статистическую модель, привязанную к событию.

Как и с тегами, нужно несколько событий с идентичными ярлыками, чтобы выявить схожие черты во временных рядах и, следовательно, улучшить точность прогнозов. По правилам, события c идентичными ярлыками называются похожими. Тем не менее, похожие события могут быть распределены по нескольким временным рядам. Ситуация, когда в одном временном ряду есть похожие события, является самой простой для анализа, но на практике ситуации часто бывают более сложными, и у одного продукта может быть только одно событие за все время его существования на рынке. Сравнивая влияние события на другие продукты, Lokad улучшает качество прогнозов, даже если событие никогда ранее не случалось по отношению к рассматриваемому продукту.

Пример: розничный продавец конфет каждый год в неделю перед Рождеством проводит рекламную кампанию по продаже шоколадных конфет на палочке купите одну и получите одну бесплатно. Временной ряд, относящийся к продажам шоколадных конфет на палочке, отмечается событием с ярлыком купи1получи2. Тем не менее, продавец каждый год выбирает различные вкусы конфет на палочке для того, чтобы обновить витрину магазина, и также для того, чтобы соответствовать тенденциям рынка. Каждый год в продаже появляются новые вкусы конфет, но у продавца нет данных о продажах этих новых разновидностей в прошлых периодах по отношению к рекламным кампаниям перед Рождеством. Несмотря на это, Lokad может включить эффект купи1получи2, используя закономерности, наблюдавшиеся ранее в продажах конфет с другими вкусами.

Характеристика события "известно с"

В предыдущей части для упрощения мы подробно рассмотрели только первые три характеристики события: ярлык, дату начала и продолжительность. Тем не менее, у каждого события есть и четвертая характеристика: дата известно с. Так как свойства этой характеристики не столь очевидны, мы рассмотрим их подробно далее.

Характеристика известно с представляет точку, когда информация о событии стала доступна для системы, выполняющей прогноз (т.е. для Lokad). Другими словами, о существовании событии было известно с этой даты.

О некоторых событиях, например, рекламных кампаниях, обычно становится известно заранее за недели, в то время как о некоторых, например, отключении электроэнергии - нет. Характеристика 'известно с' указывает на возможность или невозможность считать событие в прошлом известным заранее для улучшения точности прогноза.

Причина значимости этого неявного аспекта в том, что точность прогнозов является важной характеристикой любой хорошей технологии прогнозов (и Lokad не исключение). Информация о событиях обычно улучшает качество прогнозов, но если в реальных ситуациях на рынке, о некоторых событиях ничего не известно, пока они не произойдут, данные прошлых периодов, включая данные, собранные после события, могут дать системе прогнозирования ложное представление точности, что приведет к недостаточно оптимальной обработке статистической модели на основании имеющихся данных.

Присвоение дат событиям и тегам

Мы описали, как можно использовать теги и события для улучшения качества прогнозов. Несмотря на то, что мы отметили, что как события, так и теги, задаются пользователем произвольно (теги и ярлыки являются произвольной комбинацией букв), теги и события обычно не вводятся в Lokad вручную.

На самом деле, целью Lokad является не только оптимизация, но и автоматизация процесса. Для розничного продавца с ассортиментом в тысячи товаров, ручной ввод тысяч тегов и событий был бы не только трудоемким и длительным процессом, но и, наверняка, повлек бы ошибки.

Следовательно, обычно мы советуем наладить автоматический процесс получения тегов и событий из системы автоматизации предприятия (обычно информационной системы управления ресурсами, планирования производственных ресурсов или управления отношениями с клиентами). Несмотря на то, что обычно этот процесс носит индивидуальный характер в зависимости от домена и компании, общие принципы рассмотрены ниже.

Заключение

Мы подробно рассмотрели ограничения, связанные с классической моделью прогнозирования. Lokad справляется с этими ограничениями, представляя более полную модель данных, с помощью которой можно рассматривать не только временные ряды, но также такие многофункциональные мета-данные как теги и события. И теги и события используются для оформления временных рядов. Теги представляют косвенное понятие о схожести определенных интервалов времени внутри временных рядов. Эти схожести используются Lokad для улучшения точности прогнозов способами, недоступными для классических моделей.

Выбор тегов+событий в розничной торговле и производстве

В этой части рассматривается использование тегов и событий в розничной торговле и производстве. Типичные ситуации в этих сферах включают в себя прогнозирование продаж для каждого артикула, чтобы оптимизировать размер товарных запасов по каждому артикулу. Далее рассмотрим, как можно улучшить управление товарными запасами путем получения более точных прогнозов.

Продукты через теги

Основной целью тегов является преодоление ограничений классической модели прогнозирования, которая для расчета прогноза принимает во внимание только данные об уровне спроса в прошлом. Теги предоставляют дополнительную информацию кроме строго данных прошлых периодов (то есть, об уровне прошлых продаж).

Продукты или товары можно описать различными и очень подробными способами, начиная с описания их физических свойств (цвет, вес, размеры, материал...) до абстрактных характеристик (семейство товаров, название марки, гарантийный срок, ...).

С другой стороны, описательные возможности тегов ограничены: для временного ряда, описывающего историю продаж продукта, тег может существовать или не существовать, и существует ограничение в 1000 тегов на временной ряд. Несмотря на то что теги обладают удивительной описательной способностью и несмотря на их простой принцип, зашифровать объемное подробное описание физических свойств продукта невозможно.

Тем не менее, нашей целью являются эффективные, а не всеобъемлющие описания продуктов. Так как основной задачей в данном случае является прогнозирование спроса, то эффективность описания оценивается по объему улучшений точности прогнозов путем добавления дополнительных данных.

Несмотря на то, что этот процесс может сначала показаться сложным, для выбора тегов, которые принесут эффективные улучшения, можно использовать несколько простых инструкций.

Основной идеей является то, что описание должно быть сфокусировано не на самих продуктах, но на взаимосвязи между ними, и особенно, на взаимосвязях, которые могут отражать схожие модели продаж. Обычно каталог товаров розничного продавца или производителя, где все товары разделены на категории является хорошим ресурсом для начала присвоения тегов.

Пример: у розничного продавца конфет есть такой каталог, номера товаров указаны в круглых скобках:
  • Жвачка
    • Вкус колы (1)
    • Вкус лимона (2)
    • Вкус мяты
      • Цвет белый (3)
      • Цвет светло-зеленый (4)
  • Конфеты на палочке
    • Вкус яблока
      • Цвет светло-зеленый (5)
      • Цвет зеленый (6)
    • Вкус лимона (7)
    • Вкус мяты
      • Цвет белый (8)
      • Цвет светло-зеленый (9)
  • Желейные бобы
    • Вкус колы (10)

В каталоге 10 конфет. Выбраны следующие теги:
  • Жвачка, Желейные бобы, Конфеты на палочке, для категорий конфет.
  • Яблоко, Кола, Лимон, Мята для вкусов.
  • Зеленый, Светло-зеленый, Белый fдля цвета.

Теперь мы можем присвоить следующие теги каждому пронумерованному товару:
  1. Жвачка, Кола
  2. Жвачка, Лимон
  3. Жвачка, Мята, Белый
  4. Жвачка, Мята, Светло-зеленый
  5. Конфета на палочке, Яблоко, Светло-зеленый
  6. Конфета на палочке, Яблоко, Зеленый
  7. Конфета на палочке, Лимон
  8. Конфета на палочке, Мята, Белый
  9. Конфета на палочке, Мята, Светло-зеленый
  10. Желейные бобы, Кола

Ранее мы сказали, что наличие тега, который только однажды фигурирует во временном ряду, не приносит большой пользы, так как нет почвы для сравнения с другими временными рядами. Несмотря на то, что в общем это так и есть, Lokad все же имеет возможность в ограниченном виде использовать тег, который появляется только один раз. Пользу возможно извлечь, выявив количество различий между двумя временными рядами, сравнивая отличия тегов, даже если они встречаются всего один раз.

На практике мы рекомендуем обращать больше внимания на общую иерархию, а не пытаться оптимизировать каждый тег по отдельности. Модель Lokad устойчива по отношению к шуму. Наличие большого количества тегов, которые не используются для целей прогнозирования, не является проблемой, так как они будут отфильтрованы. Негативного влияния на прогнозы не будет, пока количествоценных тегов превосходит количество тегов шума.

Как правило, чем более осмысленна и читаема иерархия, однажды оформленная в систему тегов, тем более вероятно, что она будет содержать хорошую и полезную информацию для улучшения точности прогнозов.

Ниже приведен краткий список характеристик, которые могут быть использованы в качестве эффективных тегов:
  • Код места нахождения для артикула, так как одни и те же товары могут продаваться в различных точках продаж. Теги места нахождения могут быть использованы Lokad для выявления закономерностей продаж, специфичных для каждой точки продажи.
  • Ценовая категория, несмотря на то, что теги - это сугубо качественная характеристика (тег не может представлять количество), ценовая категория обычно является важным фактором продаж. Обычные ценовые категории могут быть такими: лучшая цена, лучшее соотношение цена/качество, лучшее качество.
  • Опции представления, такие как ряд на витрине, на котором выставлен товар.

Рекламные кампании через события

Рекламные кампании являются важными событиями, которые оказывают большое влияние на продажи. Важно принимать во внимание рекламные кампании по двум основным причинам:
  • чтобы предвидеть скачки спроса которые невозможно было иначе спрогнозировать. Эта прямой и наиболее очевидный способ использования информации относительно рекламных кампаний.
  • для исключить необъективность данных прошлых периодов, которая будет существовать в других моделях. Например, если рекламная акция в пошлом не была помечена, она может повлиять на выявления сезонности и привести к неверным цифрам.

Прочтите наш пост об Улучшении прогнозов рекламных кампаний в розничной торговле для получения более подробной информации.

Также как и продукты, рекламные кампании можно очень подробно описать с огромным количеством мелких деталей. Тем не менее, нашей целью является не предоставление полной информации о деталях кампании, но нам нужно обратить внимание на скачкообразные моменты, которые являются наиболее полезными при прогнозировании рекламных акций.

Мы видели, что каждое событие Lokad имеет 4 характеристики: ярлык, дату начала, продолжительность, дату "известно с". Чтобы представить такое сложное событие, как, например, рекламную кампанию, обычно используется несколько событий. Так как все события относятся к одному экономическому явлению, мы советуем, чтобы 3 временные характеристики у них совпадали: дата начала, продолжительность, дата "известно с".

Следовательно, сложное событие можно рассматривать с 4мя определяющими характеристиками: набор ярлыков, дата начала, продолжительность, и дата "известно с".

Рассмотрим, как необходимо определить эти 4 характеристики. С временными характеристиками все достаточно очевидно:
  • дата начала отражает дату начала рекламной акции,
  • продолжительность отражает время действия события,
  • дата "известно с" отражает дату, когда было принято решение о запуске события (обычно это несколько недель до начала акции).

Так как дата "известно с" является несколько необычной характеристикой, в традиционных информационных системах управления такая информация не фиксируется. Тем не менее, в отношении рекламных кампаний, мы можем спокойно предположить, что о них всегда известно заранее. Следовательно, можно использовать любую дату ранее даты начала акции. Например, 1 января 1901 года может использоваться как ироничная дата, которая говорит о том, что о рекламной кампании было известно заранее.

Очевидно, набор ярлыков является характеристикой, содержащей наибольшее количество информации об акции. Сказанное о тегах остается верным: ярлыки должны быть нацелены на схожие черты, существующими между событиями.

Обычно у рекламной акции два набора описаний:
  • Механизм, который описывает природу скидки.
  • Информирование, которое описывает как будут уведомлены покупатели.

Механизмом является, например, купи одну получи одну в подарок. У крупных розничных продавцов обычно бывает десятки механизмов продвижения товара, начиная с непосредственно скидки до более сложных схем, в которых участвуют многие товары и которые требует множества операций от потребителей.

Скидки обычно выражаются в процентном отношении (например: +15% от цены товара), но теги являются качественной, а не количественной характеристикой. Смотрите ниже раздел Как работать с качественной переменной, чтобы адаптировать ваши теги в присутствии количественных факторов.

Информирование обычно происходит по нескольким каналам:
  • Упаковка рекламируемого товара.
  • Особый вид выкладки товара, например, на краю полки.
  • Реклама по местному радио.
  • Прямая рассылка клиентам.
  • ...

Каждому каналу обычно должно быть приписано свое кодовое название, которое будет помещено в описание рекламной акции.

Пример: у розничного продавца событие представлено следующим образом
  • Механизм:
    • Купи1получи2
    • Купи2получи3
    • Купи1минус20процентов
  • Информирование
    • Витрина
    • Почтовая рассылка
    • РекламнаяПолка

Продавец планирует весеннюю рекламную акцию, по которой покупатели могут купить 3 лакричные конфеты по цене двух. В витрине будет помещен большой знак и по местному району сделана почтовая рассылка, но для рекламируемых лакричных конфет не будет выделено отдельной полки. Начала акции планируется на 15 апреля и она будет длиться одну неделю. Описание акции в модели Lokad будет иметь следующий вид:

Продукт: Лакрица (также название временного ряда, относящегося к продажам лакрицы)
Названия: Купи2получи3, Витрина, Почтовая рассылка
Дата начала: 15 апреля
Продолжительность: 7 дней
Известно с: 1 марта

Отметим, что теги товаров, которые идут в дополнение к событиям, также очень полезны для прогнозов рекламных акций. На самом деле, Lokad сможет более эффективно совместить модели акций, если кроме событий предоставлены еще и описания товаров.

Запуск продуктов с точки зрения тегов и событий

Запуск продукта обычно является патологичной ситуацией для многих инструментов прогнозирования в связи с отсутствием каких-либо данных о продажах нового продукта. Тем не менее, Lokad может рассчитывать прогнозы для нового запускаемого продукта а полностью автоматическом режиме. Как обычно, это сугубо статистический процесс: Lokad максимально эффективно использует закономерности, наблюдаемые при предыдущих запусках продуктов чтобы выявить закономерность для продаж данного нового запускаемого продукта.

Будет лишним говорить, что построение прогноза для запуска продукта требует значительного объема исторических данных о продажах обычно более десятка товаров. Если выпускаемый продукта является первым продуктом компании (например, в случае образования новой компании), тогда статистический подход не применим.

С точки зрения Lokad запуск продукта похож на рекламную компанию, но с той разницей, что нет данных, относящихся к продажам нового товара. Для описания запуска продукта мы рекомендуем включить 3 важных пункта:
  • точка отсчета непосредственно перед запуском.
  • набор тегов, описывающих продукт.
  • набор событий, описывающих сам запуск.

Целью точки отсчета является предоставление Lokad контекста для построение прогноза. Конечно, Lokad использует ориентированный на данные подход в прогнозировании. Проще говоря: прогнозы начинаются там, где заканчиваются данные прошлых периодов. Точка отсчета дает Lokad подсказку, чтобы правильно расположить первый прогноз.

В случае запуска продукта теги нужны, так как у Lokad отсутствуют данные о продажах в прошлых периодах, на которые можно было бы опереться. Lokad полностью зависит от информации о продажах других продуктов.

И наконец, события не являются обязательными, но, так как объем информации, содержащейся в тегах затем сравнивается с обычной ситуацией в прогнозировании, когда есть данные прошлых периодов, дополнительная информация, предоставленная путем включения событий может значительно увеличить точность прогноза.

Другие виды событий

Возможно, рекламные акции являются наиболее важными закономерностями в розничных продажах, которые можно смоделировать через события. Нет необходимости сообщать Lokad о таких сезонных событиях, как Рождество. Lokad предлагает естественное управления такими повторяющими событиями, которые оказывают влияние на большое число компаний.

Существуют другие события, которые возможно смоделировать, например:
  • Частичный дефицит, который в данных отразится как падение спроса в то время как на самом деле означает, что в какой-то момент было невозможно купить данный товар.
  • Особенный нерабочий день, который может быть вызван различными причинами, как, например, инвентаризация, шторм, забастовка или строительные работы.

В настоящее время Lokad не работает с информацией о погоде в качестве входящих данных для улучшения точности прогноза в зависимости от погоды в определенной местности. Эта опция значится в наших среднесрочных планах.

Другие способы использования Тегов и Событий

This section deals with more subtle situations that have not been detailed previously for the sake of clarity.

Работа с количественными переменными

Модель Теги+События не работает с количественными переменными. Например, если мы рассмотрим продавца конфет, предлагающего скидку 10% на конфеты на палочке и 30% на желейные бобы, мы можем создать два ярлыка Скидка10 и Скидка30, но это не даст Lokad информацию о взаимозависимости между этими ярлыками скидок.

Чтобы отразить зависимости между двумя количественными значениями через качественные (также называемые дискретными или Булевыми переменными), мы можем ввести дискретную градацию, например

  • -10% относится к: Скидка10
  • -20% относится к: Скидка10, Скидка20
  • -30% относится: Скидка10, Скидка20, Скидка30
  • ...

Этот метод эффективен, но следует заметить, что использование слишком детальных данных, как использование столь подробной шкалы, может ухудшить точность прогнозов. На самом деле, это приведет к тому, что информативные ярлыки будут поглощены не столь информативными. На практике мы советуем использовать градацию менее 5 ярлыков, если только у вас нет веской причины поступить по-другому.

Работа с редко повторяющимися событиями

Некоторые переменные могут косвенно отражать количественные явления, но с неявным подтекстом частоты. Например, чем экстремальнее событие, тем больше его воздействие на экономические операции. Тем не менее, экстремаьные события обычно происходят достаточно редко, поэтому их трудно выразить количественно.

Пример: дождь, шторм и ураган негативно влияют на продажи конфет. Чем хуже погода, тем более негативно влияние на объем продаж. Тем не менее, дождь, шторм и ураган происходят с различной частотой. В месте нахождения магазина конфет это в среднем:
  • Дождь бывает 10 недель в году (1).
  • Шторм бывает 5 дней в году (2).
  • Ураган бывает раз в три года (3).

Учитывая, что у розничного продавца 10 недель дождя в году, взяв данные прошлого года можно оценить количественно влияние дождя на объем продаж (статистический метод может быть достаточно сложным, но по крайней мере имеются данные). С другой стороны, в данных прошлого года может не быть урагана. Таким образом, его влияние будет трудно оценить количественно.

Трудной задачей является то, что без дальнейшей информации, статистическая модель вероятнее всего будет игнорировать ураган просто потому что нет достаточного количества данных для определения ясной закономерности из-за малого количества ураганов в прошлом. Фактически, во всей истории продаж компании есть информация только о двух ураганах.

Таким образом, придерживаясь такого же подхода, как в предыдущей части относительно количественных переменных, продавец конфет представляет следующую градацию погодных явлений:
  1. Дождь
  2. Дождь, Шторм
  3. Дождь, Шторм, Ураган

Это позволит Lokad улучшить точность прогнозов для ураганов на основании данных о шторме и дожде. В случае нехватки данных для количественной оценки влияния урагана Lokad может примерно оценить эффект урагана, используя данные о более часто повторяющихся штормах.

Только что представленный нами подход является очень хорошим способом работы с редко происходящими экстремальными событиями. И снова, мы не рекомендуем злоупотреблять этим методом, так как обычно лучшим решением является использование ограниченной градации 2 или 3 ярлыков.

Конфиденциальность через обезличивание

Тэги и События могут представлять важную информацию для вашего бизнеса. Хотя защита конфиденциальности данных наших клиентов является одним из приоритетов Lokad, вы можете также обезличить данные, посылаемые в Lokad. Это процесс гарантирует, что данные, переданные в Lokad не смогут быть использованы ни для каких других целей, кроме сугубо статистических. Более подробная информация на нашей странице об обезличивании.

Для поставщиков


Для прогнозистов


Ошибочные подходы


Расценки