Ежедневное, еженедельное и ежемесячное объединение данных

Ежедневное, еженедельное и ежемесячное объединение данных


Главная » Ресурсы » Здесь

Принцип объединения данных за день, неделю или месяц ставит перед нами некоторые проблемы, связанные в первую очередь с тем, что считать днем, неделей или месяцем. Настоящий раздел посвящен тому, как Lokad работает с данными — как входящими (фактическими), так и выходящими (прогнозами). Также в этом разделе объясняется, как различные принципы объединения данных используются на практике.


Терминология: предмет и заказ

Термины «предмет» и «заказ» связаны с [forecasting-file-format |форматом входящих данных] для Lokad. В данном разделе эти термины нужно понимать в том значении, которое определено Lokad. «Предмет» — это цель прогноза. Под «предметом» в зависимости от контекста может подразумеваться вещь, изделие, единица складского учета или штрих-код. «Заказ» — это количественное значение, связанное с предметом, в определенный момент в прошлом. Под «заказом» в зависимости от контекста может подразумеваться объем продаж, поставок или потребления.

Накопление данных для Lokad

Lokad использует следующие основные принципы:

  • «День начинается в 00 ч 00 мин»; таким образом, ежедневные прогнозы охватывают собой период времени с 00:00:00 по 23:59:59.
  • «Неделя начинается с понедельника»; следовательно, еженедельный прогноз охватывает время с понедельника (включительно) по воскресенье (включительно).
  • «Месяц начинается с первого числа»; ежемесячные прогнозы охватывают период с первого по последний день месяца.

Данные принципы работы Lokad нельзя изменить, однако в дальнейшем мы рассмотрим иные принципы, которые могут использоваться некоторыми компаниями.

Требования к входящим данным

Lokad старается принимать и обрабатывать фактический материал в любой форме. В частности, несмотря на то, что мы рекомендуем предоставлять ежедневные данные (данные по одному предмету за определенный день), суммируя заказ, другие варианты также допускаются.

Разрозненные исходные данные

Ежедневное объединение данных уменьшает размер пакета данных, загружаемых на Lokad. Такое уменьшение не влияет на точность прогноза. С другой стороны, если пакет данных изначально невелик, то и пользы от него будет немного. Lokad может обрабатывать и абсолютно разрозненные данные по одной строчке за операцию. В таком случае ежедневные количества рассчитываются как сумма заказов на определенный предмет в определенный день.

Предварительно объединенные данные за неделю или за месяц

Иногда объединенные фактические данные за день не сохраняются в системе предприятия, откуда эти данные могли бы поступить. Можно получить только данные за неделю или за месяц. Lokad может обрабатывать предварительно объединенные данные по заказам за неделю или за месяц. Если данные объединяются по неделям, Lokad нужно настроить только на обычные еженедельные прогнозы. Ежедневные, ежемесячные или квантильные прогнозы использовать нежелательно, так как статистические результаты могут оказаться нецелесообразными. Таким же образом, если данные объединяются по месяцам, Lokad нужно настроить только на обычные ежемесячные прогнозы.

Основной недостаток предварительно объединенных данных в том, что они ограничивают возможности прогнозирования. Кроме того, прогнозы становятся чуть менее точными. Lokad может повысить точность даже месячных или недельных прогнозов с помощью ежедневных схем.

Когда начинается прогнозирование?

Чтобы составить прогноз, Lokad сначала определяет порог, который обозначает «настоящее», то есть дату начала прогнозирования. Lokad высчитывает этот порог исходя из данных: прогнозирование начинается тогда, когда заканчиваются фактические данные. Например, если фактические данные заканчиваются 15-ым мая (включительно), то ежедневные прогнозы будут составляться со следующего дня — с 16-го мая.

Такой подход очень удобен, особенно для определения отправной точки. Данные могут прикрепляться к определенным периодам времени в прошлом, и Lokad создаст прогнозы, которые можно будет сравнить с (ни к чему не прикрепленными) фактическими данными, так как прогнозы сами по себе тоже являются частью прошлого.

Обычные ежедневные и квантильные прогнозы ведут себя одинаково: прогнозирование всегда начинается на следующий день после того, для которого в пакете данных существует самая свежая информация о заказе.

С обычными еженедельными и ежемесячными прогнозами все немного сложнее. Предположим, к примеру, что фактические данные (то есть «заказ» в терминологии Lokad) заканчиваются 15 мая; с какой даты начнется прогнозирование: с 1 мая или 1 июня? Согласно принципам Lokad, прогнозирование начнется с 1 мая. Действительно, так как за май имеется лишь частичная информация, Lokad прикрепляет эти данные к последнему дню апреля, чтобы регулярный (*) обычный ежемесячный прогноз мог начаться с мая.

(*) «Технически возможно создавать модели прогнозирования, способные учитывать периоды времени, за которые есть только частичные данные, однако составлять такие прогнозы довольно сложно, и на данный момент Lokad не поддерживает эту услугу.

Объединенные данные за неделю или за месяц

Прикрепление объединенных данных за месяц (или неделю) может привести к нежелательным результатам. Предположим, что у нас есть история заказов за несколько месяцев с отдельными заказами за первые числа. Также предположим, что последний день, за который есть фактические данные, — это 1 мая 2013 г. В данном случае Lokad считает, что данные за май собраны не полностью, и потому прикрепляет их к апрельским, что приводит к тому, что прогнозирование начинается с 1 мая. Однако мы хотели бы, чтобы данные за 1 мая были данными за весь месяц, и то, что делает Lokad, не соответствует нашим намерениям.

Чтобы предотвратить прикрепление данных, мы рекомендуем поместить строку заказа — количество заказов равно нулю — на дату последнего дня текущего месяца. В данном примере появление такой строки от 31 мая показывает Lokad, что данные по маю получены полностью, и прогнозирование должно начаться с 1 июня. Точно так же, то есть вставляя строку с нулевым заказом, можно решать подобные проблемы с еженедельными прогнозами.

Добавление такой «пустышки» негативно скажется на результатах любого квантильного прогноза, составляемого параллельно обычному ежемесячному прогнозу в Lokad. На практике, когда данные объединяются по месяцам, не следует анализировать данные с помощью квантильных прогнозов.

Проверка пригодности данных, исключение из общих правил

Существует одно исключение из общих правил — проверка пригодности данных. Lokad отфильтровывает заказы за следующую неделю и позже (даты высчитываются по показателям сервера Lokad).

Мы регулярно сталкиваемся с тем, что некоторые клиенты достают «артефакты» за даты в более-менее отдаленном будущем. Такие строки как правило являются не реальными продажами или поставками, а результатами каких-либо тестов корпоративной системы.

Естественно, с точки зрения ведения бизнеса нет особой необходимости использовать фактические данные, которых еще даже не должно существовать. Таким образом, Lokad отсекает такие данные при процедуре проверки пригодности и затем возобновляет процесс прогнозирования.

Альтернативное ежемесячное или еженедельное объединение

С точки зрения Lokad месяц начинается с первого числа. Тем не менее, некоторые компании пользуются иными принципами, например, для них каждый такой период начинается с 25-го числа месяца. В подобных ситуациях мы рекомендуем вам предварительно объединять данные по заказам по целевым периодам. В приведенном примере данные с 25 мая по 24 июня нужно объединить в одну строку заказов. Эта строка будет представлять собой значение предмета за месяц, и ее нужно будет вписать в первое число ДО действительного периода (то есть в данном случае в 1 мая). Затем Lokad создаст прогноз от первого числа месяца, который будет отражать данные для требуемого периода, например, от 25-го числа месяца.

Очень важно вписывать данные ДО действительного периода времени, потому что иначе часть результатов окажется в будущем и будет отсечена системой Lokad, согласно требованиям к данным (см. выше о проверке пригодности).