Ширина против глубины, Поверните свои прогнозы продаж на 90 градусов
Мы уже обсуждали, почему Lokad не очень заботится о прогнозировании китайской еды вместо напитков в спорт-баре. Другой способ мышления нашей технологии состоит в повороте ваших прогнозов продаж на 90 градусов.
Мы наблюдаем, что средний срок службы потребительского товара составляет 3 года. Это означает, что в среднем количество данных, доступных для каждого отдельного продукта, составляет около 18 месяцев. Когда мы смотрим на историю продаж с ежемесячной агрегацией, 18 месяцев данных означает 18 точек.
С 18 точками данных, несмотря на то, насколько умной или продвинутой является ваша теория прогнозирования, вы не можете сделать многое просто потому, что у нас полное отсутствие данных для проведения надежного статистического анализа. С 18 точками даже очевидный паттерн, такой как сезонность, становится сложным для наблюдения, потому что у нас даже нет 2 полных сезонных наблюдений.
Возможно, в разных отраслях ситуация может быть разной, но если ваши продукты не находятся на рынке десятилетиями, вы, скорее всего, столкнетесь с этой проблемой.
В качестве прямого следствия, классические инструменты прогнозирования требуют от статистиков настройки прогнозных моделей для каждого отдельного продукта, потому что ни одна нетривиальная статистическая модель не может быть надежно подогнана с использованием только 18 точек входных данных.
Однако, Lokad не требует наличия статистика, и волшебство заключается в повороте на 90 градусов: наши модели не итерируются по данным одного временного ряда за раз, а против всех временных рядов сразу. Таким образом, у нас гораздо больше входных данных, и, следовательно, мы можем добиться успеха с достаточно продвинутыми моделями.
Этот подход просто здравый смысл: если вы хотите прогнозировать сезонность вашего нового шоколадного батончика, сезонность других шоколадных батончиков кажется хорошим кандидатом. Почему бы не рассматривать каждый шоколадный батончик в строгой изоляции от остальных?
Однако с вычислительной точки зрения проблема только что стала намного сложнее: если у вас есть 10 000 SKU, то количество ассоциаций между двумя SKU составляет примерно 100 миллионов (и 10 000 SKU - это ни разу не большое число). Вот именно здесь вступает в игру облачная технология: даже если ваши алгоритмы хорошо разработаны, чтобы не страдать от строгой квадратичной сложности, вам все равно понадобится много вычислительной мощности. Облачные вычисления просто делают эту вычислительную мощность доступной по требованию по очень низкой цене.
Без облачных вычислений просто невозможно реализовать этот вид технологии.