Ширина против глубины, поверните прогнозы продаж на 90 градусов

Мы уже обсуждали, почему Lokad не слишком заботился о прогнозировании китайской еды, а не напитков для спортбара. Другой взгляд на нашу технологию заключается в повороте ваших прогнозов продаж на 90 градусов.
Мы наблюдаем, что у потребительского продукта в среднем срок жизненного цикла составляет 3 года. Это означает, что в среднем объем данных, доступных для каждого продукта, составляет около 18 месяцев. Если мы рассмотрим историю продаж с месячной агрегацией, 18 месяцев данных означают 18 точек.
При наличии 18 точек данных, независимо от того, насколько продвинута или умна ваша теория прогнозирования, вы не сможете добиться многого просто потому, что данных крайне недостаточно для проведения надежного статистического анализа. При 18 точках даже наблюдение таких закономерностей, как сезонность, становится проблематичным, так как у нас даже нет двух полных сезонных наблюдений.
Результаты могут различаться в зависимости от отрасли, но если ваши продукты не остаются на рынке десятилетиями, вы скорее всего столкнетесь с этой проблемой.
Как следствие, классические инструменты прогнозирования требуют, чтобы статистики подгоняли модели прогнозирования для каждого продукта, поскольку никакая нетривиальная статистическая модель не может быть надежно построена, имея всего 18 точек данных.
Тем не менее, Lokad не требует наличия статистика, и волшебство заключается в повороте на 90 градусов: наши модели анализируют не одну временную серию за раз, а все временные ряды сразу. Таким образом, у нас доступно гораздо больше входных данных, и, следовательно, мы можем добиться успеха с использованием достаточно продвинутых моделей.
Этот подход — просто здоровый смысл: если вы хотите прогнозировать сезонность вашего нового шоколадного батончика, сезонность других батончиков кажется хорошим кандидатом. Зачем относиться к каждому батончику в строгой изоляции от остальных?
Однако, с вычислительной точки зрения, задача стала значительно сложнее: если у вас есть 10,000 SKU, число взаимосвязей между двумя SKU составляет примерно 100 миллионов (а 10,000 SKU — это вовсе не большое число). Именно здесь на помощь приходит облако: даже если ваши алгоритмы спроектированы так, чтобы не страдать от строгой квадратичной сложности, вам всё равно потребуется много вычислительной мощности. Облако как раз делает эту мощность доступной по требованию по очень низкой цене.
Без облака просто невозможно предоставить этот вид технологии.