Статистическое прогнозирование - это наука, которая противоречит интуиции. Об этом уже говорилось ранее, но мы снова подчеркнем этот момент.

Часто люди обращаются к нам за поддержкой, потому что они только что загрузили данные в Lokad, и полученные ими прогнозы остаются неизменными. Другими словами, прогнозируемые значения остаются постоянными на все будущие шаги. Например, постоянные значения продаж на следующие 6 месяцев, если мы рассматриваем прогнозы ежемесячных продаж на 6 месяцев вперед.

Очевидно, что продажи бизнеса не могут быть абсолютно одинаковыми в течение следующих 6 месяцев, поэтому почему Lokad продолжает создавать такие бессмысленные результаты?

Мы точно знаем, что бизнес будет меняться (по крайней мере немного) в течение следующих шести месяцев. В этом нет сомнений. Однако проблема заключается в том, как мы можем создать прогноз, который будет максимально близким к этим будущим изменениям? Если мы идем по статистическому пути, то нам нужна статистическая модель для прогнозов.

Проблема в том, что нам нужна хорошая модель прогнозирования; и кардинальное правило статистического прогнозирования заключается в том, что чем сложнее модель, тем больше данных требуется для надежности модели. Модели, создающие разные прогнозы для каждого шага вперед, определенно сложнее, чем модели, создающие одно и то же значение для всех шагов вперед.

С другой стороны, можно также сказать, что более сложные модели менее надежны на ограниченных наборах данных, что означает, что их использование в определенных ситуациях очень вероятно снизит общую точность прогнозирования.

Вернемся к ситуации, когда люди жалуются на плоские прогнозы, обычно происходит просто то, что только что загруженные данные либо очень короткие (например, всего 3 месяца ежемесячной истории), либо очень разреженные (например, электронная коммерция с единичными продажами для каждого продукта). В таких ситуациях Lokad часто предлагает плоские прогнозы.

Это не ошибка, это функция повышения точности.


Комментарии читателей (6)

Привет, Йохан, эффективное представление временных рядов в реляционных базах данных - это довольно сложное дело. Вкратце, это очень зависит от длины временного ряда, который вы рассматриваете. Тогда я сомневаюсь, что в этой области существует что-то близкое к “стандарту отрасли”. Опять же, для самого исходного кода все очень зависит от длины и количества рассматриваемых временных рядов. Надеюсь, это поможет. 7 лет назад | Joannes Vermorel


Мы работаем над проектом временных рядов с типичным определением временного ряда и наблюдениями. Можете ли вы помочь с следующим:

  1. У вас есть стандартная структура определения временного ряда и связанных с ним наблюдений с точки зрения проектирования базы данных.
  2. Какова будет лучшая практика в отношении кода, представляющего временной ряд, например, [Уровень 1].[Уровень 2].[Порядковый номер].[Версия]. Любая помощь и поддержка будет оценена. 7 лет назад | Johan Strydom

Привет, Изи, это интересная мысль :-) Я думал об этом “атаке” с самого начала, хотя она не широко рекламируется на нашем веб-сайте. В основном, для этого вам нужно очень точно знать данные, которые ваша цель отправляет в Lokad. Затем вам также нужно очень точно знать тип корреляций, которые мы рассматриваем. Простые сдвиги временных рядов не являются “естественными” в реальных бизнес-данных. Наконец, это будет стоить вам некоторые деньги, так как мы не доверяем данным от неоплачивающих пользователей. Что касается наших техник, мы используем сложную смесь множества моделей, которая включает в себя известные классические методы. Эта тема, очевидно, немного чувствительна для нас, но я постараюсь позже опубликовать некоторый не слишком подробный обзор. Кроме того, следует отметить, что она все еще находится в быстром развитии. 9 лет назад | Жоанн Верморель


Итак, если я загружу неверные данные, тщательно подобранные для корреляции с поставщиком / партнером, который, как я знаю, использует ваш продукт, я могу испортить его результаты? Это интересно, и, кажется, довольно легко сделать! В противном случае, было бы хорошо узнать больше о техниках, которые вы используете (например, ARIMA, ANN и т. д.). 9 лет назад | Изи


Привет, Стивен, Хорошая мысль. Корневая проблема здесь заключается в том, что пользователь может захотеть не только сами прогнозы, но и их обоснование или, по крайней мере, комментарий. В будущем мы, вероятно, попытаемся улучшить клиентские приложения Lokad с помощью автоматических рекомендаций, которые будут “комментировать” прогнозы, предоставленные Lokad. 9 лет назад | Жоанн Верморель


Привет, Жоанн, ты думаешь, что это полезная обратная связь от пользователя в терминах описания того, чего ожидает пользователь? Возможно, вы могли бы ограничить пользователя только разрешенным выполнением задачи прогнозирования на несколько месяцев, скажем, 3, и если больше, то предупредить его о влиянии на точность прогноза. Я думаю, что это также может зависеть от наличия исторических данных, поэтому, возможно, есть способ связать их. Я не уверен. Кроме того, я думаю, что с точки зрения пользователей, хотя было бы более правильно вернуть им плоский прогноз, потенциально они могли бы быть как-то уведомлены об этом случае и/или предоставлен выбор принять его или принять более наивный результат? 9 лет назад | Стивен