Статистическое прогнозирование - это наука, противоречащая интуиции. Об этом уже говорилось ранее, но мы снова подчеркнем этот момент.

Часто люди обращаются за поддержкой, потому что только что загрузили данные в Lokad, и полученные ими прогнозы плоские. Другими словами, прогнозируемые значения постоянны на все шаги вперед. Например, постоянные значения продаж на следующие 6 месяцев, если мы рассматриваем прогнозы ежемесячных продаж на 6 месяцев вперед.

Очевидно, что нет никакой возможности, чтобы продажи бизнеса были абсолютно плоскими в течение следующих 6 месяцев, так почему Lokad продолжает производить такие бессмысленные результаты?

Мы точно знаем, что бизнес изменится (по крайней мере немного) в течение следующих шести месяцев. Вопрос в том, как можно составить прогноз, максимально близкий к этим будущим изменениям? Если мы идем по статистическому пути, то нам нужна статистическая модель для прогнозов.

Проблема в том, что нам нужна хорошая модель прогнозирования; и кардинальное правило статистического прогнозирования заключается в том, что чем сложнее модель, тем больше данных нужно для того, чтобы модель была надежной. Модели, предсказывающие разные значения для каждого шага вперед, определенно более сложны, чем те, которые предсказывают одно и то же значение для всех шагов вперед.

С другой стороны, мы также можем сказать, что эти более сложные модели также менее надежны на ограниченных наборах данных, что означает, что использование их очень вероятно снизит общую точность прогнозирования в определенных ситуациях.

Возвращаясь к ситуации, когда люди жалуются на плоские прогнозы, обычно происходит просто то, что данные, которые были только что загружены, либо очень короткие (например, всего 3 месяца ежемесячной истории), либо очень разреженные (например, электронная коммерция с единичными продажами для каждого продукта). В таких ситуациях Lokad часто предлагает плоские прогнозы.

Это не ошибка, это функция улучшения точности.


Комментарии читателей (6)

Привет, Йохан, эффективное представление временных рядов в реляционных базах данных - это довольно сложное дело. В двух словах, это очень зависит от длины временных рядов, которые вы рассматриваете. Тогда я сомневаюсь, что в этой области существует что-то близкое к “стандарту отрасли”. Опять же, для самого исходного кода все очень зависит от длины и количества рассматриваемых временных рядов. Надеюсь, это поможет. Joannes Vermorel (7 лет назад)


Мы работаем над проектом временных рядов с типичным определением временных рядов и наблюдениями. Можете ли вы помочь с следующим:

  1. У вас есть стандартная структура отрасли для определения временных рядов и связанных наблюдений с точки зрения проектирования базы данных.
  2. Какова будет лучшая практика в отношении кода, который представляет временной ряд, например [Уровень 1].[Уровень 2].[Порядковый номер].[Версия]. Любое руководство и помощь будут оценены. Johan Strydom (7 лет назад)

Привет, Изи, это интересная мысль :-) Я думал об этом рода “атаке” с самого начала, хотя это не широко рекламируется на нашем сайте. В основном, для этого вам нужно очень точно знать данные, которые ваша цель отправляет в Lokad. Затем вам также нужно очень точно знать тип корреляций, на которые мы смотрим. Простые сдвиги временных рядов не являются “естественными” в реальных бизнес-данных. Наконец, это будет стоить вам немного денег, так как мы не доверяем данным от неоплачивающих пользователей. Что касается наших техник, мы используем сложное сочетание многих моделей, включая хорошо известные классики. Эта тема, очевидно, немного чувствительна для нас, но я постараюсь позже опубликовать некоторый не слишком подробный обзор. Кроме того, стоит отметить, что это все еще находится в быстром развитии. Joannes Vermorel (9 лет назад)


Итак, если я загружу неверные данные, тщательно подобранные для корреляции с поставщиком / партнером, который, как я знаю, использует ваш продукт, я могу испортить его результаты? Это интересно, и, кажется, довольно легко сделать! В противном случае было бы хорошо узнать больше о техниках, которые вы используете (например, ARIMA, ANN и т. д.). `9 лет назад`


Привет, Стивен, Хорошая точка. Корневая проблема здесь заключается в том, что пользователь может захотеть получить не только сами прогнозы, но и их обоснование или, по крайней мере, комментарий. В будущем мы, вероятно, попытаемся улучшить клиентские приложения Lokad с автоматизированными рекомендациями, которые будут “комментировать” прогнозы, предоставленные Lokad. Joannes Vermorel (9 лет назад)


Привет, Йоаннес, ты думаешь, что это полезная обратная связь пользователя в терминах описания ожиданий пользователя? Возможно, вы могли бы ограничить пользователя только возможностью выполнять задачу прогнозирования на несколько месяцев, скажем, 3, и если больше, то ему будет дано предупреждение о влиянии на точность прогноза. Я думаю, это также может зависеть от наличия исторических данных, так что, возможно, будет какой-то способ связать их, я не уверен. Кроме того, я думаю, что с точки зрения пользователей, даже если было бы более правильно вернуть им плоский прогноз, потенциально их можно было бы как-то уведомить об этом случае и/или предложить им принять это или принять более наивный результат? Стивен (9 лет назад)