Любимые модели прогнозирования
Какие модели прогнозирования вы используете внутри компании? Этот вопрос часто задают как клиенты, так и партнеры Lokad.
Ответить на этот вопрос непросто по двум причинам:
- Наша технология - это ключевой актив. Поэтому мы не планируем раскрывать все детали (хотя мы и не являемся абсолютно секретными).
- Наша технология сложна. Мы используем множество моделей, и одной из ключевых компонентов является выбор модели.
Таким образом, вместо того, чтобы предоставить точный список моделей, используемых Lokad, я собираюсь перечислить собственный список любимых моделей. Я не утверждаю, что эти модели представляют полный список моделей, используемых в Lokad, или что все эти модели фактически используются в производстве в Lokad; но это должно дать вам представление о том, что мы делаем в Lokad.
Сначала есть обычные классические модели: авторегрессия, скользящая средняя, (двойное, тройное) экспоненциальное сглаживание, Бокс-Дженкинс, Хольт-Винтерс, ARMA, ARIMA … Эти модели обычно не обрабатывают несколько рядов, теги или события; однако простота - это главное во многих ситуациях. Не отбрасывайте скользящую среднюю только потому, что она выглядит слишком простой, чтобы быть хорошей.
Затем, для более сложных моделей, я предпочел бы говорить об подходах, а не о моделях. Действительно, чем сложнее модель, тем больше свободы остается у математика для тонкой настройки поведения модели прогнозирования.
Байесовский подход: установление графиков взаимосвязей особенно полезно в контексте Lokad, где мы используем корреляции между временными рядами. Он также полезен для работы с тегами и событиями.
Подход с широким отступом: Метод опорных векторов (SVM) стал невероятно популярным в последнее время. Хотя, что касается временных рядов, для нас наиболее полезным является метод опорных векторов для регрессии (SVR). Как небольшой недостаток, SVM и SVR обычно требуют значительных вычислительных мощностей.
Подход смешивания / усиления: смешивание большого количества простых предикторов для улучшения общего прогноза работает хорошо. Комбинация большого количества простых предикторов может использоваться для отражения действительно сложных поведений.
Метаэвристический подход: генетический алгоритм, нейронные сети, генетическое программирование и другие эволюционные / адаптивные подходы. Эти подходы мощны, но также известны своей внутренней чувствительностью к многим настраиваемым параметрам.
В заключение, наша технология все еще быстро развивается. Новые модели ставятся в производство каждый месяц примерно. Этот список не является окончательным, и облачные вычисления на самом деле создают много возможностей для нас, чтобы внедрить модели, которые раньше были слишком дорогими.