Любимые модели прогнозирования
Какие модели прогнозирования вы используете внутри компании? Этот вопрос часто задают как клиенты, так и партнеры Lokad.
Ответить на этот вопрос непросто для нас по двум причинам:
- Наша технология является ключевым активом. Поэтому мы не планируем раскрывать все подробности (хотя мы и не настроены быть полностью секретными).
- Наша технология сложна. Мы используем множество моделей, и ключевым компонентом является именно выбор модели.
Таким образом, вместо того чтобы предоставлять точный перечень моделей, используемых в Lokad, я приведу мой личный список любимых моделей. Я не утверждаю, что эти модели представляют полный список моделей, используемых в Lokad, или что все они действительно используются в производстве; однако это должно дать вам представление о том, чем занимается Lokad.
Сначала идут старые добрые классики: авторегрессия, скользящая средняя, (двойное, тройное) экспоненциальное сглаживание, модели Бокса-Дженкинса, Хольта-Винтерса, ARMA, ARIMA … Эти модели обычно не справляются с задачами многорядности или обработки меток и событий; однако часто простота имеет решающее значение. Не отбрасывайте скользящую среднюю только потому, что она выглядит слишком простой, чтобы быть эффективной.
Затем, при переходе к более сложным моделям, я предпочту говорить об подходах, а не о моделях. Действительно, чем сложнее модель, тем больше возможностей у математика для тонкой настройки поведения прогностической модели.
Подход байесовский: построение графов взаимосвязей особенно полезно в контексте Lokad, где мы используем корреляции между временными рядами. Это также полезно для работы с метками и событиями.
Подход широкого зазора: в последние дни машины опорных векторов (SVM) стали невероятно популярными. Хотя, если говорить о временных рядах, для нас полезнее метод опорной векторной регрессии (SVR). Как незначительный недостаток, SVM и SVR обычно требуют значительных вычислительных ресурсов.
Подход смешения / бустинга: смешивание множества простых предикторов для улучшения общего прогноза работает хорошо. Комбинация большого числа простых предикторов может использоваться для отражения действительно сложных закономерностей.
Подход метаэвристический: генетические алгоритмы, нейронные сети, генетическое программирование и другие эволюционные / адаптивные подходы. Эти методы мощные, но также печально известны своей чувствительностью ко многим параметрам настройки.
В заключение, наша технология продолжает стремительно развиваться. Новые модели внедряются в производство примерно каждый месяц. Этот список не является окончательным, и облачные вычисления фактически открывают для нас множество возможностей для внедрения моделей, которые раньше были слишком затратными.