Любимые модели прогнозирования

июля 7, 2009

technology

Joannes Vermorel

Какие модели прогнозирования вы используете внутри компании? Этот вопрос часто задают как клиенты, так и партнеры Lokad.

Ответить на этот вопрос непросто для нас по двум причинам:

Наша технология является ключевым активом. Поэтому мы не планируем раскрывать все подробности (хотя мы и не настроены быть полностью секретными).
Наша технология сложна. Мы используем множество моделей, и ключевым компонентом является именно выбор модели.

Таким образом, вместо того чтобы предоставлять точный перечень моделей, используемых в Lokad, я приведу мой личный список любимых моделей. Я не утверждаю, что эти модели представляют полный список моделей, используемых в Lokad, или что все они действительно используются в производстве; однако это должно дать вам представление о том, чем занимается Lokad.

Сначала идут старые добрые классики: авторегрессия, скользящая средняя, (двойное, тройное) экспоненциальное сглаживание, модели Бокса-Дженкинса, Хольта-Винтерса, ARMA, ARIMA … Эти модели обычно не справляются с задачами многорядности или обработки меток и событий; однако часто простота имеет решающее значение. Не отбрасывайте скользящую среднюю только потому, что она выглядит слишком простой, чтобы быть эффективной.

Затем, при переходе к более сложным моделям, я предпочту говорить об подходах, а не о моделях. Действительно, чем сложнее модель, тем больше возможностей у математика для тонкой настройки поведения прогностической модели.

Подход байесовский: построение графов взаимосвязей особенно полезно в контексте Lokad, где мы используем корреляции между временными рядами. Это также полезно для работы с метками и событиями.

Подход широкого зазора: в последние дни машины опорных векторов (SVM) стали невероятно популярными. Хотя, если говорить о временных рядах, для нас полезнее метод опорной векторной регрессии (SVR). Как незначительный недостаток, SVM и SVR обычно требуют значительных вычислительных ресурсов.

Подход смешения / бустинга: смешивание множества простых предикторов для улучшения общего прогноза работает хорошо. Комбинация большого числа простых предикторов может использоваться для отражения действительно сложных закономерностей.

Подход метаэвристический: генетические алгоритмы, нейронные сети, генетическое программирование и другие эволюционные / адаптивные подходы. Эти методы мощные, но также печально известны своей чувствительностью ко многим параметрам настройки.

В заключение, наша технология продолжает стремительно развиваться. Новые модели внедряются в производство примерно каждый месяц. Этот список не является окончательным, и облачные вычисления фактически открывают для нас множество возможностей для внедрения моделей, которые раньше были слишком затратными.

Вернуться в блог ›

Любимые модели прогнозирования

Больше записей