Слово прогнозирование охватывает очень широкий спектр процессов, технологий и даже рынков. Ранее мы представили миры программного обеспечения для прогнозирования, разделяя их на:

  • Программное обеспечение для детерминистического моделирования
  • Программное обеспечение для экспертной агрегации
  • Статистическое прогнозирование программное обеспечение

Lokad относится к последней категории, так как наша технология является чисто статистической. Однако, Lokad далеко не охватывает весь статистический спектр самостоятельно. Существуют две широкие категории прогнозов в статистическом прогнозировании (*):

  • Классификационные прогнозы
  • Регрессионные прогнозы

(*) Мы упрощаем здесь ради ясности, так как тонкости статистического обучения выходят далеко за рамки этого скромного блог-поста.

Классификация пытается разделить (или классифицировать) объекты в соответствии с их свойствами. Иллюстрация ниже от Томаша Малисевича иллюстрирует задачу классификации, пытающуюся разделить изображения, изображающие стул, от изображений, изображающих стол.

Иллюстрация из блога tombone

Результат классификации является бинарным (или скорее дискретным): объекты присваиваются классам с большей или меньшей уверенностью, то есть с более высокими или более низкими вероятностями.

С другой стороны, регрессии обычно выводят кривые. Иллюстрация ниже рассматривает временной ряд, представляющий исторические продажи, и отображает соответствующий прогноз.

Прогноз регрессии - это не бинарные (или комбинация бинарных) настройки, а кривые. Входы продолжаются в будущее.

Как это различие влияет на бизнес?

Ну, оказывается, что Lokad - как он существует в начале 2010 года - предоставляет только регрессионные прогнозы. Таким образом, существует много интересных проблем, которые не могут быть решены Lokad, потому что это проблемы классификации:

  • Сегментация клиентов: для каждого клиента мы хотели бы оценить вероятность успешного увеличения продаж через прямое маркетинговое действие. По той же идее мы могли бы попытаться предсказать отток.
  • Обнаружение мошенничества: для каждой транзакции мы хотели бы оценить - на основе шаблона транзакции - вероятность того, что операция является попыткой мошенничества.
  • Приоритизация сделок: на основе свойств потенциального клиента (наличие бюджета, отрасль, ранг контакта в компании, выраженный уровень интереса и т. д.) мы хотели бы оценить вероятность получения прибыльной сделки с каждым потенциальным клиентом, чтобы приоритезировать усилия команды по продажам.

Часто нас спрашивают, может ли Lokad также предоставлять классификационные прогнозы. К сожалению, ответ будет отрицательным на данный момент. Несмотря на то, что они основаны на одной и той же математической теории, классификация и регрессия включают в себя совершенно разные технологии, и Lokad направляет все свои усилия на решение проблем регрессии.

Однако, мы не относимся пренебрежительно к проблемам классификации, они действительно заслуживают внимания и усилий. На 2010 год мы придерживаемся нашего плана, но в дальнейшем классификация может стать естественным расширением наших услуг по прогнозированию.