Виды прогнозирования: классификация против регрессии
Слово прогнозирование охватывает очень широкий спектр процессов, технологий и даже рынков. Ранее мы представили миры программного обеспечения для прогнозирования, разделяя их на:
- Программное обеспечение для детерминистического моделирования
- Программное обеспечение для экспертной агрегации
- Статистическое прогнозирование программное обеспечение
Lokad относится к последней категории, так как наша технология является чисто статистической. Однако, Lokad далеко не охватывает весь статистический спектр самостоятельно. Существуют две широкие категории прогнозов в статистическом прогнозировании (*):
- Классификационные прогнозы
- Регрессионные прогнозы
(*) Мы упрощаем здесь ради ясности, так как тонкости статистического обучения выходят далеко за рамки этого скромного блог-поста.
Классификация пытается разделить (или классифицировать) объекты в соответствии с их свойствами. Иллюстрация ниже от Томаша Малисевича иллюстрирует задачу классификации, пытающуюся разделить изображения, изображающие стул, от изображений, изображающих стол.
Иллюстрация из блога tombone
Результат классификации является бинарным (или скорее дискретным): объекты присваиваются классам с большей или меньшей уверенностью, то есть с более высокими или более низкими вероятностями.
С другой стороны, регрессии обычно выводят кривые. Иллюстрация ниже рассматривает временной ряд, представляющий исторические продажи, и отображает соответствующий прогноз.
Прогноз регрессии - это не бинарные (или комбинация бинарных) настройки, а кривые. Входы продолжаются в будущее.
Как это различие влияет на бизнес?
Ну, оказывается, что Lokad - как он существует в начале 2010 года - предоставляет только регрессионные прогнозы. Таким образом, существует много интересных проблем, которые не могут быть решены Lokad, потому что это проблемы классификации:
- Сегментация клиентов: для каждого клиента мы хотели бы оценить вероятность успешного увеличения продаж через прямое маркетинговое действие. По той же идее мы могли бы попытаться предсказать отток.
- Обнаружение мошенничества: для каждой транзакции мы хотели бы оценить - на основе шаблона транзакции - вероятность того, что операция является попыткой мошенничества.
- Приоритизация сделок: на основе свойств потенциального клиента (наличие бюджета, отрасль, ранг контакта в компании, выраженный уровень интереса и т. д.) мы хотели бы оценить вероятность получения прибыльной сделки с каждым потенциальным клиентом, чтобы приоритезировать усилия команды по продажам.
Часто нас спрашивают, может ли Lokad также предоставлять классификационные прогнозы. К сожалению, ответ будет отрицательным на данный момент. Несмотря на то, что они основаны на одной и той же математической теории, классификация и регрессия включают в себя совершенно разные технологии, и Lokad направляет все свои усилия на решение проблем регрессии.
Однако, мы не относимся пренебрежительно к проблемам классификации, они действительно заслуживают внимания и усилий. На 2010 год мы придерживаемся нашего плана, но в дальнейшем классификация может стать естественным расширением наших услуг по прогнозированию.