00:00:04 Проблемы в прогнозировании запуска новых продуктов.
00:00:35 Проблемы традиционных методов прогнозирования.
00:02:00 Критика подхода временных рядов для новых продуктов.
00:03:45 Альтернативные методы прогнозирования новых продуктов.
00:07:22 Глубокое обучение и анализ атрибутов в прогнозировании.
00:09:06 Влияние спроса: атрибуты продукта, такие как цвет, размер.
00:11:23 Прогнозирование разнообразных характеристик продукта с помощью глубокого обучения.
00:11:58 Неопределенности при запуске новых продуктов.
00:13:38 Преимущества вероятностных прогнозов в управлении рисками.
00:14:44 Последствия запуска нового продукта для существующих.
00:16:01 Концепция каннибализации продуктов, тактика модной индустрии.
00:18:02 Чувствительность прогноза цен и сложности оптимальной цены.
00:21:20 Переобучение в статистическом моделировании, влияние на прогнозирование цен.
00:21:58 Достижения в технологиях прогнозирования продуктов.
00:24:33 Каннибализация при запуске продуктов, исследования лояльности клиентов.
Резюме
В интервью основатель Lokad, Жоанес Верморель, обсуждает проблемы прогнозирования спроса на новые продукты. Традиционные методы прогнозирования на основе временных рядов не работают для новых продуктов ввиду отсутствия исторических данных. Верморель критикует традиционное программное обеспечение для планирования спроса за сильную зависимость от прошлых данных. Для новых продуктов он предлагает проводить маркетинговые опросы. Когда новые продукты являются вариациями существующих, Верморель рекомендует использовать атрибуты продуктов для предсказания спроса. Он отмечает неопределенность и каннибализацию как значимые вызовы в прогнозировании новых продуктов, выступая за вероятностный подход. Верморель указывает, что в будущем Lokad планирует использовать «социальную сеть» клиентов и переходить от глубокого обучения к дифференцируемому программированию.
Расширенное резюме
В ходе продолжающегося интервью Кieran Чэндлер и Жоанес Верморель, основатель Lokad, исследуют возможности и препятствия прогнозирования спроса на недавно запущенные продукты. Несмотря на то, что прогнозирование по своей природе сложное и непредсказуемое, Верморель утверждает, что предсказать спрос на новые продукты возможно, хотя это трудно и требует значительных усилий.
Интервью начинается с признания важности прогнозирования запусков продуктов, что позволяет компаниям воспользоваться обычным всплеском спроса после выхода нового продукта. Однако Верморель отмечает, что стандартный метод прогнозирования, основанный на временных рядах, оказывается неэффективным для новых продуктов.
Прогнозирование на основе временных рядов продолжает исторические тренды в будущее, по сути, подобно прогнозированию погоды. Например, базовая модель прогнозирования может усреднять продажи за прошлую неделю для предсказания продаж на следующую неделю. Однако для нового продукта не существует предыдущих данных по продажам, на которых можно было бы основываться, что делает этот подход недостаточным.
Верморель продолжает критиковать традиционное программное обеспечение для планирования спроса, которое в основном зависит от “превозносимых вариантов скользящих средних”, таких как экспоненциальное сглаживание, линейная регрессия и ARIMA, функционирующих как усложнённые скользящие средние. Хотя эти модели могут учитывать сезонные коэффициенты и изменяющиеся окна усреднения, они всё ещё сильно зависят от прошлых данных, что делает их непригодными для новых продуктов.
Рассматривая проблему прогнозирования для полностью новых продуктов, таких как первый iPhone, Верморель предполагает, что для статистических прогнозов требуется соответствующий набор предыдущих наблюдений. Без аналогичных продуктов в прошлом создание статистически обоснованного прогноза практически невозможно.
Одна из стратегий для таких уникальных случаев может заключаться в проведении маркетинговых опросов и изучении мнений потребителей. Несмотря на высокую стоимость и затраты времени, Верморель считает, что для масштабных запусков, таких как iPhone, которые, вероятно, обошлись в сотни миллионов долларов на исследования и разработку, расход на детальное маркетинговое исследование может быть оправдан.
Верморель начинает с описания проблем, возникающих при запуске множества новых продуктов. Он утверждает, что многие новые продукты не являются совершенно новыми, а представляют собой вариации существующих товаров, что упрощает оценку их будущих продаж. В качестве примера он приводит модную индустрию, отмечая, что, хотя они выпускают новые коллекции каждый сезон, обычно это знакомые вещи, такие как рубашки или обувь, с различными характеристиками.
Для прогнозирования продаж новых продуктов Верморель предлагает сравнивать новый продукт с существующими, используя общие атрибуты, метод, который, по его мнению, существенно отличается от обычного программного обеспечения для прогнозирования. Эти атрибуты, такие как размер и цвет, могут предоставить ценную информацию. Например, экстремальные размеры или специфические цвета могут продаваться хуже, чем более распространённые варианты.
Типичный метод прогнозирования продаж новых продуктов требует от менеджера по цепочке поставок установления связи между новым и старым продуктом. Верморель критикует этот процесс как утомительный, особенно при запуске тысяч новых продуктов. Это требует ручного просмотра обширного архива прошлых запусков. Любое неправильное сопоставление, основанное исключительно на интуиции, может полностью исказить прогноз.
Верморель предлагает более интеллектуальный подход, использующий атрибуты продукта для прогнозирования спроса. В зависимости от отрасли, эти атрибуты могут варьироваться от размера, цвета, ценового диапазона и узоров для модных товаров до совместимых картриджей и других характеристик для потребительской электроники. Это разнообразие требует статистического алгоритма, способного управлять широким спектром признаков, где современные технологии машинного обучения, такие как глубокое обучение, могут быть полезными.
Затем разговор переходит к присущей неопределенности, связанной с прогнозами новых продуктов. Верморель признает, что уровень неопределенности при запуске продукта обычно довольно высок, и предлагает в таких случаях использовать вероятностное прогнозирование. Хотя такой прогноз может быть не очень точным, его преимущество в том, что он позволяет учитывать связанные риски, предоставляя диапазон возможных вариантов будущего.
Жоанес обращает внимание на проблему каннибализации, особенно при запуске новых продуктов, поскольку они часто отбирают долю рынка у существующих. Эта проблема особенно распространена в модной индустрии, где новые коллекции
могут забрать продажи у старых коллекций. Чтобы противодействовать этому, индустрия обычно распродаёт старые коллекции, прежде чем представлять новые.
Дискуссия продолжается с рассмотрением гипотетической ситуации. Если бы Apple выпустила iPhone в разных цветах одновременно, предложение множества вариантов могло бы увеличить продажи, но также могло бы привести к внутренней конкуренции между продуктами.
По вопросу чувствительности к цене, Кieran спрашивает Жоанеса, возможно ли прогнозировать спрос на основе изменения цен. Жоанес подтверждает это, но объясняет, что это добавляет сложности в проблему. Эта дискуссия приводит к теме обучения с подкреплением и необходимости тщательного баланса, чтобы избежать переобучения, когда модель хорошо работает на известных данных, но плохо — на новых.
При изменении ценовых точек, например, бренд может входить в неизведанную область, где прошлые данные становятся менее значимыми. Обычно бренды медленно корректируют цены, используя этот процесс как возможность для обучения. Жоанес уточняет, что переобучение может стать проблемой, если бренды начнут использовать свои прогнозные модели для определения цен. Чтобы этого избежать, крайне важно не полагаться слишком сильно на выход прогностической модели при установлении цены.
Меняя тему, Кieran спрашивает о ближайшем будущем прогнозирования продуктов. Жоанес сообщает, что Lokad недавно представил новый прогнозный движок на основе глубокого обучения, который, по их оценкам, является значительным улучшением и сократил ошибки в прогнозировании новых продуктов более чем на 20%.
Жоанес также подчеркивает важность понимания концепции каннибализации продуктов при запуске новых товаров. Хотя ритейлеры могут соблазниться мыслью, что запуск множества новых продуктов значительно увеличит продажи, Жоанес напоминает, что эти новые продукты будут конкурировать за ту же клиентскую базу.
Разговор завершается тем, что Жоанес делится проводимыми исследованиями по использованию «социальной сети» клиентов, что относится к потребительским паттернам их клиентской базы. Эти усилия продиктованы пониманием того, что новые продукты, как правило, сначала получают распространение среди существующих клиентов. Они переходят от глубокого обучения к дифференцируемому программированию, которое считается преемником глубокого обучения, чтобы эффективно справляться с этой сложной задачей.
Полная стенограмма
Kieran Chandler: Сегодня мы обсудим, возможно ли вообще прогнозировать новые продукты и насколько можно доверять этим результатам. Жоанес, к сожалению, у нас в Lokad нет хрустального шара. Так что, можем ли мы действительно прогнозировать новые продукты?
Joannes Vermorel: Краткий ответ — да, но подробный — это сложно, требует усилий и правильной математики. Суть в том, что когда люди задумываются о прогнозировании, они часто представляют себе определённый вид прогноза, что-то вроде прогнозирования на основе временных рядов. Они воспринимают это как прогноз температуры для погоды. По сути, у вас есть кривая, основанная на том, что вы наблюдали в прошлом, и вы хотите продолжить эту кривую в будущее, чтобы получить прогноз. Самый простой прогноз — это просто скользящая средняя. Например, что будет с моими продажами на следующей неделе? Если я усредню продажи за прошлую неделю, получится приблизительная оценка. Этот подход наивен, но в каком-то смысле работает. Однако для новых продуктов он полностью рушится.
Kieran Chandler: Почему же этот подход временных рядов не работает? Почему он рушится?
Joannes Vermorel: Это потому, что вам нечего усреднять. Вы хотите оглянуться в прошлое и на основе среднего значения предсказать будущее. Но если вы пытаетесь прогнозировать продажи продукта, который ещё не продавался, у вас нет данных. Если вы просто спрогнозируете ноль, потому что на прошлой неделе не было продаж, это не имеет смысла. Вы запускаете продукт, и, надеюсь, продадите несколько единиц. Традиционный алгоритм скользящей средней просто не работает. Забавно, что большинство ранних программ для планирования спроса основывались на превозносимых вариантах скользящих средних. Существует множество статистических моделей с эффектными названиями, но они ничем иным, как усовершенствованными скользящими средними. Экспоненциальное сглаживание — это тоже скользящая средняя, линейная регрессия едва ли лучше.
Kieran Chandler: Так как же можно составить прогноз для чего-то совершенно нового? Если взять, например, iPhone до его выпуска, такого ранее не существовало. Можно ли вообще спрогнозировать это?
Joannes Vermorel: Если вы хотите составить прогноз, или по крайней мере статистический прогноз, вам необходимо иметь соответствующий набор прошлых наблюдений. Вы всё ещё пытаетесь предсказать будущее, оглядываясь на прошлое, но у вас должно быть, на что опереться. Если у вас есть продукт, который абсолютно уникален, то с статистической точки зрения, дело потеряно. Вы не сможете работать статистически. Лучшее, что можно сделать — это провести опрос рынка и собрать мнения о том, купили бы люди этот продукт или нет. Очевидно, что это очень дорогой процесс. Apple могли себе это позволить для iPhone, поскольку, вероятно, они инвестировали сотни миллионов долларов в исследования и разработку, чтобы вывести iPhone на рынок. Так что они всё ещё могли себе позволить потратить несколько сотен или тысяч долларов на грамотный опрос.
Kieran Chandler: Таким образом, для примерной оценки объёма продаж, очевидно, что если вы запускаете множество новых продуктов, вы не можете позволить себе такой утомительный процесс. Хорошая новость заключается в том, что если вы запускаете много новых продуктов, какова вероятность того, что всё, что вы выпускаете, является совершенно новым? На практике — почти нулевая, потому что нельзя запускать сотни абсолютно уникальных продуктов. Если за год выпускается сотни продуктов, скорее всего, они все представляют собой вариации одной и той же темы, направления или стиля.
Joannes Vermorel: Именно, вы можете соотнести существующий продукт с какой-либо характеристикой нового продукта. Если вы работаете в моде, то в каждой коллекции у вас будут новые рубашки и новая обувь. Но они всё равно остаются рубашками или обувью, и эти продукты имеют свои характеристики, такие как размеры. Даже если вы не знаете, сколько единиц будет продано, вы понимаете, что экстремальные размеры будут продаваться хуже, чем наиболее популярный размер. Если вы хотите построить статистическую модель, вам просто нужно использовать это наблюдение. Если вы прогнозируете будущий спрос на продукты, которые собираетесь запустить, вам необходимо изучить все предыдущие запуски и соотнести новый продукт со старыми по их атрибутам.
Kieran Chandler: Это интересно, особенно подход с атрибутами, который, похоже, существенно отличается от того, что обычно используется в большинстве программ для прогнозирования. Теперь, с развитием технологий глубокого обучения, является ли это основным методом для детального анализа этих атрибутов?
Иоаннес Верморель: Да, давайте сравним это с классическим взглядом на прогнозирование новых продуктов. Изначально у вас есть только модели скользящего среднего. Чтобы прогнозировать новый продукт, вы попросите менеджера по цепочке поставок установить связь между новым и старым продуктом. Этот традиционный подход требовал участия человека, менеджера по цепочке поставок, который отвечал бы на вопрос: “Какой продукт наиболее похож на тот, который вы собираетесь запустить?”, чтобы мы могли притвориться, что этот продукт уже продается. Затем вы можете вернуться к вашему методу скользящего среднего, так как внезапно у вас появляется временной ряд; у вас есть данные о прошлых продажах продукта.
Однако, если вы запускаете тысячу новых продуктов и вам приходится принимать решение о сопоставлении для каждого нового продукта, а в вашей истории, вероятно, запущено десятки тысяч продуктов, то этот процесс становится невероятно утомительным. Вам пришлось бы вручную изучать целый архив прошлых запусков, чтобы выполнить это сопоставление. Если вы сделаете сопоставление неправильно, полагаясь только на интуицию, то ваш прогноз окажется совершенно бесполезным.
Более разумный подход заключается в использовании атрибутов и анализе того, какие именно атрибуты определяют ожидаемый уровень спроса. Вернувшись к моде, размеры являются очень очевидным индикатором, но цвет также является значительным фактором. Например, если у вас детская одежда, маловероятно, что родители купят слишком белые вещи, потому что дети их испачкают. Поэтому чисто белый для детской одежды, как правило, не очень удачный выбор. Однако для деловых рубашек основными цветами, скорее всего, будут белый, светло-голубой и светло-розовый.
Киран Чэндлер: Если вы хотите, к примеру, ярко-жёлтый для деловых рубашек, этот цвет, скорее всего, будет составлять ничтожный процент ваших продаж. Такие наблюдения можно сделать интуитивно, но взаимосвязи могут быть очень тонкими. Атрибуты могут быть невероятно разнообразными – размер, цвет, ценовые категории, узоры на одежде. Или возьмем потребительскую электронику: если вы хотите прогнозировать спрос на следующий принтер, перед вами стоит широкий набор характеристик – совместимые картриджи, другие функции – это действительно разнообразно.
Иоаннес Верморель: Вот здесь мы сталкиваемся с ситуацией, когда необходим алгоритм, способный справиться с этим ошеломляющим разнообразием. Именно здесь на сцену выходит глубокое обучение – современный подход в машинном обучении. Алгоритмы глубокого обучения особенно эффективны при работе с невероятно разнообразным набором признаков, который может даже включать описания продуктов в виде простого текста.
Киран Чэндлер: Здесь огромное количество вариаций, многое нужно учитывать. Можно ли доверять результатам прогнозов для новых продуктов?
Иоаннес Верморель: Именно в этом и заключается суть вероятностного прогнозирования. Уровень неопределенности при запуске нового продукта обычно очень высок. Если бы прогнозирование нового продукта было простым, он, вероятно, уже не был бы новым, а представлял собой простую замену почти идеального аналога одного из ваших существующих продуктов. В этом случае описанное мной ранее ручное сопоставление вполне подойдет. Но если вы запускаете что-то даже немного новое, что не полностью соответствует тому, что продавалось раньше, возникает неустранимая неопределенность. Но это нормально. Ваши конкуренты сталкиваются с той же проблемой. Чтобы опередить их, вам нужно лишь делать прогнозы лучше. У вас нет хрустального шара, но, скорее всего, и у них его тоже нет.
Киран Чэндлер: С этой неустранимой неопределенностью какие ожидания мы можем иметь?
Иоаннес Верморель: Вот в чем преимущество вероятностного прогнозирования. Да, ваш прогноз будет неточным, но если вы строите вероятностный прогноз, вы полностью осознаете эту неточность. На практике вы увидите распределение, охватывающее множество возможных будущих сценариев, так что ваши решения будут учитывать риск того, что спрос окажется значительно выше или ниже вашего прогноза. Все дело в том, чтобы рассматривать все возможности.
Киран Чэндлер: Если теперь взглянуть на вещи с точки зрения Lokad, мы рассматриваем диапазон вероятностей для всего бизнеса, для всего каталога. Если один отдельный товар может продаваться в огромном количестве или очень мало, разве это не изменит результаты всех наших прогнозов?
Иоаннес Верморель: Абсолютно, и именно это делает задачу еще сложнее.
Киран Чэндлер: Звучит довольно сложно. Насколько я понимаю, если вы хотите создать статистический прогноз для новых продуктов, вам нужно изучить прошлые запуски и сопоставить их атрибуты для поиска релевантных товаров. Этот процесс напоминает концепцию “сопоставления”, но полностью автоматизирован. Однако запуск нового продукта вытесняет спрос на ваши существующие продукты. Я прав?
Иоаннес Верморель: Действительно, каждый запущенный вами продукт, скорее всего, будет каннибализировать ваши существующие продажи. Возьмем, к примеру, модного ритейлера, который представляет новый тип рубашки. Они, вероятно, уже продавали рубашки, так что когда появляется новый, модный дизайн, вы не просто завоевываете долю рынка у своих конкурентов. Вместо этого ваши покупатели могут выбрать этот новый продукт вместо того, который уже продавался. Такая ситуация приводит к каннибализации, что очень сложно контролировать.
Киран Чэндлер: Управлять этим настолько сложно, что это одна из основных причин, по которой модные бренды выпускают коллекции, верно?
Иоаннес Верморель: Именно. Вместо того чтобы пытаться решить эту сложную задачу каннибализации, гораздо проще провести распродажу, распродать все предыдущие коллекции, а затем запустить новую коллекцию. Таким образом, вы избегаете каннибализации продаж между новой и старой коллекциями. Вы ликвидировали запасы, чтобы у вас не было двух коллекций, конкурирующих друг с другом одновременно.
Киран Чэндлер: Таким образом, если вы хотите уточнить прогноз для нового продукта, это нельзя делать изолированно, верно? Если вы запускаете несколько продуктов, они будут каннибализировать то, что у вас уже есть, а также друг друга.
Иоаннес Верморель: Верно. Например, если Apple решит запустить новый iPhone, их продажи будут отличаться, если они выпустят только один цвет — черный, например, — по сравнению с ситуацией, когда покупателям предложат выбрать из пяти разных цветов в день запуска. Хотя больший выбор может немного увеличить продажи, он также приведет к значительной каннибализации.
Киран Чэндлер: Вы упомянули продажи, что похоже на корректировку цены продукта в ответ на рыночные тенденции. Можно ли прогнозировать чувствительность цены? Возможно ли предсказать спрос на продукт, если я понижу его цену?
Иоаннес Верморель: Да, но это делает задачу еще более сложной. Это требует перехода от классического контролируемого обучения к обучению с подкреплением или другим современным подходам. Почему? Потому что вы управляете тем, что будете наблюдать, как только начнете учитывать цену.
Например, модный бренд наблюдал схему продаж только для тех ценовых категорий, которые применял в прошлом. Поэтому, если вы решите перейти к более дорогим ценовым сегментам, вы войдете в неизведанные территории, где ваши прошлые данные окажутся мало актуальными. Многие бренды переходят постепенно, чтобы у них оставалась возможность учиться и наблюдать.
С статистической точки зрения, проблема заключается в том, что если вы создадите модель прогнозирования, которая принимает цену как входной параметр, вы сможете корректировать прогноз с ее учетом. Однако опасность заключается в том, что может возникнуть, если вы начнете использовать выходные данные вашей модели прогнозирования.
Киран Чэндлер: То есть, вы говорите о модели для управления ценообразованием. Как будто можно построить модель прогнозирования, настроить цену и провести сценарии “что если”, моделируя запуск одного и того же продукта по разным ценам. Такой подход нацелен на выбор оптимальной цены, которая принесет нам наибольшую выгоду. Однако, если сделать это наивно, не приведет ли это к проблеме переобучения?
Иоаннес Верморель: Да, действительно. Если вы будете повторять это упражнение множество раз с минимальными вариациями цены, выбранная вами цена может оказаться просто колебанием самой модели прогнозирования. По сути, вы усилите любую проблему переобучения, которая может возникнуть в вашем процессе обучения. Переобучение – это когда статистическая модель хорошо работает на уже имеющихся у вас данных, но не так хорошо – на тех, которых у вас нет. Ирония в том, что при построении статистического прогноза вы хотите, чтобы ваша модель хорошо справлялась с данными, которых у вас нет.
Киран Чэндлер: Это действительно поднимает интересный вопрос о том, как измерять точность такой модели. Но мы можем обсудить это в другой раз. Что касается вопроса ценообразования, кажется, что использование цены в модели подобного рода может стать чрезвычайно сложным. И, конечно, вы не хотите вызвать огромную ошибку переобучения из-за исследования ценовой переменной, верно?
Иоаннес Верморель: Именно, изучение ценовой переменной может привести к резкому переобучению, что является очень сложным аспектом для управления.
Киран Чэндлер: Похоже, что это довольно сложная задача для решения. В качестве заключительного вопроса: как выглядит ближайшее будущее в прогнозировании новых продуктов? Какие технологические достижения нас ожидают?
Иоаннес Верморель: Ну, еще в декабре прошлого года мы запустили наш новый прогнозный движок, основанный на глубоком обучении. Согласно нашим внутренним бенчмаркам, это, наверное, одно из наиболее значимых улучшений с точки зрения incremental gains в точности. Прирост точности при прогнозировании новых продуктов составил более 20% за счет сокращения ошибки, что довольно существенно. Одно из приобретенных уроков от этой модели — способность использовать описания в простом тексте, что может быть очень полезно. Например, если вы ритейлер и хотите спрогнозировать, сколько единиц Лего-коробок вы продадите. Это сложная задача, потому что, например, Лего ежегодно выпускает новый средневековый замок.
Киран Чэндлер: Средневековые замки не следует путать с эльфийскими замками. Один ориентирован для мальчиков, а другой – для девочек. Однако это тонкость, и у вас на самом деле нет всех мелких атрибутов, чтобы это отразить, если вы продаете тысячи игрушек в своем магазине.
Иоаннес Верморель: Действительно, все основывается на атрибутах, но часто у вас нет такого объема данных от поставщика. И не всегда у вас хватает времени, чтобы вручную добавить или скорректировать их. Поэтому иногда вам нужен прогнозный движок, способный обрабатывать описания в простом тексте. Одна из областей, над которой мы сейчас работаем, — это использование этих деталей для достижения более конкретных, более точных прогнозов.
При запуске продуктов крайне важно принять концепцию каннибализации. Если вы запускаете больше продуктов, это не означает, что ваши продажи взлетят до небес. Все новые продукты, которые вы запускаете, конкурируют за тех же клиентов, что у вас уже есть. Поэтому одна из исследовательских областей, на которой мы сосредоточены, — использование нашей базы данных лояльности.
Обычно, если вы ритейлер, вы знаете, какой клиент что покупает. Это совершенно отличается от временного ряда, когда вы просто анализируете, сколько единиц продано за день или неделю для данного продукта. Здесь вы хотите учитывать социальную сеть клиентов, которые уже покупали продукты в прошлом. Идея в том, что при запуске нового продукта он первоначально наберет обороты среди вашей существующей клиентской базы.
Если вы хотите иметь математические модели, способные обрабатывать социальную сеть ваших клиентов, вам, как правило, придется переходить от глубокого обучения к дифференцируемому программированию, которое является его наследником. Вот где мы сейчас и находимся.
Киран Чэндлер: Это увлекательно. Приходится на этом остановиться, но прогнозирование в социальных медиа и прогнозирование лояльности – действительно интересные концепции. Спасибо, что нашли время сегодня.
Иоаннес Верморель: Спасибо.
Киран Чэндлер: На этом все на эту неделю. Если у вас возникают проблемы с прогнозированием новых продуктов, нам будет интересно услышать о вашем опыте. Напишите нам по электронной почте или оставьте комментарий ниже. Нам интересно узнать о трудностях, с которыми вы сталкиваетесь. Это все на эту неделю, до встречи в следующий раз. Пока.