00:00:43 Представление Пьера Пенсона
00:01:25 Биография Пьера Пенсона и его работа в области инженерии данных-центрированного дизайна и прогнозирования.
00:02:20 Как Пьер попал в вероятностное прогнозирование и его применение в энергетике, логистике и бизнес-аналитике.
00:04:17 Оценка качества прогноза, его важность в принятии решений и связь с прогнозной стоимостью.
00:07:41 Первые реакции на вероятностное прогнозирование.
00:08:27 Проблема чрезмерной уверенности.
00:10:00 Критика Клода Бернара в отношении статистики и вероятностей.
00:13:00 Детерминизм против стохастического поведения в мире.
00:14:37 Связь между метеорологией и бизнесом с помощью вероятностного прогнозирования.
00:15:11 Важность прогнозирования погоды и культурные последствия.
00:16:46 Объяснение вероятностей и понимание прогнозов.
00:18:58 Проблемы информационного перенасыщения и принятия решений.
00:20:31 Преобразование вероятностей в оценки риска.
00:22:14 Балансировка автоматизированного принятия решений и доверия пользователей.
00:23:36 Важность метеорологических прогнозов в бизнесе и логистике.
00:25:01 Прогнозы по ветру и их значение в энергетическом секторе.
00:26:00 Использование погодных данных в прогнозировании потребности в энергии и ситуациях снабжения цепочкой поставок.
00:30:25 Различия в применении вероятностного прогнозирования в метеорологии и логистике.
00:32:46 Обсуждение проблем перевода сложных вероятностных прогнозов для клиентов.
00:33:32 Проблемы затрат на облачные вычисления и хранение больших объемов данных.
00:35:02 Использование двумерных гистограмм и их влияние на память и затраты.
00:37:19 Преподавание вероятностного прогнозирования и проблемы, с которыми сталкиваются студенты.
00:40:00 Упрощение вероятностного прогнозирования и понимание проверки модели.
00:42:40 Неэффективность процессов и методов транспортировки.
00:43:57 Проблема устранения неопределенностей из цепочки поставок.
00:45:20 Стоимость устранения неопределенностей и ее влияние на различные отрасли.
00:47:00 Эволюция прогнозирования и его сдвиг от прикладной математики к экономике.
00:50:53 Слияние различных областей в прогнозировании и принятии решений в условиях неопределенности.
00:52:30 Адаптация объяснения вероятностного прогнозирования для разных фонов.
00:53:21 Применение вероятностного прогнозирования в различных бизнесах и его преимущества.
00:55:53 Привлекательность визуально интересных вероятностных прогнозов и истории нарушения авторских прав.
00:58:03 Ограничения круговых диаграмм в передаче информации и их использование на этапе предпродажи.
01:00:01 Принятие неопределенности в профессиональной карьере и понимание вероятностной перспективы.
01:02:23 Междисциплинарный подход и неопределенность в различных отраслях.
01:04:27 Важность образования и влияние новых поколений на отрасль.
01:07:00 Кривая принятия вероятностного прогнозирования в различных областях.
01:08:33 Взгляд Жоаннеса на столетний горизонт времени для принятия неопределенности.
01:10:37 Проблемы в принятии новых идей и медленный темп изменений в некоторых областях.
01:12:14 Важность математики в технологии прогнозирования.
01:13:26 Будущие достижения в науке и технологии прогнозирования.

Резюме

В интервью с Конором Доэрти Жоаннес Верморель, основатель Lokad, и Пьер Пинсон, председатель кафедры проектирования инженерных решений на основе данных в Имперском колледже Лондона, обсуждают вероятностное прогнозирование и его применение в различных областях. Они подчеркивают важность понимания неопределенности в прогнозировании и необходимость постоянного образования в этой области. Все трое соглашаются в том, что инновации происходят быстрее, чем люди могут их осознать, и они призывают быть в курсе новых разработок в этой области и быть готовыми к предстоящим достижениям.

Расширенное резюме

В этом интервью ведущий Конор Доэрти обсуждает вероятностное прогнозирование с гостями Жоаннесом Верморелем, основателем Lokad, и Пьером Пинсоном, председателем кафедры проектирования инженерных решений на основе данных в Имперском колледже Лондона. Пинсон имеет обширный опыт в области проектирования инженерных решений на основе данных и сосредоточился на различных областях применения, включая энергетику и логистику. Верморель, с другой стороны, подошел к вероятностному прогнозированию с точки зрения управления цепями поставок.

Пинсон изначально интересовался погодой и возобновляемой энергией и ему предложили докторскую степень по прогнозированию для ветряных ферм. Он подчеркивает важность понимания неопределенности прогноза и потенциального диапазона результатов. Путь Вермореля к вероятностному прогнозированию начался с понимания того, что многие прогнозы цепей поставок в основном состоят из нулей. Он обнаружил, что хотя все возможно, не все одинаково вероятно, и понимание структуры неточностей прогноза может быть ценным.

Метеорология использует различные метрики для оценки качества прогноза, такие как расстояние между предсказаниями и фактическими результатами, и среднее абсолютных различий между ними. Однако эти метрики не всегда позволяют определить, хорош ли или плох прогноз для конкретного применения. Верморель добавляет, что вероятностное прогнозирование может помочь дать обоснованное мнение о сфере возможностей.

Одной из проблем, с которыми сталкиваются те, кто работает с вероятностным прогнозированием, является убеждение других в принятии идеи количественной оценки неопределенности. Люди обычно предпочитают детерминированные прогнозы из-за когнитивных предубеждений, которые благоприятствуют самоуверенности. Вероятностные прогнозы, однако, предоставляют более прозрачное и справедливое представление потенциальных результатов. Использование вероятностных прогнозов в принятии решений может привести к лучшим результатам, но люди должны быть открытыми для идеи неопределенности.

Клод Бернар, французский физиолог XIX века, выступал против использования статистики и вероятностей в научных экспериментах, считая, что изменчивость является результатом неполного понимания или ленивой науки. Однако Пинсон считает, что хотя детерминистические подходы могут хорошо работать для определенных проблем, мир в своей основе не является детерминистическим. Вероятностное прогнозирование ценно для ситуаций с врожденным стохастическим поведением и неопределенностью.

Одной из основных проблем с вероятностным прогнозированием является перегрузка информацией. У людей уже много информации для обработки, и добавление вероятностных данных может сделать ее понимание еще более сложным. Это особенно верно при работе с большими наборами данных, такими как прогнозирование для миллионов продуктов в цепи поставок.

Для решения этой проблемы некоторые компании обратились к автоматизированному принятию решений или оценке рисков, чтобы помочь пользователям осмыслить вероятностные прогнозы. Преобразуя вероятностные данные в количественные риски, пользователи могут лучше понять потенциальные последствия своих решений, не перегружаясь сложностью данных.

В метеорологии вероятностное прогнозирование оказалось полезным для прогнозирования таких переменных, как температура, осадки, скорость ветра и солнечная радиация. Эти переменные могут оказывать значительное влияние на различные аспекты повседневной жизни и бизнеса, такие как производство и потребление энергии. В некоторых случаях использование погодных данных в прогнозировании цепи поставок может привести к более точным прогнозам, особенно при работе с резкими изменениями погодных условий.

Однако респонденты также признают, что интеграция погодных данных в прогнозирование цепи поставок была сложной, с немногими успешными примерами. Один из случаев включал использование погодных данных для улучшения прогнозов спроса на электроэнергию для электроснабжающей компании в Европе. Включение погодных данных в прогнозы позволило компании снизить неточности, вызванные быстрыми изменениями погоды.

Верморель делится своими опытами с Lokad, которая достигла впечатляющей точности в своих прогнозных моделях, несмотря на их простоту. Он приводит пример проекта с продавцом мороженого, который хотел прогнозировать всплески спроса на основе погодных условий. Хотя анализ после события был успешным в определении причин увеличения продаж, прогнозирование спроса оказалось более сложным из-за длительных сроков поставки в цепи поставок. Верморель подчеркивает, что несмотря на столкновение с проблемами, вероятностное прогнозирование все еще имеет потенциал для успеха в различных отраслях.

Пинсон обсуждает различия между применением вероятностного прогнозирования в метеорологических контекстах и логистических и бизнес-контекстах. Он объясняет, что основная проблема заключается в определении правильного прогностического продукта, который будет использоваться в процессах принятия решений. Он упоминает, что сценарии, интервалы и квантили являются некоторыми из вариантов, которые могут быть рассмотрены, но это в конечном итоге зависит от конкретных потребностей клиента или заказчика.

Верморель также подчеркивает важность учета вычислительных затрат при реализации техник вероятностного прогнозирования. По его опыту, гистограммы и плотности вероятности предоставляют наиболее подробную информацию, но могут быть вычислительно затратными, особенно при работе с высокоразмерными данными. В результате Lokad часто использует комбинацию техник, чтобы управлять затратами и обеспечить эффективность вычислений.

При обучении студентов вероятностному прогнозированию Пинсон находит, что самая большая проблема заключается не в убеждении их в преимуществах концепции, а в помощи им понять практические аспекты применения этих техник в реальных ситуациях. Верморель добавляет, что для практиков важно сбалансировать теоретические аспекты вероятностного прогнозирования с практическими соображениями о стоимости и вычислительной эффективности.

Верморель рассказывает о своих трудностях при обучении людей, которые уже получили образование от консультантов, пропагандирующих принципы ликвидации неопределенности из цепей поставок. Он считает, что некоторые неопределенности могут быть устранены, но другие являются приемлемыми и должны управляться соответствующими инструментами.

Пинсон подчеркивает, что устранение неопределенности может быть затратным, и лучше принять и управлять ею разумно. Он приводит пример возобновляемой энергии, где разработка систем хранения для обработки бесконечного количества энергии была бы чрезвычайно дорогостоящей и нереальной. Вместо этого принятие неопределенности и прогнозирование могут быть более экономически эффективными и практичными.

Обсуждение переходит к историческим и культурным аспектам прогнозирования, где люди всегда пытались жить в детерминированном мире и устранять неопределенность. Они также обсуждают слияние различных областей, таких как естественные науки, социальные науки и экономика, в прогнозировании и принятии решений в условиях неопределенности.

Пинсон говорит о трудностях преподавания вероятностного прогнозирования людям с различными предпосылками и о необходимости краткой версии для тех, у кого нет крепкого математического фундамента. Он предлагает начать с простых примеров и постепенно увеличивать сложность, при этом подчеркивая важность понимания основных принципов и концепций.

Верморель рассказывает о своем опыте нарушения авторских прав, так как некоторые графики его компании были использованы на LinkedIn без разрешения. Однако эти привлекательные графики могут привлечь внимание потенциальных клиентов и сделать компанию более технологически продвинутой.

Пинсон говорит о том, что неопределенность присутствует во всех аспектах нашей жизни и понимание и управление ею является важным для специалистов в различных областях. Образование играет ключевую роль в поощрении этого понимания, поскольку студенты, изучающие вероятностное прогнозирование, могут применять эти навыки на рабочем месте и вносить изменения в свои компании.

Пинсон считает, что применение вероятностного прогнозирования будет продолжать расти в различных отраслях, поскольку все больше людей получают образование в этой области и компании обращаются друг к другу в поисках вдохновения и идей. Он приводит пример судоходной отрасли, которая медленно внедряла вероятностное прогнозирование, но теперь обращается к другим отраслям за руководством по его внедрению в свою деятельность.

Верморель подчеркивает важность понимания неопределенности в прогнозировании, приводя пример Битвы 19-го века, где понадобилось почти целое столетие, чтобы люди признали, что химия имеет отношение к медицине. Он предполагает, что инновации происходят быстрее, чем люди могут их принять, и образование играет в этом процессе важную роль. Верморель также упоминает цитату Нильса Бора: “Наука продвигается похороной за похороной”, подчеркивая идею о том, что значительный прогресс может происходить быстро, но понимание его последствий занимает кажущуюся вечность.

Пинсон обсуждает применение вероятностного прогнозирования в метеорологии, отмечая, что хотя математика, лежащая в основе технологии прогнозирования, может не быть самой актуальной частью обсуждения, важно признать текущие разработки в прикладной математике. Он объясняет, что разработка механизмов для прогнозирования миллионов временных рядов параллельно представляет сложности, но исследователи постоянно разрабатывают новые модели и технологии для будущего.

И Верморель, и Пинсон соглашаются в том, что в прогнозировании и вероятностном прогнозировании еще много работы, а также необходимо постоянное образование и понимание неопределенности. Они призывают быть в курсе новых разработок в этой области и быть готовыми к предстоящим достижениям.

Полный текст

Конор Доэрти: Добро пожаловать на LokadTV! Я ваш ведущий, Конор, и как всегда, меня сопровождает основатель Lokad Джоаннес Верморель. Сегодня к нам присоединяется Пьер Пинсон, главный редактор Международного журнала прогнозирования и главный ученый в Half Space. Сегодня он расскажет нам о нескольких интересных применениях вероятностного прогнозирования. Добро пожаловать в Lokad, приятно познакомиться.

Пьер Пинсон: Спасибо, что пригласили меня сегодня.

Конор Доэрти: И большое спасибо вам за присоединение. Мы оба очень рады видеть вас. Теперь, Пьер, я дал очень краткое введение; у вас на самом деле очень обширное резюме. Так что, прежде всего, не могли бы вы дать всем представление о вашем опыте и о том, чем вы занимаетесь, потому что я знаю, что вы участвуете в нескольких проектах в разных областях?

Пьер Пинсон: Да, большое спасибо. Прежде всего, сейчас я являюсь профессором в Имперском колледже в Лондоне. Я руковожу кафедрой, которая занимается проектированием на основе данных. Поскольку сегодня у нас все больше данных, мы должны извлекать из них ценность, и это является целью моих исследований и преподавания. Очевидно, одним из самых интересных и первых применений, о которых мы думаем при работе с данными, является прогнозирование, поэтому я занимаюсь этим уже последние 20 лет, работая в различных областях применения, в основном в энергетике, потому что сегодня требуется много прогнозирования в этой области, а также в логистике, бизнес-аналитике и т.д.

Конор Доэрти: Много интересных областей и много пересечений с тем, чем мы хотим заниматься. Итак, сначала, как вы попали в вероятностное прогнозирование?

Пьер Пинсон: Ну, на самом деле, изначально я не хотел заниматься вероятностным прогнозированием, я должен признаться. Меня очень интересовала погода и возобновляемая энергия, и мне предложили сделать докторскую диссертацию по прогнозированию для возобновляемой энергии, для ветряных ферм, чтобы знать, сколько энергии ветряные фермы произведут завтра. Проблема в том, что прогноз всегда ошибается, и мой научный руководитель сказал: “Ну, мы хотели бы знать, насколько они ошибаются, но это не должна быть просто одна метрика, верно? Например, прогноз хороший или плохой в среднем. Мы хотели бы знать, смотря на завтра, насколько хорош будет мой прогноз или нет?” И вот так я перешел к вероятностному прогнозированию, потому что тогда у вас есть идея, условно говоря, на основе того, что я знаю сегодня, проецируя себя на завтра, и как я могу как-то описать неопределенность того, что может произойти, и, возможно, сказать, какой исход наиболее вероятен, какой ожидаемый исход и какой может быть интервал для того, что может произойти.

Конор Доэрти: Интересно, и я скоро обращусь к вам, Йоаннес, по этому поводу, но когда вы говорите о том, что делает прогноз хорошим в метеорологии, какие метрики вы используете для оценки его эффективности? Нельзя просто сказать: “ну, сегодня не было дождя, значит, прогноз был 100% точным”. Какие метрики для этого используются?

Пьер Пинсон: Да, поэтому это на самом деле наука сама по себе, знать, как оценить прогноз и решить, был ли он хорошим или нет. В принципе, когда у вас есть прогноз для непрерывной переменной, например, скорости ветра или температуры, мы считаем качество прогноза связанным с расстоянием между тем, что вы предсказали, и тем, что на самом деле произошло. Затем существуют разные способы обработки этого расстояния. Вы можете взять сумму квадратов расстояний или квадратичных ошибок, вы можете посмотреть на среднее абсолютное отличие между ними и т.д. Таким образом, есть много метрик, которые показывают, насколько хорош прогноз или насколько плох. Проблема в том, что это просто число. Поэтому, если я скажу вам, что в среднем мой прогноз ошибается на два, вы можете сказать: “Хорошо, отлично”, но это делает ли прогноз хорошим или плохим для моего приложения? И это очень часто была проблема в последние десятилетия развития прогнозирования, что нам нужно связать качество прогноза, насколько хорош вы в терминах этого расстояния, с ценностью прогноза, насколько хорошо он будет работать, если я использую его для принятия решений.

Конор Доэрти: Есть ли сходства с тем, как мы к этому подходим?

Жоанн Верморель: Это очень интересно, потому что в Lokad мы пришли к вероятностному прогнозированию через совершенно другой путь, и то, что вы описываете, гораздо ближе к образованному мнению, которое я приобрел после нескольких лет, в отличие от начальной точки зрения. Мое первоначальное мнение было гораздо более прозаичным. Фактически, мы прогнозировали многое в цепях поставок и просто прогнозировали нули. Я рассказывал эту историю несколько раз, потому что, когда мы впервые пытались прогнозировать продажи для мини-маркетов, где большинство товаров продаются в среднем ноль раз в день, это ближайшее, что можно получить, округленное до ближайшего целого числа. В вашем типичном мини-маркете около 95% товаров продаются нулевыми единицами в любой заданный день. И проблема заключалась в том, что у нас возникла эта проблема, и поэтому мы начали иметь предвзятость в прогнозировании, которая привела нас к квантилям. И когда мы играли с квантилями, мы поняли, что, вероятно, нам нужно иметь все квантили сразу, и мы перешли к вероятностным прогнозам. Но сегодня, когда мне приходится объяснять, почему важны вероятностные прогнозы, я думаю, что наш подход заключается в том, что да, ваш прогноз безнадежно неточен, мы это знаем. Мой прогноз, в случае, если я являюсь поставщиком, безнадежно неточен, но это не значит, что я совершенно не имею представления о том, какими будут эти неточности. Фактически, у меня есть довольно образованное мнение о сфере возможностей. Все возможно, но все не одинаково вероятно. В вашем образованном мнении о сфере возможностей все возможно, но не одинаково вероятно, и есть структура для анализа ошибок. Можете ли вы разъяснить это?

Пьер Пенсон: Самое странное и интригующее для людей - это идея того, что в этом анализе ошибок есть структура. Люди интуитивно думают, что неопределенность происходит от незнания, а затем вы говорите им, что в том, что они не знают, есть структура. Это звучит запутанно. Когда я начал отстаивать вероятностные прогнозы, первая реакция, которую я получил, была такая, что несмотря на все, что происходит, я никогда не буду ошибаться, потому что мой прогноз всегда будет учитывать вероятность того, что что-то произойдет. Люди видели это как конечный механизм защиты для поставщика.

Жоанн Верморель: Интересно услышать ваши анекдоты, но можно также посмотреть на это с другой стороны. Есть “парадокс большой мыши” из психологии и маркетинга, когда самоуверенным людям в комнате оказывается больше доверия, даже если они могут быть неправы. Большинство людей предпочитает детерминированный прогноз, потому что это дает им ощущение уверенности, хотя они знают, что он будет неправильным. Предоставление вероятностного прогноза на самом деле является более прозрачным и справедливым, но люди должны принять это и противостоять своему когнитивному предубеждению в пользу детерминизма.

Когда мы признаем, что мы не можем быть точными, но можем дать довольно хорошую идею о диапазоне возможностей, мы становимся более прозрачными и, возможно, лучше в терминах качества прогноза. Самая большая проблема для нас, работающих с вероятностным прогнозированием, - это заставить людей принять идею принятия неопределенности и использования ее в принятии решений. Это на самом деле приведет к лучшим результатам. Этот вид детерминизма в вашей жизни - большая проблема, с которой мы сталкиваемся, работая с вероятностным прогнозированием. Мы должны как-то заставить людей принять, что им нужно расслабиться с этой идеей, что они хотят, чтобы этот единственный пункт был информативным и правдивым. Они должны принять тот факт, что пока вы можете количественно оценить неопределенность и использовать ее при принятии решений, это будет лучше. Вы можете только улучшиться.

Конор Доэрти: Каковы ваши мысли по этому поводу, Жоанн?

Жоанн Верморель: Это очень интересно, это идея признания своей собственной слабости. Если вернуться во времена Клода Бернара, который изобрел контрольный эксперимент, он выступал против использования статистики и вероятностей. Его аргумент очень хорошо обоснован. Он утверждал, что если у вас есть что-то, что меняется, это означает, что у вас плохой эксперимент, и вы недостаточно контролируете вещи. Он работал в области медицины и говорил, что если есть изменчивость, то есть третья переменная, которая это объясняет. Таким образом, он был против идеи использования статистики и вероятностей, потому что, с его точки зрения, это признание неполного понимания и ленивого ученого. В результате вы получаете эти модные статистические методы, которые являются всего лишь оправданием для ваших собственных несовершенств. Какова ваша точка зрения по этому возражению, Пьер?

Пьер Пенсон: Я согласен, что это верно для определенного набора проблем, где все основано только на законах физики, в очень контролируемой среде, и вы думаете, что детерминистский подход должен быть достаточно хорошим. Вам не следует слишком беспокоиться о всех этих неопределенностях и использовать вероятностную модель. Но если вы посмотрите на более общий случай, это почти философское утверждение о мире. Мы считаем, что мир в основном детерминирован для всего, что происходит? Или на самом деле вокруг нас есть некоторое стохастическое поведение? Вы знаете, некоторые стохастические правила, и это делает очень базовую идею детерминизма не всегда применимой. Мы видим это для погоды, и мы пытались думать, знаете ли, если у нас будет все больше и больше измерений, если мы будем лучше разбираться в законах физики, мы должны сможем рассматривать это как детерминированный процесс и предсказывать его. И это хорошая надежда, но были, я думаю, повторяющиеся эксперименты за последние 100 лет, где мы, наконец, поняли, что, возможно, не все может быть детерминированным, и даже эти аргументы, которые вы упомянули, это неполное знание, я думаю, есть так много вещей, которые нам нужно моделировать и предсказывать, где у нас никогда не будет достаточно знаний, чтобы мы могли оказаться в детерминированной системе. Это просто невозможно.

Конор Доэрти: Хорошо, если я могу вмешаться в этот момент, потому что вопрос, который я хотел задать немного раньше, был связан с объединением бизнеса и метеорологии, потому что здесь есть интересный мост между этими двумя точками, особенно учитывая ваш опыт в бизнесе и метеорологии. Предположим, вы оказались в комнате, где вы применили вероятностное прогнозирование к бизнес-проблеме, возможно, столкнулись с некоторым сопротивлением, типа “о, я не хочу использовать вероятностное прогнозирование, это темные искусства”, но этот же человек через 10 секунд достает свой iPhone и говорит: “о, 60% шанс, что позже пойдет дождь, лучше возьму зонтик”. Как вы в этот момент преодолеваете такое когнитивное расстройство?

Пьер Пенсон: Это очень хороший вопрос, и здесь есть культурная проблема. Мы видели, что вы упомянули прогнозирование погоды как важную область, потому что оно повсюду, каждый использует прогноз погоды и чувствителен к нему. Это информация, которую мы находим полезной, но это процесс, и я думаю, что мы должны пройти через него в разных областях. Это может быть бизнес, это может быть инженерные проблемы, это может быть страхование, может быть так много вещей, где на самом деле мы, как ученые или поставщики прогнозов, промышленная экосистема, должны способствовать изменению культуры, чтобы люди, клиенты или пользователи в целом, действительно понимали, что мы можем думать по-другому и что это приносит пользу.

Конор Доэрти: Хорошо, чтобы продолжить, потому что вы сказали, что вы обнаружили, если я правильно понял, что существуют определенные механизмы передачи информации, метеорологической информации или метеорологических прогнозов, которые резонируют с людьми, и есть механизмы, которые этого не делают. Можете ли вы раскрыть это немного подробнее или, возможно, привести пример, чтобы люди могли понять?

Пьер Пенсон: Были проведены различные исследования психологами, работающими с метеорологами. Например, если вы сделаете заявление о вероятности дождя, скажем, что есть 60% шанс дождя в Лондоне в ближайшие два часа, люди интерпретируют это по-разному. Некоторые люди думают, что это означает, что дождь будет идти 60% времени в Лондоне, в то время как другие считают, что это означает, что есть 60% шанс дождя в определенном месте в Лондоне. Людям трудно понять, что такое вероятность в фундаментальном смысле.

Жоанн Верморель: Да, мы также сталкивались с этой проблемой при работе с пользователями или клиентами. В разработке методологии вероятностного прогнозирования и изучении того, как она может быть использована на практике, требуется значительное количество работы. Но также требуется много работы, чтобы помочь людям понять, что информация действительно означает и как она может повлиять на их принятие решений. Проблема заключается в том, чтобы заставить людей понять, как перейти от вероятностного прогноза к решению, которое лучше, чем если бы они использовали детерминированные прогнозы. Если они этого не понимают, они не примут это.

Конор Доэрти: Как вы делаете это понятным? Используете ли вы подход с белым ящиком?

Жоанн Верморель: Мы делаем что-то, что одновременно похоже и непохоже. Моя проблема, исходя из опыта в сфере цепей поставок, заключается в том, чтобы справиться с перегрузкой информацией. У людей уже слишком много информации. Даже детерминированные прогнозы могут быть ошеломляющими, так как они часто являются суперагрегированными и представляют различные проблемы. Когда вы переходите к вероятностному прогнозированию, ситуация ухудшается в два раза, с гистограммами для каждой точки данных и еще большей сложностью, если учесть многомерные вероятности.

Изначально мы пытались улучшить визуализацию и другие аспекты, но в конце концов мы пришли к решению, где мы удаляем вероятности с точки зрения пользователя. Мы принимаем решения на основе вероятностей, но преобразуем их в оценки риска, выраженные в денежном эквиваленте. Например, мы можем сказать клиенту, что риск избыточного запаса составляет X, а риск дефицита товара составляет Y. Мы количественно оцениваем классы риска и точки зрения, а вероятностный прогноз является “прокладкой” для этих оценок.

Конечно, это не идеальное решение, но оно работает для наших клиентов. Иногда команды специалистов по данным любят работать с вероятностями, но эксперты по цепям поставок, которые менее знакомы с вероятностями, находят этот подход более доступным. Я бы сказал, что эксперт по цепям поставок, который невероятно компетентен в области цепей поставок, но не так хорошо знаком с вероятностями, находит это очень сложным, просто из-за перегрузки информацией, которая требуется. Очень быстро эти менеджеры должны оценить, стоит ли им смотреть на эти гистограммы. Это очень сложный момент, когда вы начинаете разговаривать с людьми, которые очень ценят свое время.

Пьер Пинсон: Согласен, я полностью согласен. Есть очень разные траектории. Как вы упомянули, есть разные способы рассмотреть эту проблему перегрузки информацией. Я полностью согласен с вашей стратегией здесь. Я думаю, что попытка автоматизировать принятие решений или предлагать оптимальные решения, поняв соотношение стоимости и потерь пользователя и т.д., - это хорошо. Но снова, им нужно понять, как вы это сделали и почему они должны доверять этому в первую очередь, что забавно, потому что когда это было детерминированным, они доверяли этому. И сейчас, когда появилось слово “вероятность”, они больше не доверяют. Но это уже другая история. Преимущество наличия вероятностной информации заключается в том, что вы можете дать этот дополнительный уровень очень простых оценок, оценок риска, которые именно они хотят, когда говорят, что они принимают вероятностные данные. Пожалуйста, скажите мне, с каким риском я сталкиваюсь. Это самый простой тип информации, который вы можете предоставить, который дает преимущества вероятностного прогнозирования без этой перегрузки информацией, о которой вы упомянули. Так что я действительно думаю, что это очень хорошая стратегия.

Конор Доэрти: Что ж, мы начали объединять темы вместе, такие как метеорология и бизнес. Итак, Пьер, у вас есть большой опыт в обоих областях, какие примеры ключевых метеорологических прогнозов или метеорологических данных, которые вы использовали и применили в контексте бизнеса или логистики?

Пьер Пинсон: Информация о прогнозах погоды, которую вы можете использовать в качестве входных данных для принятия решений, имеет очень немного переменных, которые являются крайне важными, а затем важность переменной быстро снижается. Самые важные переменные - это температура, которая определяет так много других процессов в нашей жизни, а затем идет осадки. Более недавно появился ветер, потому что, в старые времена, около 30 лет назад, когда синоптики говорили о ветре, они делали прогнозы ветра почти для развлечения, потому что никому особо не было дела. Просто, будет ли ветрено или нет? И, возможно, если вы занимаетесь парусным спортом, вас это немного больше интересует. Но сегодня, из-за энергетических приложений, прогнозы скорости ветра крайне важны, потому что даже небольшая ошибка в прогнозе скорости ветра приводит к огромным ошибкам в прогнозах энергии, которая будет доступна завтра. Подумайте о стране, например, Дании, где в среднем половина энергии поступает от ветра. Важно иметь хорошие прогнозы скорости ветра. Это самые актуальные переменные, и сейчас также идет развитие в области солнечной радиации из-за солнечной энергии. Но я бы сказал, что это самые важные переменные, и после этого, в терминах влияния, эти метеорологические переменные используются повсюду сегодня. Я имею в виду, когда вы смотрите на важность прогнозов погоды и качество прогнозов погоды в нашей повседневной жизни, как в бизнес-контексте, так и в повседневной жизни, это крайне важно.

Конор Доэрти: Конечно, с точки зрения сроков поставки товаров из-за рубежа, я имею в виду, понимание того, что только что описал Пьер, это должно учитываться при вероятностном прогнозировании для цепей поставок, например.

Жоанн Верморель: За всю историю Lokad, я думаю, у нас было всего два случая, когда мы действительно смогли использовать погодные данные в ситуациях с цепями поставок. Опять же, это может быть из-за недостатка таланта, недостатка преданности или множества других причин. Но суть в том, что для прогнозирования мы имели крупного европейского поставщика электроэнергии десять лет назад, и у нас был контракт на улучшение прогноза спроса на электроэнергию с учетом погоды. И это, на мой взгляд, единственный случай, когда использование погодных данных дало очень явную пользу. Это работает, и суть в том, что мы смотрели на прогнозы, которые уже были достаточно агрегированы, в основном по регионам. Таким образом, прогноз даже без учета погоды уже был очень точным, я имею в виду, точность в 2%, потому что они были очень агрегированы. Но, кстати, это был только спрос на электроэнергию, не только, и только на следующий день. То есть, вы смотрели только на 24 часа вперед, и агрегированные регионы были, скажем, страной, например, Бельгией, или, может быть, Францией, разделенной на пять областей, довольно высокого уровня.

Без учета погоды у вас был прогноз, прогноз временных рядов, который был точен на 2%, и большая часть неточностей была вызвана быстрыми изменениями погоды. Когда холодно, оно обычно остается холодным, но когда внезапно меняется погода, происходит скачок, и вы этого не видите. Так что это было больше похоже на то, что у вас был прогноз, который в среднем был точен на 0,5%, но затем на день, когда менялась погода, накапливалась погрешность в 5 или 6%. И добавив погоду, они уже достигли точности примерно 0,5%, и с Lokad мы достигли практически такой же точности, но только с моделями, которые на самом деле были гораздо проще и управляемы в терминах компьютерного программного обеспечения. Так что это был определенный тип работы.

Это было первое, где я сказал, что это действительно работает, знаете ли. Второе было с брендами FMCG, которые хотели прогнозировать всплески спроса с использованием прогнозов погоды. К сожалению, результаты были в основном отрицательными. Очень хорошо работало то, и я не буду называть имя бренда, но скажем, это был продавец мороженого, и им просто было интересно знать, что работало очень хорошо после лета. Вопрос был в том, продавали ли мы больше мороженого из-за жары или потому что маркетинговая акция была очень хорошей. Как метод постмортема для объяснения ситуации, это работало хорошо. Однако проблема при прогнозировании заключается в том, что сроки, связанные с большинством ситуаций в цепях поставок, значительны. Например, если вы производите мороженое, вам нужно заказывать сырье и готовить график производства примерно за шесть недель вперед. На этом этапе точность прогнозов погоды обычно возвращается к сезонным средним, которые недостаточно лучше сезонного среднего, чтобы изменить ваше решение. По нашему опыту, это оказалось невероятно сложным, и у нас было несколько успехов, но это было очень познавательно во многих отношениях.

Конор Доэрти: Пьер, когда речь идет о применении вероятностного прогнозирования в метеорологическом контексте, как это переносится на применение в логистике или бизнесе? Есть ли сходства в терминах ограничений или процесса?

Пьер Пенсон: Одна из основных проблем, которая является ключевой, когда мы думаем о различных применениях, будь то метеорология или секторы, зависящие от погоды, - это тип прогнозируемого продукта, который полезен как входные данные для принятия решений. Обычно прогнозы погоды используют ансамблевые прогнозы, которые состоят из нескольких траекторий или потенциальных будущих сценариев. Например, в Европейском центре есть 51 альтернативный сценарий. Однако существует множество типов процессов принятия решений, где требуются разные прогнозные продукты.

В торговле, например, люди предпочитают использовать плотности, которые являются полным описанием функции плотности вероятности. Некоторые люди предпочитают интервалы и заранее определенные уровни доверия в качестве входных данных для принятия решений. Другие запрашивают конкретные квантили на основе своих соображений о стоимости потерь. Таким образом, основное отличие, которое я заметил между метеорологией и другими областями, заключается в том, что нам приходится потратить много времени на то, чтобы подумать о правильном прогнозируемом продукте, который следует использовать в качестве входных данных. Мы должны представить себя в мире наших клиентов и найти наилучший способ отображения сложной информации из вероятностных прогнозов в то, что для них наиболее полезно. Таким образом, прогноз должен быть полезен для клиентов, и ваш подход также сосредоточен на этом. Можете ли вы подробнее рассказать о проблемах с расходами на облачные вычисления и как это влияет на вашу работу?

Жоанн Верморель: Да, как поставщик корпоративного программного обеспечения, одна из основных проблем - это стоимость облачных вычислений, очень мирная проблема. Просто чтобы дать вам представление о масштабе, клиентская база Lokad управляет примерно петабайтом данных, и это то, за что мы сейчас платим Microsoft, нашему облачному хостинг-провайдеру. Это хороший бизнес для Microsoft и для Lokad, но это связано с определенными затратами. Большая часть того, на что мы смотрим, определяется эффективностью затрат, которую мы можем иметь в терминах вычислительного оборудования.

Гистограммы и плотности вероятности обычно являются лучшими. Они очень информативны, просты в использовании. Но проблема в том, что в одном измерении это нормально. У вас есть фиксированная стоимость, поэтому вы увеличиваете объем данных, скажем, в 100 раз, и у вас есть хорошая гистограмма. Но затем, если вы переходите к двумерному случаю, потому что вы хотите иметь матрицу вероятностей, это становится более сложным. Например, вы можете хотеть посмотреть на вероятности того, что у одного продукта будет определенный спрос, и вероятности того, что у другого продукта будет такой же спрос, но совместно. Причина в том, что эти продукты являются конкурентами, и когда спрос растет на один продукт, это обычно происходит за счет каннибализации другого. Поэтому вам нужны вероятности, которые учитывают тот факт, что, скорее всего, если спрос на продукт будет расти, это означает, что спрос на другой продукт будет уменьшаться, и наоборот. Теперь, если вы делаете это с помощью матрицы, у вас есть двумерная гистограмма, и требуется значительное количество памяти. С увеличением размерности все становится еще хуже, что делает вещи очень дорогими.

Аналогично, когда вы хотите перейти к симуляциям в стиле Монте-Карло, которые очень хорошо справляются с высокоразмерными задачами, проблема заключается в том, что с ростом количества сценариев у вас возникают убывающие доходы. Вам может понадобиться много сценариев, чтобы даже иметь возможность наблюдать риск, который является немного редким, например, 10 000 случаев. Большая часть наших соображений связана с тем, что нам нужно сохранять управляемость затрат на вычисления. Это не только стоимость, которую мы платим Microsoft, но и тот факт, что при использовании более сложных вещей вычисления занимают больше времени, и людям приходится ждать завершения прогноза, прежде чем они смогут продолжить свои задачи.

Для детерминированных методов анализа временных рядов, особенно для предмашинного обучения, которые использовались до 90-х годов, вы можете получить результаты практически в режиме реального времени, даже если у вас есть цикличность и прочее. Они очень быстрые, и вы можете быстро получить результаты с помощью методов, таких как ARIMA или экспоненциальное сглаживание, все эти вещи можно делать практически в режиме реального времени, даже если у вас есть цикличность и прочее. Но если вы выбираете что-то очень сложное, например, очень глубокую сеть глубокого обучения, такая вещь может занять несколько часов для обучения, и для нас это означает большие затраты. Кроме того, с нашей точки зрения, то, что преобладает, - это практичность, и это большая проблема.

Конор Доэрти: Пьер, одно из тех вещей, которые вы делаете, - преподаете в Имперском колледже Лондона, и вы сталкиваетесь с студентами, которые приходят на ваш курс, чтобы впервые узнать о вероятностном прогнозировании. С людьми, которые уже имеют математическую подготовку и уже в какой-то степени убеждены в необходимости принятия неопределенности, по вашему опыту, какова, по сути, самая большая проблема, с которой они сталкиваются при изучении этих навыков, следуя вашему примеру?

Пьер Пенсон: Что касается преподавания прогнозирования, я делал это больше, когда работал в Дании, с основным акцентом на энергетике. Я думаю, что проблемы всегда одни и те же. Одна из первых проблем - это то, о чем мы уже слышали раньше; это принятие этого. Зачем мне вообще переходить к вероятностному прогнозированию? Я должен сказать, что обычно я трачу довольно много времени на описание проблем, проблем принятия решений и показываю студентам, что вы можете принимать только лучшие решения, если переходите к вероятностному прогнозированию. Очень важно для разработчика или пользователя прогноза, клиента с обеих сторон, понять, что вы можете делать лучше, только если переходите к вероятностному прогнозированию. Это будет стоить вам что-то, но если вы принимаете это, то будет лучше. Это требует много работы, чтобы убедить себя и понять, почему. Если вы не понимаете, почему это будет лучше, возможно, у вас возникнут трудности с его принятием. Поэтому мы тратим на это довольно много времени.

Затем я хочу, чтобы они поняли, что создание таких прогнозов несложно. Вы упомянули некоторые классические модели, но вы можете думать об этом даже в терминах базовых случайных величин. Если вы хотите сделать вероятностный прогноз для чего-то, что является гауссовским, когда мы делаем классический точечный прогноз, мы просто предсказываем среднее. И теперь, когда мы говорим, что хотим перейти к вероятностному прогнозированию, нам нужно только предсказать дисперсию сверху, и тогда у нас будет полноценный вероятностный прогноз. Даже если вы не хотите использовать параметрический подход, если вы хотите предсказывать квантили, вы можете использовать те же модели, что и для детерминированного случая, просто измените функцию потерь в вашем обучении, и вуаля, у вас есть квантильный прогноз. Одним из важных аспектов является то, что я учу студентов, что это нечто, что не требует изучения и обработки на порядки сложнее.

Последняя часть - это верификация, потому что мы также обсуждали ранее, что у некоторых людей есть идея, что теперь можно расслабиться, верно? Потому что если вы переходите к вероятностному прогнозированию, вы можете сказать что угодно, и каким-то образом вы потом скажете мне, что вы никогда не ошибаетесь. Но есть некоторые очень строгие методы проверки вероятностных прогнозов, которые фактически показывают, что они имеют смысл, ваши вероятности правильные, и вы пытаетесь концентрировать информацию и т.д. Это основные блоки, которые я прохожу со своими студентами, и мой опыт говорит мне, что это основы, которые вам понадобятся, если вам предстоит работать с вероятностными прогнозами в вашей работе.

Joannes Vermorel: Моя борьба забавна, потому что, вероятно, вы привилегированы в том смысле, что у вас есть ваши студенты. Мои перспективы, как правило, уже получили образование в виде того, что им говорят консультанты. Давайте сегодня создадим врагов. Проблема в том, что есть анти-пропаганда, как, например, движение к эффективности. Движение к эффективности и идея, например, что мы должны меньше тратить. Я имею в виду, в общем принципе, да, лучше избегать потерь. По определению, потери - это нечто нежелательное, поэтому это тавтологично по своей природе в терминах утверждения. Никто не говорит, что давайте производить отходы ради этого, но это часть движения к эффективному производству и эффективной цепи поставок. Проблема этой линии мышления заключается в том, что вы оказываетесь с такими вещами, как, например, если у вас есть расточительные процессы, такие как длительные сроки выполнения, вы хотите их устранить. Но в какой-то момент у вас может быть процесс, который не является очень расточительным, но очень неэффективным, потому что вы пытались сжать свои сроки выполнения настолько, насколько это возможно. Например, если вы хотите перемещать вещи как можно быстрее, самолет - это лучший вариант, но эффективность самолета в топливном отношении ужасна по сравнению с поездами или грузовыми судами. Таким образом, сам по себе стремление к полному устранению неопределенности в терминах таких вещей, как нулевой запас, нулевая задержка, нулевые потери, которое является общей перспективой, пропагандируемой определенными движениями, является попыткой полностью устранить неопределенность. Если у вас нет времени выполнения, то внезапно зачем вам прогнозирование? Вам нужно иметь дело только с тем, что находится прямо перед вами. Если у вас нет запасов, зачем вам управлять потенциальным риском избыточных запасов или чего-либо еще? Так что мой интересный подход заключается в том, что часть проблемы заключается в том, что люди, которые не получили выгоду в первые годы курса, демонстрирующего превосходство вероятностного мышления, прошли один или два, а иногда и три или четыре десятилетия убежденной пропаганды со стороны консультантов, чтобы устранить все виды неопределенностей из своей цепи поставок. Некоторые из неопределенностей, я бы сказал, являются случайными, когда у вас просто возникают неопределенности из-за плохого процесса - их, да, следует устранить. Если у людей, например, нет должных навыков, и некоторые люди просто делают мусор, это не тот вид неопределенности, который вам нужен. Но у вас есть другие неопределенности, такие как, например, то, что, возможно, грузовые суда немного медленнее из-за погоды, поэтому они не будут двигаться с одинаковой скоростью каждый раз. Но это вполне приемлемо, если у вас есть инструменты для работы с этим таким образом, который имеет смысл.

Pierre Pinson: Вы правы. Обычно мы формулируем эту проблему как вопрос стоимости, потому что, в какой-то мере, устранение неопределенностей стоит денег. Если у вас бесконечное количество денег, которое вы готовы вложить в устранение всех неопределенностей, вы могли бы это сделать. Но любая неопределенность, кроме тех, которые возникают из-за того, что вы делаете что-то неправильно или из-за некоторых неэффективностей, любая более фундаментальная неопределенность в вашем процессе, которую вы хотите устранить, вам это обойдется дорого, скорее всего. Так что это типичная проблема, когда вы говорите: “Хорошо, замечательно, вы хотите устранить все неопределенности, как будто это бесплатно. Если бы это было бесплатно, мы бы тоже сделали это”. Так что эту стоимость мы должны решить, можем ли мы ее позволить. У нас есть параллель, которая очень интересна в энергетике. Например, я много работаю с возобновляемой энергией. Если бы мы разрабатывали хранение, чтобы иметь бесконечное количество энергии, которое мы можем хранить в любое время и насколько долго мы хотим, каким-то образом проблема была бы решена. Некоторые люди говорят, что нам не нужно прогнозировать, нам не нужно беспокоиться. Но разработка и внедрение батарей такого масштаба