Прогнозирование изменения климата как планировщик цепочки поставок
Транскрипт доклада, представленного Joannes Vermorel в Ecole polytechnique в Palaiseau (Франция) в пятницу, 3 июня на симпозиуме Искусственный интеллект, Цифровизация и изменение климата. Симпозиум был организован Сильвеном Ле Корффом, профессором Telecom Sud Paris, и Эриком Мулином, профессором Ecole polytechnique и избранным членом Академии наук.

Мою компетенцию составляет наука о цепочках поставок и предиктивная аналитика в этой области. Цепочка поставок, грубо говоря, — это клеящая связь между производством и потреблением: материалы необходимо приобретать, транспортировать, преобразовывать и распределять. Именно об этом суть цепочки поставок. Сразу признаюсь, что наука о цепочках поставок вряд ли станет будущим климатологии.
Однако современные цепочки поставок уже используют масштабные автоматизированные методы прогнозирования. Именно это моя компания Lokad делает уже более десяти лет.
За это десятилетие я извлёк ряд критически важных уроков, касающихся применения прогностических методов, обычно алгоритмов машинного обучения, в реальных условиях. Самый важный урок заключается в том, что лучше быть примерно правым, чем абсолютно неправильным. И все же, оглядываясь вокруг, я вижу множество глубоко ошибочных попыток науки о данных .
Самый коварный аспект обработки данных заключается в том, что алгоритмы – или технологии – могут создавать иллюзию рациональности, иллюзию науки. Однако слишком часто такие ошибочные подходы к обработке данных приводят к выводам, не лучше астрологии. Ни один алгоритм не спасёт вас, если вы неправильно подойдёте к проблеме.
Чтобы понять, как прогнозное моделирование в цепочках поставок может дать нам ценные уроки для прогнозирования изменения климата, позвольте отметить, что климат и глобальные рынки имеют много общего. В обоих случаях на кону стоит наш образ жизни. Мы имеем дело с комплексными системами, которые не до конца понятны; каждый участник вносит небольшой вклад, а совокупность таких воздействий может дать большой эффект. Однако участники действуют из собственных интересов, и потому ничего не бывает простым.
Таким образом, я собираюсь оценить эволюцию климата в стиле цепочки поставок с точки зрения материковой Франции, как компания использует свои рыночные доли для оценки рынка.
Цепочки поставок научили меня, что затраты всегда кроются в крайностях. Небольшие избытки производства и незначительные дефициты обычно легко корректируются; именно крупные отклонения предрекают крах компаний. Таким образом, при прогнозировании изменения климата, как планировщика цепочки поставок, меня не интересуют мелкие вариации. Франция обладает умеренным климатом; и помните, что здесь я рассматриваю ситуацию с акцентом на Францию.
Франции было бы немного или вовсе не составило труда приспособиться к температурам, которые в среднем на два градуса выше или ниже. Аналогично, можно было бы иметь на 10% больше или меньше ветра, или на 10% больше или меньше дождя — это почти не изменило бы ситуацию. Разрешите сразу уточнить, что я не утверждаю, что воздействия отсутствуют. Я лишь указываю на то, что другие страны — например, Дания или Италия — не сталкиваются с долгосрочными проблемами из-за более холодного или теплого климата, при этом их образ жизни практически идентичен тому, который мы ведем во Франции. По мере изменения климата будут происходить корректировки во многих областях — от выбора сельскохозяйственных культур до толщины теплоизоляционных слоев в зданиях. Однако эти изменения скромны по сравнению с другими источниками перемен, влияющими на Францию.
Таким образом, как планировщик цепочки поставок меня интересуют именно климатические крайности. Чтобы оценить, чего ожидать, нам нужно изучить исторические экстремумы. Действительно, будущие экстремумы всегда следует оценивать как более выраженные, чем прошлые. Это верно для рынков и, скорее всего, для климата. Итак, давайте посмотрим, что говорит нам история Франции.
Лето 16361 — год, когда Корнель написал Le Cid, но также год ужасающе жаркого лета. В Париже температура поднималась до 39°C в течение нескольких недель. За одно лето было зафиксировано 500 000 смертей, преимущественно среди младенцев и малышей. Основной причиной смертей была загрязненная вода и заболевания, такие как дизентерия. Количество смертей по отношению к населению Франции того времени сопоставимо с потерями Первой мировой войны, которая длилась чуть более 4 лет.
Таким образом, устойчивые 39°C в течение всего лета для всей Франции должны служить ориентиром того, к чему мы должны быть готовы. Здесь почти не требуется климатическое моделирование: это прямое отображение недавней климатической истории Франции. Если это случилось 4 века назад, моё предположение заключается в том, что это может повториться следующим летом.
Конечно, за последние 2 века медицина и санитария практически искоренили дизентерию во Франции. Однако означает ли это, что мы сможем пережить жаркие лета без проблем? Если судить по событиям лета 2003 года во Франции, жаркие лета все еще представляют серьезную опасность. Жаркая волна 2003 года длилась всего 2 недели, достигала 39°C в Париже и привела к 15 000 смертям во Франции2, в основном среди пожилых людей. Однако в последующие годы уровень оснащения домов кондиционерами во Франции вырос с 4% в 20053 до 25% в 20204.
Здесь мы затрагиваем критический аспект прогнозирования человеческих дел: люди наблюдают, и люди адаптируются. Это не всегда негативно сказывается на точности прогнозирования — хотя часто и бывает —, но человеческая изобретательность почти всегда делает долгосрочные прогнозы нерелевантными. Ведь прогноз, любой прогноз, прежде всего является выбором модели. Модель определяет поле битвы: то, что будет прогнозироваться. Прогноз может быть очень точным, но при этом совершенно не иметь значения. Это опасность, с которой сталкивается каждая компания, работающая с цепочками поставок: рынки меняются по своей природе, а не просто растут или сокращаются.
Вернувшись к климатическим экстремумам, давайте взглянем на великую зиму 1709 года. В январе 17095 температура в Париже опускалась до -20°C; это как холодная зима в Квебек-Сити. Река Сена была полностью замерзшей, как и другие великие реки Франции. За 11 дней Франция потеряла 100 000 человек из-за холодной волны. Всего зима унесла 600 000 жизней, преимущественно среди бедных семей. Опять же, эти потери сопоставимы с полными последствиями Первой мировой войны во Франции, за исключением того, что, снова, катастрофа происходит за считанные недели, а не годы. Эта зима была частью периода, известного как Малый ледниковый период в Европе, который длился с середины XIII до середины XIX века.
Хотя замерзшая река Сена в Париже может удивить эту аудиторию, стоит отметить, что северная широта Парижа составляет 49°, в то время как широта Квебек-Сити — всего 47°. Таким образом, географически Париж находится севернее Квебек-Сити.
В любом случае, за прошедшие века река Сена неоднократно полностью замерзала. Это вопрос истории — без климатического моделирования. Если такая зима произошла 3 века назад, мое предположение остается в силе: она может повториться и следующей зимой.
Таким образом, давайте рассмотрим те проблемы, которые могут возникнуть во Франции, если нам придётся пережить канадскую зиму, подобную тем, что были в прошлом.
Первая проблема, которая приходит на ум — это вода. Во Франции водопроводные трубы обычно закапывают на глубину 80 см, а в Квебек-Сити — на 130 см, и не зря. На глубине 80 см трубы в Квебеке замерзают и лопаются. Таким образом, сильная холодная волна во Франции, скорее всего, уничтожила бы значительную часть инфраструктуры водоснабжения.
Кроме того, транспорт серьезно пострадал бы. Канадские грузовики используют подогреватели блоков, поскольку дизель замерзает при -10°C. У меня нет статистики по распространенности подогревателей на грузовиках во Франции, но уровень их оснащения, по-видимому, очень низкий. Учитывая, что более 98% профессиональных транспортных средств работают на дизеле, можно предположить, что почти все они выйдут из строя во время сильной холодной волны.
Наконец, энергосистема, вероятно, также столкнется с серьезными отключениями электроэнергии. В 20126, когда зима была холодной, Франция импортировала до 9% своей электроэнергии из Германии. Доля электроэнергии, которую можно отключить по желанию (в основном на крупных промышленных предприятиях), приводит к снижению примерно на 1%. Контролируемое понижение напряжения дает дополнительно около 3% снижения энергопотребления. За этой границей единственный вариант для энергосистемы — отключать части сети.
Эти проблемы не являются теоретическими. Как выяснилось, когда я обсуждал случаи великих зим с моим отцом, именно такие проблемы произошли в Сан-Этьене в 1956 году.
1956 год был самой холодной зимой XX века во Франции. В Сан-Этьене энергосистема действительно рухнула. Водопроводные трубы лопнули. Транспортные средства перестали работать. На юге даже морской порт Марсель полностью замерз.
Семьям приходилось обходиться без воды, пищи и отопления в течение нескольких дней. Простой анализ статистики смертности по данным INSEE за февраль 19567 показывает около 15000 избыточных смертей по сравнению с предыдущими годами.
Эта суровая зима 1956 года произошла в послевоенном обществе, которое всё еще слабо полагалось на электрические приборы. Кроме того, это общество массово использовало отопление дровами, которое не зависит от энергосистемы. У меня нет сомнений, что аналогичная зима в современной Европе имела бы гораздо более серьезные последствия.
Возвращаясь к обсуждению климатического прогнозирования, становится ясно, что важны не будущие температуры, а последствия этих температур. То же самое можно сказать и обо всех других климатических переменных: ветре, дожде и т.д.
Если первая ошибка в прогнозировании «науки о данных» заключается в акценте на средних значениях, а не на экстремумах, то вторая ошибка состоит в том, чтобы путать числовые артефакты с реальными последствиями. В цепочках поставок этот принцип звучит так: проценты ошибки прогнозирования не имеют значения, важны только долларовские потери.
Действительно, прогнозы — это числовые артефакты, созданные для поддержки принятия решений. Их качество во многом зависит от того, насколько они способствуют принятию лучших решений.
Оценка качества прогнозов, основанная только на произвольных статистических показателях, таких как средняя абсолютная ошибка (MAE), среднеквадратичная ошибка (MSE) или средняя абсолютная процентная ошибка (MAPE), которые полностью не связаны с реальными последствиями, вероятно, является одной из самых распространенных ошибок, которые я наблюдаю среди моих коллег в науке о данных.
Лично я называю такие прогнозы голыми прогнозами. Голые прогнозы — это своего рода противоположность мифическим пророчествам. Эти прогнозы получают гораздо больше внимания, чем заслуживают, и когда люди обращают на них внимание, они только ухудшают ситуацию.
Чтобы понять, почему голые прогнозы ошибочны, нужно осознать, что в цепочках поставок — и, как я подозреваю, в климате — довольно просто создавать прогнозы, которые одновременно являются чрезвычайно точными и невероятно глупыми.
Действительно, давайте рассмотрим минимаркет с ежедневным пополнением запасов. Для почти всех товаров минимаркета самый точный ежедневный прогноз продаж — ноль единиц. Ведь большинство товаров в минимаркете даже не продаются раз в день в среднем.
Затем, если в качестве входного показателя используется прогноз нулевых продаж, магазин не пополнит запасы. Ведь нулевой прогноз продаж означает, что пополнению подлежат ноль единиц товара. Скоро все полки минимаркета опустеют, и таким образом, фактические продажи окажутся равны нулю, что делает эту модель прогнозирования нулевых продаж на 100% точной. Между тем, минимаркет обанкротится.
Такая ситуация происходит в реальной жизни (с решениями корпоративного программного обеспечения, конкурирующими с Lokad). Это называется проблемой замерзания запасов. Чтобы ее решить, модель должна прогнозировать спрос, а не прогнозировать продажи; однако это сложно, поскольку продажи наблюдаются, а спрос — нет.
В более широком смысле, статистические показатели прогнозирования создают иллюзию науки: я разработал модель прогнозирования, которая на 1% точнее, следовательно, моя модель заведомо лучше. Однако обычно это не так, и я даже не говорю о переобучении. Проблема, на которую я указываю, заключается в том, что погоня за статистическим показателем неизбежно ухудшает модель. Раньше модель была примерно правильной, а затем стала абсолютно неправильной.
Я не являюсь экспертом по климату, но с моей точки зрения в цепочках поставок я вижу в СМИ — и в прессе, и в социальных сетях — множество голых климатических прогнозов: прогнозов, не привязанных к какому-либо практическому процессу принятия решений. Я не ставлю под сомнение точность этих прогнозов; это уже предмет обсуждения среди климатологов. Однако мой опыт в цепочках поставок подсказывает, что попытки сделать выводы о реальных решениях на основе этих голых прогнозов приводят к непредвиденным последствиям, обычно сопровождаются растратой огромного количества ресурсов и часто дают результат, прямо противоположный изначальному замыслу.
Хороший прогноз начинается с определения проблемы, которую необходимо решить. Как только проблема адекватно охарактеризована, мы движемся назад, определяя данные и числовые методы, подходящие для поддержки того решения, которое необходимо принять.
Напротив, плохой прогноз начинается с набора данных, который случайно оказался доступным, и с дата-сайентиста, который стремится проверить последнюю статью по машинному обучению, основанную на этом самом наборе данных, возможно, написанную самим этим специалистом.
Таким образом, мой вывод, который применим как к цепочке поставок, так и к климату, состоит в том, что если вы хотите отделить хорошие прогнозы от плохих, начните с немедленного отказа от «голых» прогнозов. Из таких прогнозов никогда ничего хорошего не выходит. Затем убедитесь, что прогнозы примерно верны, а не абсолютно ошибочны. И наконец, ищите, насколько эти прогнозы близки к реальным решениям. Если люди, составляющие прогнозы, не вынуждены нести последствия этих прогнозов, то ваша базовая позиция должна быть глубоко скептичной.
-
Страница 351, Человеческая и сравнительная история климата. Т.1: Жары и ледники. XIII–XVIII века, Эмманюэль Лерой-Ладюри, Fayard 2004 ↩︎
-
ОТЧЁТ, ПРЕДСТАВЛЕННЫЙ ОТ ИМЕНИ КОМИССИИ ПО РАССЛЕДОВАНИЮ ЗДРАВООХРАНИТЕЛЬНЫХ И СОЦИАЛЬНЫХ ПОСЛЕДСТВИЙ ЖАРЫ, Докладчик м. Франсуа д’ОБЕР, № 1455 — том 1, February 24th, 2005. ↩︎
-
Рынок кондиционирования простудился, Valérie Leboucq, Les Echos, October 7th, 2005. ↩︎
-
КОНДИЦИОНИРОВАНИЕ: К РАЗУМНОМУ ИСПОЛЬЗОВАНИЮ С ЦЕЛЬЮ ОГРАНИЧЕНИЯ ВЛИЯНИЯ НА ОКРУЖАЮЩУЮ СРЕДУ, ADEME presse, June 30th, 2021 ↩︎
-
Страница 517, Человеческая и сравнительная история климата. Т.1: Жары и ледники. XIII–XVIII века, Эмманюэль Лерой-Ладюри, Fayard 2004 ↩︎
-
Холодная волна февраля 2012 года, RTE ↩︎
-
Демография — число смертей — метрополитен Франции, Идентификатор 000436394, INSEE ↩︎