パリゾー(フランス)のエコール・ポリテクニークで6月3日金曜日に開催された『人工知能、デジタル、気候変動』シンポジウムにおいて、ジョアンヌ・ヴェルモレルが行った講演の書き起こし。シンポジウムは、テレコム・シュード・パリの教授であるシルヴァン・ル・コルフと、エコール・ポリテクニークのエリック・ムーライン教授、及び_科学アカデミー_の選出メンバーによって組織されました。

サプライチェーンプランナーのように気候変動を予測する

My competence lies in supply chain science and in supply chain predictive analytics. Supply chain is, roughly speaking, the glue between production and consumption: materials must be acquired, transported, transformed, and distributed. This is what supply chain is about. I will immediately confess that supply chain science is unlikely to be the future of climatology.

しかしながら、現代のサプライチェーンは既に自動化された予測技術を大規模に活用しています。これはまさに、私の会社Lokadが10年以上にわたり実践してきたことです。

この10年間で、現実の場面において、主に機械学習アルゴリズムなどの予測技術を使用する際に、一連の重要な教訓を学びました。最も重要な教訓は、_「正確に間違うよりも、おおむね正しい方が良い」_ということです。しかし、周りを見渡すと、深く誤った方向に進んでいるデータサイエンスの取り組みが山ほど見受けられます。

データを処理する行為の最も危険な点は、アルゴリズムや技術が合理性の幻、科学の幻を与える可能性があることです。しかしながら、あまりにも頻繁に、誤ったデータ解析の試みは占星術と変わらない結果をもたらします。問題へのアプローチを誤れば、どんなアルゴリズムもあなたを救うことはありません。

サプライチェーンの予測モデリングがどのように気候変動の予測に貴重な教訓を与えるのかを理解するために、気候とグローバル市場には多くの共通点があることを指摘させてください。どちらの場合も、我々の生活様式が脅かされています。両者ともに、十分に理解されていない複雑なシステムを抱えています。そして、各参加者はシステムに影響を与えますが、その影響は小さいものです。集積的に見ると、小さな影響の連鎖が大きな影響を及ぼすかもしれません。しかし、各参加者には固有のインセンティブが存在するため、物事は決して単純ではありません。

ですから、私は会社が自社の市場シェアを用いて市場を評価するのと同様に、サプライチェーンの視点からフランス本土の気候の変遷を評価してみようと思います。

サプライチェーンは、コストは常に極端な値に存在することを教えてくれました。生産の小さな過剰やごくわずかな品切れは通常、容易に対処できますが、大きなものこそが企業を破滅に導くのです。したがって、サプライチェーンプランナーとして気候変動を予測する際には、小さな変動ではなく、極端な事例に注目するのです。フランスは温暖な気候を有しており、ここではフランスを中心とした視点を採用していることを忘れないでください。

フランスは、平均気温が2度高くても低くても、大きな問題はほとんどありません。同様に、風が10%多くなっても少なくなっても、雨が10%多くなっても少なくなっても、ほとんど違いは出ません。すぐに明確にしておきたいのは、影響が全くないと言っているのではなく、例えばデンマークやイタリアのような国々では、寒冷または温暖な気候に長期的な問題がなく、実質的にフランスで享受している生活様式とほぼ同一のライフスタイルを維持できるという点です。気候が変化するにつれて、農業の作物選定から建物の断熱層の厚さに至るまで、さまざまな分野で調整が行われるでしょう。しかし、これらの変化はフランスに影響を与える他の要因に比べると控えめなものです。

したがって、サプライチェーンプランナーとしては、気候の極端な事象にこそ興味があります。何が予測されるかを評価するためには、歴史的な極端さに目を向ける必要があります。実際、将来の極端な事象は過去のものよりも大きいと見積もるべきです。これは市場においても、そしておそらく気候においても当てはまります。では、フランスの歴史が何を語っているのか見てみましょう。

1636年の夏1は、コルネイユが『ル・シッド』を書いた年であると同時に、酷暑の夏でもありました。パリでは気温が数週間にわたり39°Cに達しました。その夏だけで、主に乳幼児を中心に50万人が命を落としました。主な死因は汚染された水や赤痢などの疾病でした。当時のフランスの人口に対する死亡者数は、約4年以上続いた第一次世界大戦に匹敵します。

したがって、フランス全体で夏の間ずっと39°Cが続く状況は、我々が備えるべき基準となるべきです。この提案にはほとんど気候モデリングが含まれているわけではなく、最近のフランスの気候史を直接読み取ったものです。もしそれが4世紀前に実際に起こったのならば、私の主張は単に、来る夏にも再び起こる可能性があるということです。

もちろん、過去2世紀の間に、医療科学と衛生環境の向上により、フランスにおける赤痢はほぼ撲滅されました。しかし、それは熱い夏を問題なく乗り切れるという意味でしょうか?フランスでの2003年夏の最近の出来事を基に判断すると、猛暑夏には依然として深刻なリスクがあります。2003年の熱波はわずか2週間ほどで、パリは39°Cに達し、主に高齢者を中心にフランスで15,000人の死者を出しました2。しかし、その後の数年間で、フランスの家庭におけるエアコン普及率は、2005年3の4%から2020年4には25%に上昇しました。

ここで、私たちは人間の行動を予測する上で極めて重要な側面に触れています:_「人々は観察し、そして適応する」_ということです。これは必ずしも予測-精度-定義に悪影響を及ぼすわけではありません(しばしばそうではありますが)が、人間の創意工夫はほぼ常に長期予測を_無意味なものにしてしまう_要因となります。実際、どんな予測もまず第一に_モデルの選択_であることを忘れてはなりません。そのモデルが予測の戦場、すなわち何を予測するかを定義します。予測が非常に高精度であっても全く無意味である可能性があるのです。これは、サプライチェーンを運営するあらゆる企業が直面する危険です。市場は単に拡大または縮小しているだけでなく、性質そのものが変化しているからです。

さて、気候の極端事項に戻り、1709年の大寒冬を見てみましょう。1709年1月の間5、パリでは気温が-20°Cまで下がりました;これはケベックシティのような寒い冬に匹敵します。セーヌ川はフランスの他の大河と同様に完全に凍結しました。11日間で、フランスは寒波により10万人を失いました。全面的には、冬の間に60万人が命を落とし、主に貧困家庭が被害に遭いました。これらの死者数は、フランスにおける第一次世界大戦の全体的な影響に匹敵しますが、またもや、災害が数年ではなく数週間で発生する点が異なります。この寒冬は、13世紀半ばから19世紀半ばまで続いたヨーロッパで知られる_小氷期_の一部でした。

パリでセーヌ川が完全に凍結するという事実は、この聴衆にとって驚くべきことであるかもしれませんが、パリの北緯は49°であるのに対し、ケベックシティの緯度はわずか47°であることに留意する価値があります。つまり、地理的にはパリの方がケベックシティより北に位置しています。

いずれにせよ、過去の数世紀にわたり、セーヌ川は何度も完全に凍結しました。これは気候モデリングを一切用いず、歴史の事実です。もし3世紀前にそのような冬が実際にあったのなら、私の主張は来冬にも再び同様の事態が起こる可能性があるというものです。

それでは、過去に起こったようなカナダ式の冬がフランスで発生した場合に生じるであろう問題について考えてみましょう。

私が思いつく最初の問題は、水です。フランスでは水道管は通常80cmの深さに埋設されていますが、ケベックシティでは130cmに埋設されており、それには十分な理由があります。80cmでは、ケベックでは水道管が凍結して破裂してしまいます。したがって、フランスで大規模な寒波が発生した場合、私たちの水供給インフラの大部分が破壊される可能性が高いのです。

また、輸送にも大きな影響が出るでしょう。カナダのトラックは、ディーゼルが-10°Cで凍結するため、ブロックヒーターを使用しています。フランスのトラックにおけるブロックヒーターの普及率に関する統計は持っていませんが、その装備率は非常に低いと思われます。プロフェッショナル車両の98%以上がディーゼルで稼働していることを考えると、大規模な寒波の際には、ほぼすべての車両が使用不能になると推測するのが合理的です。

最後に、電力網もまた大規模な停電に見舞われる可能性があります。寒冬であった2012年6、フランスはドイツから最大で9%の電力を輸入していました。大口の産業企業などで意思的に停止させることができる電力部分は、約1%のエネルギー削減に留まります。制御されたブラウンアウトでは、約3%のエネルギー削減が実現されます。この水準を超えると、電力網に残される唯一の選択肢は、部分的にグリッドを切断することとなります。

これらの問題は理論上の話ではありません。大寒冬の事例について父と議論したところ、これらの問題こそが1956年のサン=テティエンヌで実際に起こったものだということがわかりました。

1956年は、フランスにおける20世紀で最も寒い冬でした。サン=テティエンヌでは、電力網が崩壊し、水道管が破裂し、車両が運行不能となりました。南部では、マルセイユの港湾でさえ完全に凍結しました。

家族は数日間、水や食料、暖房なしで生活を強いられました。1956年2月のINSEE(フランス国立統計経済研究所)の死亡統計をざっと見るだけでも、前の数年と比べて約15,000人の超過死亡があったことが示されています。

この1956年の厳しい冬は、戦後の社会において、まだ電化製品に大きく依存していなかった時期に起こりました。また、この社会では依然として、電力網に依存しない木材暖房が広く利用されていました。今日のヨーロッパで同様の冬があったなら、はるかに深刻な結果を招くことは疑いようがありません。

改めて気候予測の議論に戻ると、重要なのは未来の気温そのものではなく、それらの気温がもたらす結果であることは明らかです。他のすべての気候変数、例えば風や雨に関しても同様のことが言えます。

もし最初の「データサイエンス」における予測の誤りが、平均値に焦点を当て、極端値に注目しないことであるならば、二番目の予測ミスは、数値の偽像と現実の結果を混同することです。サプライチェーンでは、この洞察は_「予測誤差のパーセンテージは重要ではなく、誤差の金額だけが問題である」_という形で要約されます。

実際、予測は意思決定を支援するために設計された数値の偽像です。その予測の質は、最終的により良い意思決定に至るための適合性に大きく依存しています。

平均絶対誤差(MAE)、平均二乗誤差(MSE)、平均絶対パーセンテージ誤差(MAPE)など、現実の結果と全く結びつかない任意の統計的指標のみに依拠して予測の質を評価することは、おそらく私が他のデータサイエンティストたちの中で最もよく目にする誤りの一つです。

私は個人的にこれらの予測を裸の予測と呼んでいます。裸の予測は、神話的な予言の正反対のようなものです。これらの予測は本来あるべき以上の注目を集め、かえって人々がそれに注意を払うことで状況を悪化させるだけです。

なぜ裸の予測が間違っているのかを理解するためには、サプライチェーンにおいて(あるいは気候においても同様だと私は考えますが)、非常に正確でありながら同時に非常に愚かな予測を生成することが容易であるという事実を認識しなければなりません。

実際、日々補充が行われるコンビニエンスストアを考えてみましょう。コンビニエンスストアのほとんどの商品の場合、最も正確な1日の売上予測は_ゼロ単位_です。実際、ほとんどの商品はコンビニエンスストアでは平均して1日に1回も売れないことが多いのです。したがって、平均絶対誤差の観点から見れば、ゼロ売上の予測が通常最も正確な日次予測となるのです。

その後、ゼロ売上の予測が入力されれば、店舗は一切補充を行いません。実際、予測される売上がゼロであるということは、補充すべき単位数もゼロであることを意味します。すぐに、コンビニエンスストアのすべての棚が空になり、結果として実際の売上もゼロとなり、このゼロ売上の予測モデルは100%の精度を誇ることになります。しかし、その間にコンビニエンスストアは破産してしまいます。

この状況は実際に起こり得ます(Lokadと競合するエンタープライズソフトウェアソリューションにおいて)。これは_在庫凍結問題_と呼ばれます。これを解決するには、_売上を予測する_のではなく_需要を予測する_必要がありますが、需要は観測されるものではなく、売上は観測されるため、これは困難な課題です。

より一般的に、統計的な予測指標は科学の幻影を与えます:_「私の予測モデルは1% より正確であるため、証明可能なほど優れている」_と。しかし、これは通常当てはまらず、過剰適合の問題についても触れていません。私が指摘している問題は、統計指標を追うことで、モデルが次第に悪化してしまうということです。以前はおおむね正しかった予測モデルが、次第に完全に間違った予測に転じてしまうのです。

私は気候の専門家ではありませんが、サプライチェーンの視点から見れば、メディア―新聞だけでなくソーシャルネットワークにおいて―無数の裸の気候予測が見受けられます。これらは実際の意思決定プロセスに結びついていない予測です。これらの予測の精度に異議を唱えるわけではなく、これは気候学者たちの議論の範疇です。しかし、私のサプライチェーンの経験からは、これらの裸の予測に基づいて何らかの実際の意思決定を導き出そうとすることは、意図しない結果、すなわち大量の資源の浪費につながり、多くの場合、元々の意図とはまったく逆の成果を生む結果に終わるということがわかります。

良い予測は、解決すべき問題の特定から始まります。問題が十分に特徴づけられたら、逆算して、該当する意思決定を支援するのに適したデータと数値手法を見出していきます。

対照的に、悪い予測は、たまたま手に入ったデータセットから始まり、そのデータセットに関して最新の機械学習論文――場合によってはデータサイエンティスト自身が書いた論文――を試してみたいという意欲に満ちたデータサイエンティストによって行われます。

したがって、私の結論は、サプライチェーンにも気候にも当てはまり、良い予測と悪い予測を見分けたいのであれば、まず「裸の予測」を即座に排除することから始めるべきだということです。そうした予測からは決して良い結果は生まれません。次に、予測がまったく外れているのではなく、大体合っていることを確認してください。そして最後に、その予測が現実の意思決定にどれほど近いかを見極めてください。もし予測を行う人々がその結果に伴う責任を負う必要がないのであれば、あなたは深い懐疑心を持つべきです。


  1. 351ページ、Histoire humaine et comparée du climat. Vol 1 : Canicules et glaciers. XIIIe-XVIIIe siècles, Emmanuel Leroy-Ladurie, Fayard 2004 ↩︎

  2. 熱波の健康および社会的影響に関する調査委員会を代表して行われた報告書, 報告者 M. François d’AUBERT, N° 1455 - tome 1, 2005年2月24日. ↩︎

  3. エアコン市場が風邪をひく, Valérie Leboucq, Les Echos, 2005年10月7日. ↩︎

  4. エアコン:環境への影響を制限するための合理的な使用へ, ADEME presse, 2021年6月30日 ↩︎

  5. 517ページ、Histoire humaine et comparée du climat. Vol 1 : Canicules et glaciers. XIIIe-XVIIIe siècles, Emmanuel Leroy-Ladurie, Fayard 2004 ↩︎

  6. 2012年2月の寒波, RTE ↩︎