Prévision du changement climatique comme un planificateur de supply chain
Transcription de l’intervention présentée par Joannes Vermorel à l’Ecole polytechnique à Palaiseau (France) le vendredi 3 juin pour le symposium Artificial Intelligence, Digital and Climate Change. Le symposium a été organisé par Sylvain Le Corff, Professeur à Telecom Sud Paris et Eric Moulines, Professeur à l’Ecole polytechnique et membre élu de l’Académie des sciences.

Ma compétence réside dans la science de la supply chain et dans l’analytique prédictive pour la supply chain. La supply chain est, en gros, le lien entre la production et la consommation : les matériaux doivent être acquis, transportés, transformés et distribués. Voilà de quoi il s’agit en supply chain. Je vais immédiatement confesser que la science de la supply chain est peu susceptible d’être l’avenir de la climatologie.
Cependant, les supply chains modernes exploitent déjà à grande échelle des techniques automatisées de prévision. C’est exactement ce que fait mon entreprise, Lokad, depuis plus d’une décennie.
Au cours de cette décennie, j’ai tiré une série de leçons critiques concernant l’utilisation des techniques prédictives, généralement les algorithmes de machine learning, dans des contextes réels. La leçon la plus importante est que il vaut mieux être approximativement juste plutôt qu’exactement faux. Pourtant, quand je regarde autour de moi, je vois des tonnes d’efforts de data science profondément mal orientés.
L’aspect le plus insidieux du traitement des données est que les algorithmes – ou la technologie – peuvent donner une illusion de rationalité, une illusion de science. Pourtant, trop souvent, ces efforts mal orientés de traitement des données aboutissent à des conclusions qui ne valent pas mieux que l’astrologie. Aucun algorithme ne vous sauvera si vous abordez un problème de la mauvaise façon.
Pour comprendre comment la modélisation prédictive pour la supply chain peut nous apporter des leçons précieuses pour la prévision du changement climatique, permettez-moi de souligner que le climat et les marchés mondiaux ont beaucoup en commun. Dans les deux cas, notre mode de vie est en jeu. Dans les deux cas, nous avons des systèmes complexes qui ne sont pas entièrement compris. Dans les deux cas, chaque participant a un impact sur le système, mais cet impact est minime. À terme, une série de petits impacts peut entraîner un grand impact. Pourtant, les participants ont leurs propres incitations, et de ce fait, rien n’est jamais simple.
Ainsi, je vais évaluer, à la manière d’une supply chain, l’évolution du climat du point de vue de la France métropolitaine, tout comme une entreprise utilise ses propres parts de marché pour évaluer le marché.
Les supply chains m’ont appris que le coût réside toujours dans les extrêmes. De petits excès de production et de légères ruptures de stock sont généralement faciles à corriger ; ce sont les importantes qui condamnent les entreprises. Ainsi, lorsqu’il s’agit de prévoir le changement climatique, en tant que planificateur de supply chain, ce ne sont pas les petites variations qui m’intéressent. La France bénéficie d’un climat doux ; et rappelez-vous que j’adopte ici une perspective centrée sur la France.
La France aurait peu ou pas de problème à s’adapter à des températures en moyenne deux degrés plus élevées ou plus basses. De même, nous pourrions avoir 10 % de vent en plus ou en moins, ou 10 % de pluie en plus ou en moins, cela ne ferait presque aucune différence. Permettez-moi de préciser immédiatement que je ne dis pas qu’il n’y aurait aucun impact. Je souligne simplement que d’autres pays - comme le Danemark ou l’Italie - n’ont pas de problème à long terme associé à des climats plus froids ou plus chauds – tout en maintenant un mode de vie qui, pour ainsi dire, est presque identique à celui dont nous jouissons en France. Au fur et à mesure que le climat change, des ajustements se produiront dans toute une série de domaines allant du choix des cultures pour l’agriculture à l’épaisseur des couches d’isolation thermique dans les bâtiments. Cependant, ces évolutions sont modestes par rapport à d’autres sources de changement impactant la France.
Ainsi, en tant que planificateur de supply chain, ce sont les extrêmes climatiques qui suscitent mon intérêt. Pour évaluer ce à quoi nous pouvons nous attendre, nous devons examiner les extrêmes historiques. En effet, les extrêmes futurs doivent toujours être estimés comme étant supérieurs aux extrêmes passés. Cela est vrai pour les marchés et probablement vrai pour le climat. Voyons donc ce que l’histoire de la France nous révèle.
Été 16361, c’est l’année où Corneille a écrit Le Cid, mais aussi l’année d’un été terriblement chaud. Les températures sont montées à 39°C à Paris pendant des semaines. En un été, il y a eu 500 000 morts, principalement des bébés et des nourrissons. La cause principale de ces décès était l’eau contaminée, ainsi que des maladies comme la dysenterie. Le bilan, par rapport à la population française de l’époque, est comparable à celui de la Première Guerre mondiale, qui a duré un peu plus de 4 ans.
Ainsi, un maintien de 39°C pendant tout l’été, pour l’ensemble de la France, devrait constituer la référence à laquelle nous devons nous préparer. Il n’y a presque aucun modèle climatique impliqué dans cette proposition : c’est une lecture directe de l’histoire climatique récente de la France. S’il s’est produit il y a 4 siècles, ma proposition est simplement qu’il pourrait se reproduire l’été prochain.
Bien entendu, au cours des 2 derniers siècles, la science médicale et l’assainissement ont quasiment éliminé la dysenterie en France. Cependant, cela signifie-t-il que nous pouvons traverser des étés chauds sans problème ? Si nous nous référons aux événements récents de l’été 2003 en France, les étés chauds présentent encore des risques sérieux. La canicule de 2003 a duré à peine 2 semaines, atteignant 39°C à Paris, et a causé 15 000 décès en France2, principalement parmi les personnes âgées. Toutefois, dans les années qui ont suivi, le taux d’équipement en climatisation dans les foyers français est passé de 4 % en 20053 à 25 % en 20204.
Ici, nous abordons un aspect critique de la prévision des affaires humaines : les gens observent, et les gens s’adaptent. Cela n’impacte pas toujours négativement la précision des prévisions - bien que ce soit fréquemment le cas - mais l’ingéniosité humaine contribue presque toujours à rendre les prévisions à long terme non pertinentes. En effet, gardez à l’esprit qu’une prévision, n’importe laquelle, est avant tout un choix de modèle. Le modèle définit le terrain de jeu : ce qui va être prévisible. Une prévision peut être très précise et pourtant complètement non pertinente. C’est un danger auquel est confrontée chaque entreprise opérant une supply chain : les marchés changent dans leur nature, et pas seulement en grandissant ou en diminuant.
Pour revenir aux extrêmes climatiques, examinons maintenant le grand hiver de 1709. Au cours du mois de janvier 17095, les températures chutent à -20°C à Paris ; c’est comme un hiver rigoureux à Québec. La Seine est gelée solidement comme les autres grands fleuves de France. En 11 jours, la France perd 100 000 personnes à cause de la vague de froid. Au total, l’hiver emporte 600 000 vies, principalement celles de familles pauvres. Encore une fois, ces pertes sont comparables à l’impact total de la Première Guerre mondiale en France, sauf qu’une fois de plus, la catastrophe se produit en l’espace de quelques semaines, plutôt qu’en années. Cet hiver faisait partie d’une période connue sous le nom de Petite Ère Glaciaire en Europe qui a duré du milieu du XIIIe siècle au milieu du XIXe siècle.
Bien que voir la Seine gelée solidement à Paris puisse surprendre cet auditoire, il convient de noter que la latitude nord de Paris est de 49° tandis que celle de Québec est seulement de 47°. Ainsi, géographiquement, Paris est plus au nord que Québec.
En tout cas, au cours des siècles passés, la Seine a gelé solidement à de nombreuses reprises. C’est une question d’histoire, sans modélisation climatique impliquée. Si un tel hiver s’est produit il y a 3 siècles, ma proposition reste qu’il pourrait se reproduire l’hiver prochain.
Ainsi, considérons les types de problèmes qui surgiraient en France si nous devions subir un hiver canadien comme par le passé.
Le premier problème qui me vient à l’esprit est : l’eau. En France, les canalisations sont généralement enterrées à 80 cm de profondeur, mais à Québec, elles le sont à 130 cm, et pour de bonnes raisons. À 80 cm, les canalisations gèlent et se brisent à Québec. Ainsi, une grande vague de froid, en France, détruirait très probablement une partie importante de notre infrastructure de distribution d’eau.
De plus, le transport serait fortement impacté. Les camions canadiens utilisent des préchauffeurs de bloc, car le diesel gèle à -10°C. Je ne dispose pas de statistiques sur la prévalence des préchauffeurs de bloc sur les camions en France, mais le taux d’équipement semble être très limité. Étant donné que plus de 98 % des véhicules professionnels fonctionnent au diesel, il est raisonnable de supposer que presque tous ces véhicules deviendraient inopérants lors d’une grande vague de froid.
Enfin, le réseau électrique est également susceptible de subir de fortes coupures. En 20126, qui fut un hiver froid, la France importait jusqu’à 9 % de son électricité d’Allemagne. La partie de la puissance qui peut être arrêtée à volonté, principalement chez les grandes entreprises industrielles, ne représente qu’environ 1 % de réduction d’énergie. Une coupure contrôlée (brown-out) entraîne environ 3 % de réduction supplémentaire. Au-delà de ce point, la seule option pour le réseau électrique est de couper des portions du réseau.
Ces problèmes ne sont pas théoriques. Il se trouve que, lorsque j’ai discuté des grands hivers avec mon père, il m’a révélé que ces problèmes sont exactement ce qui s’est produit à Saint-Étienne en 1956.
1956 fut l’hiver le plus froid du 20ème siècle en France. À Saint-Étienne, le réseau électrique s’est effondré. Les canalisations ont éclaté. Les véhicules ont cessé de fonctionner. Dans le sud, même le port de Marseille a gelé solidement.
Les familles se sont retrouvées sans eau, nourriture ou chauffage pendant des jours. Un examen sommaire des statistiques de décès de l’INSEE pour février 19567 indique environ 15 000 décès en excès par rapport aux années précédentes.
Cet hiver rigoureux de 1956 s’est produit dans une société d’après-guerre qui comptait encore peu sur les appareils électriques. De plus, cette société utilisait encore largement le chauffage au bois, qui ne dépend pas du réseau électrique. Je ne doute pas que le même hiver en Europe aujourd’hui aurait des conséquences bien plus sévères.
Revenant à notre discussion sur la prévision du climat, il est clair, à ce stade, que ce ne sont pas les températures futures qui comptent vraiment, mais les conséquences de ces températures. Il en va de même pour toutes les autres variables climatiques : vent, pluie, etc.
Si la première erreur de prévision en « data science » est de se concentrer sur les moyennes plutôt que sur les extrêmes, alors, la deuxième erreur de prévision est de confondre les artefacts numériques avec les conséquences réelles. En supply chain, cette observation se résume ainsi : les pourcentages d’erreur de prévision sont sans importance, seuls les montants en dollars d’erreur comptent.
En effet, les prévisions sont des artefacts numériques conçus pour soutenir les décisions. La qualité de ces prévisions dépend en grande partie de leur adéquation pour parvenir, en fin de compte, à de meilleures décisions.
Évaluer la qualité des prévisions en se basant uniquement sur des indicateurs statistiques arbitraires, tels que l’erreur absolue moyenne (MAE), l’erreur quadratique moyenne (MSE) ou l’erreur en pourcentage moyenne absolue (MAPE), qui sont tous complètement déconnectés des conséquences réelles, est probablement l’une des erreurs les plus courantes que j’observe chez mes confrères data scientists.
Personnellement, je qualifie ces prévisions de prévisions nues. Les prévisions nues sont l’opposé des prophéties mythiques. Ces prévisions attirent bien plus d’attention qu’elles ne le mériteraient, et lorsque les gens y prêtent attention, ils ne font qu’aggraver la situation.
Pour comprendre pourquoi les prévisions nues sont erronées, il faut se rendre compte que, dans la supply chain – et je suspecte que ce soit aussi le cas pour le climat – il est facile de générer des prévisions à la fois extrêmement précises et extrêmement stupides en même temps.
En effet, considérons un minimarket avec des réapprovisionnements quotidiens. Pour presque tous les produits du minimarket, la prévision quotidienne de ventes la plus précise est de zéro unité. En effet, la plupart des produits, dans un minimarket, ne se vendent même pas une fois par jour en moyenne. Ainsi, une prévision de ventes à zéro est généralement la prévision quotidienne la plus précise en tenant compte de l’erreur absolue moyenne.
Ensuite, si une prévision de ventes à zéro est prise en compte, le magasin ne réapprovisionnera rien. En effet, des ventes prévues à zéro signifient zéro unité à réapprovisionner. Rapidement, toutes les étagères du minimarket se retrouvent vides, et ainsi, nous avons effectivement zéro vente, rendant ce modèle de prévision de ventes à zéro 100 % précis. Pendant ce temps, le minimarket fait faillite.
Cette situation se produit dans la vie réelle (avec des solutions de enterprise software qui concurrencent Lokad). On appelle cela un problème de gel des stocks. Pour y remédier, le modèle doit prévoir la demande au lieu de prévoir les ventes ; cependant, cela est difficile, car les ventes sont observées alors que la demande ne l’est pas.
De manière plus générale, les indicateurs de prévision statistiques donnent l’illusion de science : j’ai conçu un modèle de prévision qui est 1% plus précis, donc, mon modèle est prouvé meilleur. Cependant, ce n’est généralement pas le cas, et je ne parle même pas de surapprentissage. Le problème que je souligne est que courir après un indicateur statistique rend invariablement le modèle pire. Le modèle de prévision devient exactement faux alors qu’il était auparavant approximativement juste.
Je ne suis pas un expert du climat, mais de mon point de vue en supply chain, dans les médias – la presse mais aussi les réseaux sociaux – je constate une abondance de prévisions climatiques nues : des prévisions qui ne sont liées à aucun processus pratique de prise de décision. Je ne remets pas en cause la précision de ces prévisions ; c’est un débat pour les climatologues. Cependant, mon expérience en supply chain me dit qu’essayer d’en déduire quelque type de décisions concrètes à partir de ces prévisions nues est une recette pour des conséquences inattendues, gaspillant généralement des tonnes de ressources dans le processus, et atteignant fréquemment le tout contraire de l’intention initiale.
Une bonne prévision commence par un problème à résoudre. Une fois que le problème est correctement caractérisé, nous remontons en arrière pour identifier les données et les formules numériques adaptées afin de soutenir la décision en jeu.
En revanche, une mauvaise prévision commence par un jeu de données qui se trouve être disponible par chance et par un data scientist qui se montre désireux de tester le dernier article de deep learning sur ce même jeu de données, peut-être même un article écrit par le data scientist lui-même.
Ainsi, ma conclusion, qui s’applique aussi bien au supply chain qu’au climat, est que si vous voulez distinguer les bonnes prévisions des mauvaises, commencez par rejeter immédiatement les prévisions nues. Rien de bon naît jamais de ces prévisions. Ensuite, assurez-vous que les prévisions sont approximativement correctes, plutôt que complètement erronées. Et enfin, recherchez la proximité de ces prévisions avec les décisions prises dans le monde réel. Si les personnes qui établissent ces prévisions n’ont pas à subir les conséquences de celles-ci, alors votre position par défaut devrait être un profond scepticisme.
-
Page 351, Histoire humaine et comparée du climat. Vol 1 : Canicules et glaciers. XIIIe-XVIIIe siècles, Emmanuel Leroy-Ladurie, Fayard 2004 ↩︎
-
RAPPORT FAIT AU NOM DE LA COMMISSION D’ENQUÊTE SUR LES CONSÉQUENCES SANITAIRES ET SOCIALES DE LA CANICULE, Rapporteur M. François d’AUBERT, N° 1455 - tome 1, 24 février 2005. ↩︎
-
Le marché de la climatisation s’enrhume, Valérie Leboucq, Les Echos, 7 octobre 2005. ↩︎
-
LA CLIMATISATION : VERS UNE UTILISATION RAISONNÉE POUR LIMITER L’IMPACT SUR L’ENVIRONNEMENT, ADEME presse, 30 juin 2021 ↩︎
-
Page 517, Histoire humaine et comparée du climat. Vol 1 : Canicules et glaciers. XIIIe-XVIIIe siècles, Emmanuel Leroy-Ladurie, Fayard 2004 ↩︎
-
La vague de froid de février 2012, RTE ↩︎
-
Démographie - Nombre de décès - France métropolitaine, Identifiant 000436394, INSEE ↩︎