Transcripción de la charla impartida por Joannes Vermorel en la École polytechnique de Palaiseau (Francia) el viernes, 3 de junio para el simposio Inteligencia Artificial, Digital y Cambio Climático. El simposio fue organizado por Sylvain Le Corff, Profesor en Telecom Sud Paris y Eric Moulines, Profesor en École polytechnique y miembro electo de la Académie des sciences.

Pronosticando el cambio climático como un planificador de supply chain

Mi competencia radica en la ciencia de supply chain y en el análisis predictivo de supply chain. Supply chain es, en términos generales, el pegamento entre la producción y el consumo: los materiales deben ser adquiridos, transportados, transformados y distribuidos. De esto se trata supply chain. Confieso de inmediato que la ciencia de supply chain es poco probable que sea el futuro de la climatología.

Sin embargo, modern supply chains ya están aprovechando técnicas automatizadas de forecast a gran escala. Esto es exactamente lo que mi empresa, Lokad, ha estado haciendo durante más de una década.

Durante esta década, he aprendido una serie de lecciones críticas en lo que se refiere al uso de técnicas predictivas, típicamente algoritmos de machine learning, en entornos reales. La lección más importante es que es mejor estar aproximadamente en lo correcto que estar exactamente equivocado. Sin embargo, cuando miro a mi alrededor, veo toneladas de esfuerzos de ciencia de datos profundamente equivocados.

El aspecto más insidioso de procesar los datos es que los algoritmos – o la tecnología – pueden dar una ilusión de racionalidad, una ilusión de ciencia. Sin embargo, con demasiada frecuencia, esos esfuerzos equivocados de procesamiento de datos arrojan conclusiones que no son mejores que la astrología. Ningún algoritmo te salvará jamás si abordas un problema de la manera equivocada.

Para entender cómo el modelado predictivo para supply chain nos puede dar lecciones valiosas para el forecast del cambio climático, permítanme señalar que el clima y los mercados globales tienen mucho en común. En ambos casos, nuestra forma de vida está en juego. En ambos casos, tenemos sistemas complejos que no se comprenden del todo. En ambos casos, cada participante tiene un impacto en el sistema, pero es un impacto pequeño. En conjunto, una serie de pequeños impactos puede resultar en un gran impacto. Sin embargo, los participantes tienen incentivos propios, y como tal, nada es sencillo.

Así, voy a evaluar, al estilo de supply chain, la evolución del clima desde la perspectiva de la Francia metropolitana, tal como una empresa utiliza sus propias cuotas de mercado para evaluar el mercado.

Las supply chains me enseñaron que el costo siempre reside en los extremos. Los pequeños excesos de producción y los faltantes de stock menores suelen ser triviales de corregir; son los grandes los que anuncian la ruina de las empresas. Así, al hacer forecast del cambio climático, como planificador de supply chain, no me interesan las pequeñas variaciones. Francia tiene un clima templado; y recuerden que aquí adopto una perspectiva centrada en Francia.

Francia tendría poco o ningún problema para acomodar temperaturas dos grados más altas o más bajas de media. De igual forma, podríamos tener 10% más de viento, o menos viento, o 10% más de lluvia o menos lluvia, lo que casi no haría diferencia. Permítanme aclarar de inmediato que no estoy diciendo que no hubiera ningún impacto. Simplemente señalo que otros países – como Dinamarca o Italia – no tienen problemas a largo plazo asociados con climas más fríos o más cálidos, mientras mantienen un estilo de vida que, en todos los sentidos, es casi idéntico al que disfrutamos en Francia. A medida que el clima cambia, se producirán ajustes en toda una serie de áreas que van desde la elección de cultivos para la agricultura hasta el grosor de las capas de aislamiento térmico en los edificios. Sin embargo, esas evoluciones son modestas en comparación con otras fuentes de cambio que impactan a Francia.

Así, como planificador de supply chain, son los extremos del clima los que capturan mi interés. Para evaluar lo que se puede esperar, necesitamos observar los extremos históricos. De hecho, los extremos futuros siempre deben estimarse como mayores que los extremos pasados. Esto es cierto para los mercados y, muy probablemente, para el clima. Así que, echemos un vistazo a lo que la historia de Francia nos dice.

Verano de 16361, es el año en que Corneille escribió Le Cid, pero también el año de un verano terriblemente caluroso. Las temperaturas alcanzaron los 39°C en París durante semanas. En un verano, hubo 500,000 muertes, en su mayoría bebés e infantes. La causa principal de la muerte fue el agua contaminada y enfermedades como la disentería. La cifra de muertes, en relación con la población francesa de la época, es comparable a la de la Primera Guerra Mundial, que duró poco más de 4 años.

Así, unos 39°C sostenidos durante todo el verano, para toda Francia, deberían ser la referencia de lo que debemos estar preparados para afrontar. Casi no se requiere modelado climático para esta proposición: es una lectura directa de la historia climática reciente de Francia. Si sucedió hace 4 siglos, mi proposición es simplemente que podría suceder de nuevo el próximo verano.

Naturalmente, durante los últimos 2 siglos, la ciencia médica y el saneamiento prácticamente han eliminado la disentería en Francia. Sin embargo, ¿significa esto que podemos pasar veranos calurosos sin inconvenientes? Si juzgamos por los eventos recientes del verano de 2003 en Francia, los veranos calurosos aún presentan riesgos serios. La ola de calor de 2003 duró apenas 2 semanas, alcanzando los 39°C en París, y causó 15,000 muertes en Francia2, principalmente entre las personas de edad avanzada. Sin embargo, en los años siguientes, la tasa de equipos de aire acondicionado en los hogares en Francia pasó del 4% en 20053 al 25% en 20204.

Aquí, estamos tocando un aspecto crítico del forecast de asuntos humanos: la gente observa y se adapta. Esto no impacta siempre de manera negativa en la precisión del forecast – aunque frecuentemente lo hace – pero la inventiva humana casi siempre contribuye a hacer los forecasts a largo plazo irrelevantes. De hecho, tengan en cuenta que un forecast, cualquier forecast, es ante todo una elección de modelo. El modelo define el campo de batalla: lo que se va a forecast. Un forecast puede ser muy preciso y, sin embargo, completamente irrelevante. Este es un peligro al que se enfrenta cada empresa que opera una supply chain: los mercados están cambiando en su naturaleza, no solo creciendo o encogiéndose.

Volviendo a nuestros extremos climáticos, echemos ahora un vistazo al gran invierno de 1709. Durante el mes de enero de 17095, las temperaturas cayeron a -20°C en París; esto es comparable a un invierno frío en Quebec City. El río Sena se congeló por completo al igual que los otros grandes ríos de Francia. En 11 días, Francia perdió 100,000 personas debido a la ola de frío. En total, el invierno se cobró 600,000 vidas, en su mayoría de familias pobres. De nuevo, esas pérdidas son comparables con el impacto total de la Primera Guerra Mundial en Francia, salvo que, una vez más, el desastre ocurre en cuestión de semanas, en lugar de años. Ese invierno fue parte de un período conocido como la Pequeña Edad de Hielo en Europa, que duró desde mediados del siglo XIII hasta mediados del siglo XIX.

Aunque ver el río Sena completamente congelado en París puede sorprender a esta audiencia, vale la pena notar que la latitud norte de París es 49° mientras que la de Quebec City es solo 47°. Por lo tanto, geográficamente, París está más al norte que Quebec City.

En cualquier caso, en los siglos pasados, el río Sena se congeló por completo en muchas ocasiones. Es cuestión de historia, sin necesidad de modelado climático. Si tal invierno ocurrió hace 3 siglos, mi proposición continúa siendo que podría volver a suceder el próximo invierno.

Así, consideremos el tipo de problemas que surgirían en Francia, si tuviéramos que sufrir un invierno canadiense como el que ocurrió en el pasado.

El primer problema que se me ocurre es: el agua. En Francia, las tuberías de agua suelen estar enterradas a 80cm de profundidad, pero en Quebec City están a 130cm y por buenas razones. A 80cm, las tuberías se congelan y se rompen en Quebec. Así, una gran ola de frío, en Francia, probablemente destruiría una parte considerable de nuestra infraestructura de distribución de agua.

Además, el transporte se vería afectado severamente. Los camiones canadienses utilizan calentadores de bloque porque el diésel se congela a -10°C. No dispongo de estadísticas sobre la prevalencia de calentadores de bloque en los camiones en Francia, pero la tasa de equipamiento parece ser muy limitada. Teniendo en cuenta que más del 98% de los vehículos profesionales funcionan con diésel, es razonable asumir que casi todos esos vehículos se volverían inoperables durante una gran ola de frío.

Finalmente, la red eléctrica también es probable que sufra apagones severos. En 20126, que fue un invierno frío, Francia importaba hasta el 9% de su electricidad desde Alemania. La porción de energía que puede ser desconectada a voluntad, mayormente por grandes compañías industriales, resulta en una reducción de energía de solo alrededor del 1%. Un apagón controlado (brown-out) resulta en aproximadamente un 3% adicional de reducción de energía. Más allá de este punto, la única opción que le queda a la red eléctrica es cortar partes de la misma.

Esos problemas no son teóricos. Resulta que, cuando discutí el caso de los grandes inviernos con mi padre, esos problemas fueron exactamente lo que ocurrió en Saint Étienne en 1956.

1956 fue el invierno más frío del siglo XX en Francia. En Saint Étienne, la red eléctrica colapsó. Las tuberías de agua estallaron. Los vehículos dejaron de operar. En el sur, incluso el puerto marítimo de Marsella se congeló por completo.

Las familias pasaron días sin agua, comida ni calefacción. Una inspección superficial de las estadísticas de muertes de INSEE para febrero de 19567 indica alrededor de 15000 muertes en exceso en comparación con los años anteriores.

Este duro invierno de 1956 ocurrió en una sociedad de posguerra que aún dependía poco de los electrodomésticos. Además, esa sociedad todavía utilizaba de manera extensiva la calefacción con leña, la cual no depende de la red eléctrica. No tengo duda de que el mismo invierno en la Europa de hoy tendría consecuencias mucho más severas.

Volviendo a nuestra discusión sobre el forecast del clima, está claro, en este punto, que no son las temperaturas futuras las que realmente importan, sino las consecuencias de esas temperaturas. Lo mismo se podría decir de todas las demás variables climáticas: viento, lluvia, etc.

Si el primer error en el forecast de “ciencia de datos” es centrarse en los promedios en lugar de en los extremos, entonces, el segundo error en el forecast es confundir artefactos numéricos con consecuencias reales. En supply chain, este entendimiento se resume como los porcentajes de error en el forecast son irrelevantes, solo importan los dólares de error.

De hecho, los forecasts son artefactos numéricos que se diseñan para apoyar decisiones. La calidad de esos forecasts depende en gran medida de su adecuación para, en última instancia, alcanzar mejores decisiones.

Evaluar la calidad de los forecasts basándose únicamente en indicadores estadísticos arbitrarios como el error absoluto medio (MAE), el error cuadrático medio (MSE) o el error porcentual absoluto medio (MAPE), que están completamente desconectados de las consecuencias del mundo real, es probablemente uno de los errores más comunes que observo entre mis compañeros de ciencia de datos.

Personalmente, me refiero a esos forecasts como naked forecasts. Los naked forecasts son como lo opuesto a las profecías míticas. Esos forecasts reciben mucha más atención de la que deberían, y cuando la gente les presta atención, solo empeoran la situación.

Para comprender por qué los naked forecasts son erróneos, hay que darse cuenta de que, en el ámbito de supply chain – y sospecho que en el clima también – es sencillo generar forecasts que sean a la vez extremadamente precisos y extremadamente estúpidos al mismo tiempo.

De hecho, consideremos un minimarket con reabastecimientos diarios. Para casi todos los productos del minimarket, el forecast diario de ventas más preciso es de cero unidades. En efecto, la mayoría de los productos en un minimarket ni siquiera se venden una vez al día en promedio. Así, un forecast de ventas de cero suele ser el forecast diario más preciso si se considera el error absoluto medio.

Luego, si se toma un forecast de ventas de cero como insumo, la tienda no reabastecerá nada. En efecto, un forecast proyectado de cero ventas significa cero unidades para reabastecer. Pronto, todas las estanterías del minimarket estarán vacías, y, por lo tanto, tendremos efectivamente cero ventas, haciendo que este modelo de forecast de cero ventas sea 100% preciso. Mientras tanto, el minimarket quiebra.

Esta situación ocurre en la vida real (con soluciones de enterprise software que compiten con Lokad). Se llama un problema de congelación de inventario. Para solucionarlo, el modelo debe forecast la demanda en lugar de forecast las ventas; sin embargo, esto es difícil, porque las ventas se observan mientras que la demanda no.

Más generalmente, las métricas estadísticas de forecast dan la ilusión de ciencia: he diseñado un modelo de forecast que es 1% más preciso, por lo tanto, mi modelo es demostrablemente mejor. Sin embargo, usualmente no es así, y ni siquiera estoy hablando de overfitting. El problema que señalo es que perseguir una métrica estadística invariablemente empeora el modelo. El modelo de forecast se vuelve exactamente incorrecto mientras solía estar aproximadamente correcto.

No soy un experto en clima, pero desde mi perspectiva en supply chain, en los medios – la prensa y también las redes sociales – veo una abundancia de naked forecasts climáticos: forecasts que no están ligados a ningún proceso práctico de toma de decisiones. No estoy cuestionando la precisión de esos forecasts; este debate es para los climatólogos. Sin embargo, mi experiencia en supply chain me dice que intentar inferir cualquier tipo de decisión en el mundo real basada en esos naked forecasts es una receta para consecuencias no previstas, que típicamente desperdician toneladas de recursos en el proceso y, con frecuencia, logran exactamente lo opuesto a lo que se pretendía originalmente.

Un buen forecast comienza con un problema a abordar. Una vez que el problema está adecuadamente caracterizado, retrocedemos identificando los datos y las recetas numéricas que son adecuadas para respaldar cualquier decisión en juego.

Por el contrario, un mal forecast comienza con un conjunto de datos que resulta estar disponible por suerte y con un data scientist que resulta estar ansioso por probar el último artículo de machine learning sobre ese mismo conjunto de datos, posiblemente un artículo escrito por el propio data scientist.

Así, mi conclusión, que se aplica tanto a la supply chain como al clima, es que si quieres distinguir entre los forecast buenos y los forecast malos, comienza por rechazar de inmediato los forecast desnudos. De esos forecast nunca sale nada bueno. Luego, asegúrate de que los forecast sean aproximadamente correctos, en lugar de ser exactamente incorrectos. Y finalmente, busca la proximidad de esos forecast a las decisiones del mundo real. Si las personas que hacen los forecast no tienen que vivir con las consecuencias de esos forecast, entonces, tu postura predeterminada debería ser de profundo escepticismo.


  1. Página 351, Histoire humaine et comparée du climat. Vol 1 : Canicules et glaciers. XIIIe-XVIIIe siècles, Emmanuel Leroy-Ladurie, Fayard 2004 ↩︎

  2. INFORME REALIZADO EN NOMBRE DE LA COMISIÓN DE INVESTIGACIÓN SOBRE LAS CONSECUENCIAS SANITARIAS Y SOCIALES DE LA OLA DE CALOR, Relator M. François d’AUBERT, N° 1455 - tomo 1, 24 de febrero de 2005. ↩︎

  3. El mercado del aire acondicionado se resfría, Valérie Leboucq, Les Echos, 7 de octubre de 2005. ↩︎

  4. EL AIRE ACONDICIONADO: HACIA UN USO RAZONADO PARA LIMITAR EL IMPACTO SOBRE EL MEDIO AMBIENTE, ADEME presse, 30 de junio de 2021 ↩︎

  5. Página 517, Histoire humaine et comparée du climat. Vol 1 : Canicules et glaciers. XIIIe-XVIIIe siècles, Emmanuel Leroy-Ladurie, Fayard 2004 ↩︎

  6. La ola de frío de febrero de 2012, RTE ↩︎

  7. Demografía - Número de fallecidos - Francia metropolitana, Identificador 000436394, INSEE ↩︎