“Para mejorar tu juego, debes estudiar el final antes que nada; ya que, mientras que los finales se pueden estudiar y dominar por sí mismos, el medio juego y la apertura deben estudiarse en relación con el final.” Fuente: Últimas conferencias de ajedrez de Capablanca (1966), p. 23

Hace unas semanas, hablé en un panel en el 44º Simposio Internacional sobre forecast en Dijon, Francia.

Como embajador de Lokad, puedes imaginar cuál era mi perspectiva:

  • el forecast y la toma de decisiones deberían ser completamente automatizados;

  • la calidad del forecast debería evaluarse desde la perspectiva de mejores decisiones;

  • el juicio humano debería utilizarse para mejorar la automatización (no para ajustar los forecast o decisiones).

a picture of a chessboard.

Curiosamente, mi postura sobre la automatización no provocó tanto desacuerdo como podría pensarse. El moderador (Jefe de Comunicación de Lokad, Conor Doherty) y los otros panelistas (Sven Crone de iqast y Nicolas Vandeput de SupChains) estuvieron casi unánimemente de acuerdo en que este era el futuro del forecast. La única discrepancia fue cuán rápido podríamos alcanzar este estado (nota: creo que ya estamos allí).

Lo que sí causó bastante desacuerdo, y quizás incluso confusión, fue mi argumento de que la exactitud del forecast no es tan importante como tomar mejores decisiones. Este desacuerdo no se limitó a los otros panelistas, sino también a los miembros de la audiencia. Creo que hay dos razones principales para esto:

  1. Cuando hablé en el escenario, no contaba con un apoyo visual para respaldar este punto. Hay varios elementos en movimiento en la explicación, por lo que un visual definitivamente habría ayudado a la gente a entender.

  2. La idea de que la exactitud del forecast es menos importante que las decisiones contradice la educación, formación y experiencia de la mayoría de los profesionales.

Al final de este ensayo, espero haber abordado ambos puntos mencionados anteriormente. En relación con el primer punto, he incluido una explicación breve pero sistemática y un visual intuitivo. En cuanto al segundo, solo puedo pedir al lector que mantenga la mente abierta durante los próximos 5 a 10 minutos y trate de abordar estas palabras como si no tuviera ninguna formación previa en forecast de supply chain.

Preguntas orientadoras

En mi opinión, hay cinco preguntas fundamentales que deben responderse para clarificar mi posición. En esta sección, haré lo posible por proporcionar respuestas breves a cada una - lo esencial, por así decirlo. Ten la seguridad de que Lokad cuenta con una gran cantidad de recursos adicionales para explicar las particularidades técnicas, a los que enlazaré al final del ensayo.

P1: ¿Qué significa que un forecast “añada valor”?

Empezaré de inmediato con un ejemplo. Supongamos que existe un mecanismo por defecto para producir decisiones en una compañía (por ejemplo, forecast estadístico automatizado + política de inventario automatizada).

Para que un forecast modificado añada valor, necesita cambiar una decisión por defecto (generada usando el proceso por defecto de la compañía) de manera que afecte directa y positivamente los retornos financieros de la compañía (es decir, dólares, libras o euros de retorno).

Si un forecast es más exacto (en términos de predecir la demanda real) pero no resulta en una decisión diferente y mejor, entonces no ha añadido valor.

Muchas compañías todavía utilizan modelos de forecasting basados en series de tiempo, mientras que Lokad prefiere forecast probabilístico para ayudar a generar decisiones ajustadas al riesgo. Sin embargo, el mismo estándar se aplica a ambos paradigmas de forecast. Para que cualquier tipo de forecast añada valor, debe alterar una decisión por defecto de manera que afecte directa y positivamente los retornos financieros de la compañía.

Por ejemplo, una nueva decisión (“alterada”) podría eliminar de manera directa un futuro faltante de stock que la decisión por defecto habría presentado.

“Directamente” es crítico aquí. En términos muy simples, el forecast solo añade valor si puedes señalar el cambio de decisión exacto que influyó en los retornos financieros adicionales o previno pérdidas financieras (en comparación con la decisión por defecto).

Piensa en causalidad, no en correlación.

P2: ¿Siempre añade valor un forecast más exacto?

Técnicamente, no. Un forecast más exacto, por sí mismo, no necesariamente “añade valor”. Esto se debe a que, como se mencionó anteriormente, para que algo (en este caso un forecast) añada valor debe afectar directa y positivamente los retornos financieros de una compañía a través de una mejor decisión.

A diferencia de los forecasts, las decisiones de supply chain tienen restricciones de viabilidad (por ejemplo, MOQ, multiplicadores de lote, tamaños de lote, etc.) e incentivos financieros (por ejemplo, descuentos, términos de pago, etc.). Puede haber muchos más forecasts que decisiones viables.

Esto significa que las decisiones de supply chain pueden ocasionalmente ser (y muy a menudo lo son) insensibles a cambios en la exactitud del forecast. Esto es cierto tanto para los forecasts de series de tiempo como para los forecast probabilísticos.

La razón de esta insensibilidad se debe a las restricciones en la toma de decisiones (por ejemplo, MOQs). Es perfectamente posible que un forecast más exacto (por ejemplo, 10% más exacto) conduzca a la misma decisión que uno menos exacto. El gráfico a continuación ilustra este punto.

Un gráfico que ilustra la falta de impacto de la exactitud del forecast en las decisiones bajo la presencia de cantidades mínimas de pedido.

En el ejemplo anterior, digamos que el forecast de consenso de 55 unidades era más exacto que el forecast automatizado de 50 unidades. Desde una perspectiva financiera, el aumento en la exactitud no resultó en una decisión diferente (debido a la presencia de un MOQ). Por lo tanto, el forecast más exacto no añadió valor.

De hecho, hay un argumento sólido de que el forecast de consenso más exacto resultó en valor añadido negativo. Esto se debe a que los pasos adicionales de revisión (según un proceso estándar de Forecast Value Added) cuestan dinero (más tiempo y esfuerzo) para la compañía, y no resultaron en una mejor decisión. Desde una perspectiva puramente financiera, esos pasos manuales de revisión fueron un neto negativo.

Consideremos también un caso en el que no existe la restricción de MOQ.

Imagina el mismo escenario general, pero existe un multiplicador de lote en lugar de un MOQ. Las decisiones viables son incrementos de 50 unidades (por ejemplo, 50 unidades en una caja o en un pallet). En esta situación, tendríamos que comprar ya sea 50 o 100 unidades (1 o 2 cajas o pallets).

Un gráfico que ilustra la falta de impacto de la exactitud del forecast en las decisiones bajo la presencia de multiplicadores de lote para la compra de bienes.

En realidad, podría ser menos rentable comprar 100 unidades (cubriendo la sugerencia del forecast de consenso de 55 unidades) que comprar 50 unidades (ligeramente menos de lo que sugiere el forecast “más exacto”). Se podría intentar cubrir la demanda restante con backorders o simplemente perder ventas (por ejemplo, si se venden productos perecederos como alimentos frescos).

Desde una perspectiva económica, la mejor decisión financiera podría no ser seguir el forecast “más exacto”. En este escenario, tanto el forecast automatizado (50 unidades de demanda) como el forecast de consenso (55 unidades de demanda) resultan en la misma decisión (ordenar 50 unidades). Por lo tanto, el forecast “más exacto” no resultó en un aumento del valor financiero.

Concedo que no todas las situaciones son igualmente estrictas en cuanto a restricciones, sin embargo, supply chain está llena de ese tipo de escenarios. Por supuesto, reconozco que diferentes forecasts producirán decisiones diferentes, pero la cuestión del valor sigue abierta. En todo momento, debemos considerar si el retorno adicional esperado de comprar unidades extra es mayor que los recursos adicionales consumidos para mejorar la exactitud del forecast.

Tal vez la exactitud extra valga la pena en algunas situaciones. Sin embargo, los pronosticadores y profesionales de supply chain parecen asumir de forma reflexiva que lo es en términos absolutos, a pesar de que existen escenarios obvios en los que no lo es.

Un gráfico que ilustra la dificultad de evaluar el impacto financiero de la exactitud del forecast en una situación sin restricciones.

Si has pensado en un escenario que no coincide perfectamente con los ejemplos descritos aquí, está bien. Recuerda, el objetivo de hoy es demostrar un punto general (que hay situaciones en las que la exactitud extra del forecast no vale la pena perseguirla), y no analizar en profundidad cada posible escenario de toma de decisiones en supply chain.

P3: ¿Cómo podemos asegurar que el valor ganado vale el costo de la intervención basada en el juicio?

Un elemento central de la discusión en panel en Dijon fue el valor (o la falta del mismo) de la intervención basada en el juicio (o “intervenciones humanas”) en el proceso de forecast. Para parafrasear a la otra parte, “tenemos que tener personas en el circuito para corregir cuando el forecast automatizado ha fallado en algo”.

Esta es una perspectiva muy interesante para mí, ya que presupone que la intervención humana añade valor; de lo contrario, ¿por qué diablos alguien lo haría?

Para esta sección, voy a ignorar una discusión sobre si los humanos pueden (ocasionalmente o incluso a menudo) superar a un forecast automatizado (en términos de exactitud). De hecho, estoy dispuesto a conceder que, en cualquier SKU aislado, un humano puede desempeñarse tan bien o incluso mejor que un forecast automatizado en términos de exactitud.

Nota: No creo que esto sea cierto si consideramos el forecasting de decenas de miles de SKUs para cientos de tiendas, cada día, según una amplia supply chain1. En ese último escenario, un forecast automatizado supera significativamente a equipos enteros de pronosticadores y otros expertos funcionales increíblemente capacitados, simplemente porque la gran mayoría de los SKUs no pueden ser revisados manualmente debido a limitaciones de tiempo.

Hago esta concesión de que el juicio humano a veces puede igualar o superar al forecast automatizado por dos razones:

  1. En mi opinión, esto hace que el ensayo sea más interesante, y;

  2. La solidez de mi argumento no se basa en ninguna discusión sobre la “exactitud”.

Mi postura es, como probablemente ya puedas adivinar, que las intervenciones humanas solo “añaden valor” si… añaden valor financiero - un valor que perdura más que un solo ciclo de reabastecimiento de existencias. Esto es completamente independiente de cualquier beneficio en términos de exactitud.

Este valor puede entenderse como “produce directamente mejores decisiones de lo que se generaron originalmente - teniendo en cuenta las ganancias extra de la mejor decisión y restando el costo de la intervención”.

En pocas palabras, las intervenciones basadas en el juicio (las intervenciones humanas) son costosas, por lo que una compañía debería esperar ver un retorno de inversión significativo. Por lo tanto, mi argumento es que la exactitud del forecast es una métrica arbitraria (cuando se evalúa aislada de las decisiones), y las compañías deberían enfocarse en acciones que aumenten los retornos financieros.

La intervención humana muy bien puede aumentar la exactitud del forecast (nuevamente, hago esta concesión para el bien de la discusión), sin embargo no necesariamente aumenta el retorno financiero. Realmente, no debería ser una proposición radical, de la misma manera que alguien puede ser la persona más alta en una habitación y la más baja en otra.

Ten en cuenta que la responsabilidad no recae sobre mí para proporcionar evidencia de que una mayor exactitud no se traduce en mayores ganancias. Es, por definición, responsabilidad de quienes afirman que una mayor exactitud es por sí misma rentable proporcionar alguna evidencia concreta, directa e indiscutible para esa afirmación.

Nuevamente, esto no debería ser una posición radical o contraria a la corriente. En mi opinión, debería ser la postura por defecto de cualquiera que esté involucrado.

Ten en cuenta que, para que las intervenciones humanas sean rentables, debemos considerar la totalidad de las intervenciones. Es decir, sopesar el valor financiero generado por todos los “aciertos” y restar todas las pérdidas financieras ocasionadas por los “fallos”.

Este experimento también debería realizarse a gran escala, para una red enorme de tiendas (clientes empresariales en el caso de B2B) y a lo largo de todo su catálogo de SKUs, cada día, durante un tiempo considerable.

“¿Cuánto tiempo debería durar este experimento, Alexey?” Sobre esto, soy ambivalente. Digamos un año, pero estoy muy abierto a debatir este punto. Depende de muchas cosas, incluyendo el número de ciclos de decisión en un año, así como lead times, naturalmente.

Dicho esto, toda esta discusión plantea la cuestión de cuál es el umbral aceptable de error para la intervención humana.

  • Si los aciertos superan ligeramente a los fallos, ¿es eso aceptable?
  • ¿Qué hay del costo de las propias intervenciones humanas?
  • ¿Cómo vamos a tener en cuenta estos costos directos e indirectos en el cálculo?

Estas no son preguntas triviales, por cierto. Son el tipo de preguntas que un estudiante de primer año haría en cualquier curso introductorio en un campo STEM (o relacionado con STEM).

Hasta que alguien proporcione prueba definitiva de que la intervención humana, desplegada a gran escala, es financieramente rentable, la posición más inteligente desde el punto de vista económico es presumir que no lo es y continuar confiando en forecasts automatizados y toma de decisiones automatizada.

P4: ¿Cómo determinamos cuándo un forecast más exacto debería reemplazar al forecast actual para la toma de decisiones?

En resumen, la forma más sencilla de saberlo es considerar la siguiente pregunta: ¿resulta el nuevo forecast en mejores decisiones? La métrica de evaluación en este caso debería ser el retorno financiero de la inversión (ROI).

Para entrar en más detalles, el reemplazo debe efectuarse basado en la utilidad comparativa global del nuevo modelo (por ejemplo, ROI, aplicabilidad, mantenibilidad, etc.), no solo basado en su ganancia actual en exactitud. ROI es lo que orienta a la empresa hacia el éxito. La aplicabilidad, como demostraré a continuación, está diseñada con el ROI en mente. Recuerda: la exactitud es, si se persigue de forma aislada, un KPI arbitrario.

Por ejemplo, imagina que tenemos dos modelos: uno que puede lidiar explícitamente con el historial de faltante de stock y otro que ignora los faltante de stock (usando algunos trucos de preprocesamiento de datos). Podría darse el caso de que los faltante de stock no ocurrieran tan a menudo, y desde la perspectiva de la toma de decisiones ambos modelos funcionen casi de manera equitativa. Sin embargo, aún sería más prudente favorecer el modelo que puede lidiar con los faltante de stock. Esto se debe a que, si los faltante de stock comienzan a ocurrir con mayor frecuencia, este modelo será más confiable.

Esto demuestra otro aspecto de la filosofía de Lokad: correctness by design. Esto significa que, a nivel de diseño, nuestro objetivo es desarrollar un modelo que de forma proactiva considere –y sea capaz de responder a– tanto a eventos probables como improbables. Esto es de suma importancia porque las mayores penalizaciones financieras a menudo se encuentran en los extremos, es decir, en los eventos improbables.

Q5: ¿Cómo hacemos la transición de un modelo forecast a otro en producción?

Es importante recordar que el forecast es solo una parte del motor general de toma de decisiones. Como tal, actualizar algunas partes puede tener impactos menores o mayores en el rendimiento global del motor. La transición de un modelo antiguo a uno nuevo podría ser problemática, incluso si, en última instancia, el nuevo modelo generará mejores decisiones (y por ende, más beneficios).

Esto se debe a que las decisiones mejoradas en teoría pueden enfrentar restricciones sin precedentes en la realidad si se implementan demasiado rápido.

Por ejemplo, un nuevo forecast model puede ayudar a generar POs mucho mejoradas, pero el espacio requerido para almacenar el inventario adicional puede que aún no exista o los proveedores no puedan ajustar inmediatamente sus supply chains para satisfacer la demanda incrementada. Apresurarse a completar los POs ahora, en busca de beneficios inmediatos, puede resultar en pérdidas en otras áreas, como que el stock se dañe o se deteriore más rápido debido a la falta de un espacio warehouse adecuado (o límites en la capacidad de la fuerza laboral).

En tal escenario, podría ser prudente hacer una transición progresiva entre modelos. En la práctica, esto podría implicar colocar algunas órdenes de compra consecutivas ligeramente más grandes para corregir gradualmente las posiciones de stock, en lugar de aprobar de inmediato una única orden de compra enorme.

Las personas con experiencia práctica abordando el bullwhip effect (incluyendo a los defensores de DDMRP) deberían ver de inmediato por qué esta es una táctica acertada.

Reflexión final

Si has leído hasta aquí, aprecio tu atención. Si has discrepado durante el transcurso, la aprecio aún más.

Para aquellos que discrepan, permítanme un último intento: el valor significa más dinero, y más dinero proviene de mejores decisiones. En lo que a mí respecta, nada puede sustituir a las decisiones buenas (o mejores). No un forecast más exacto. No un proceso más eficiente de S&OP.

Si aún discrepan, está bien, pero al menos sabemos dónde nos encontramos ambos.

Gracias por leer.

Antes de irte

Aquí hay algunos recursos más que podrían resultarte útiles (especialmente si has discrepado conmigo):

Notas


  1. Las supply chains más grandes alcanzan cifras aún mayores: decenas de miles de tiendas en más de cien países con varios cientos de centros de distribución. Los catálogos de tales gigantes a menudo contienen cientos de miles (si no millones) de productos diferentes. ↩︎