“Para mejorar tu juego, debes estudiar el final antes que cualquier otra cosa; porque, mientras que los finales pueden estudiarse y dominarse por sí mismos, el medio juego y la apertura deben estudiarse en relación con el final.” Fuente: Últimas conferencias de ajedrez de Capablanca (1966), p. 23

Hace unas semanas, hablé en un panel en el 44º Simposio Internacional sobre Pronóstico en Dijon, Francia. El tema del panel fue Planificación de la demanda y el papel del juicio en el nuevo mundo de la IA/ML.

Como embajador de Lokad, puedes imaginar cuál era mi perspectiva:

  • la previsión y la toma de decisiones deberían ser completamente automatizadas;

  • la calidad de la previsión debería evaluarse desde la perspectiva de mejores decisiones;

  • el juicio humano debería utilizarse para mejorar la automatización (no ajustar las previsiones o decisiones).

una imagen de un tablero de ajedrez.

Curiosamente, mi posición sobre la automatización no provocó tanta discrepancia como podrías pensar. El moderador (Conor Doherty, Jefe de Comunicación de Lokad) y los otros panelistas (Sven Crone de iqast y Nicolas Vandeput de SupChains) estuvieron casi unánimemente de acuerdo en que este era el futuro de la previsión. La única discrepancia fue qué tan rápido podríamos llegar a este estado (nota: creo que ya estamos allí).

Lo que causó bastante discrepancia, y tal vez incluso confusión, fue mi argumento de que la exactitud de la previsión no es tan importante como tomar mejores decisiones. Esta discrepancia no se limitó a los otros panelistas, sino también a los miembros de la audiencia. Creo que hay dos razones principales para esto:

  1. Cuando hablé en el escenario, no tenía una visual para respaldar este punto. Hay algunas partes móviles en la explicación, por lo que una visual definitivamente habría ayudado a las personas a entender.

  2. La idea de que la exactitud de la previsión es menos importante que las decisiones contradice la educación, formación y experiencia de la mayoría de los profesionales.

Al final de este ensayo, espero haber abordado ambos puntos mencionados anteriormente. En cuanto al primer punto, he incluido una explicación breve pero sistemática y una visual intuitiva. En cuanto al segundo punto, solo puedo pedir al lector que mantenga la mente abierta durante los próximos 5 a 10 minutos y trate de abordar estas palabras como si no tuviera ninguna formación previa en la previsión de la cadena de suministro.

Preguntas orientadoras

En mi opinión, hay cinco preguntas fundamentales que deben responderse para aclarar mi posición. En esta sección, haré todo lo posible para proporcionar respuestas breves a cada una de ellas, la “esencia”, por así decirlo. Tenga la seguridad de que Lokad tiene una gran cantidad de recursos adicionales para explicar las cuestiones técnicas, a los que enlazaré al final del ensayo.

P1: ¿Qué significa que una previsión “agregue valor”?

Comenzaré de inmediato con un ejemplo. Supongamos que hay un mecanismo predeterminado para tomar decisiones en una empresa (por ejemplo, una previsión estadística automatizada + una política de inventario automatizada).

Para que una previsión modificada agregue valor, debe cambiar una decisión predeterminada (generada utilizando el proceso predeterminado de la empresa) de una manera que afecte directa y positivamente los retornos financieros de la empresa (es decir, dólares, libras o euros de retorno).

Si una previsión es más precisa (en términos de predecir la demanda real) pero no resulta en una decisión diferente y mejor, entonces no ha agregado valor.

Muchas empresas todavía utilizan modelos de previsión de series temporales, mientras que Lokad prefiere pronósticos probabilísticos para ayudar a generar decisiones ajustadas al riesgo. Sin embargo, el mismo estándar se aplica a ambos paradigmas de pronóstico. Para que cualquier tipo de pronóstico agregue valor, debe alterar una decisión predeterminada de una manera que afecte directa y positivamente los retornos financieros de una empresa.

Por ejemplo, una nueva decisión (“alterada”) podría eliminar directamente un futuro faltante de stock que la decisión predeterminada habría presentado.

Aquí es crítico el término “directamente”. En términos muy simples, la previsión solo agrega valor si se puede señalar el cambio de decisión exacto que influyó en los retornos financieros adicionales o evitó pérdidas financieras (en comparación con la decisión predeterminada).

Piense en la causalidad, no en la correlación.

P2: ¿Una previsión más precisa siempre agrega valor?

Técnicamente, no. Una previsión más precisa, en sí misma, no necesariamente “agrega valor”. Esto se debe a que, como se mencionó anteriormente, para que algo (en este caso una previsión) agregue valor, debe afectar directa y positivamente los retornos financieros de una empresa a través de una mejor decisión.

A diferencia de las previsiones, las decisiones de la cadena de suministro tienen restricciones de viabilidad (por ejemplo, cantidades mínimas de pedido, multiplicadores de lote, tamaños de lote, etc.) e incentivos financieros (por ejemplo, descuentos de precios, condiciones de pago, etc.). Puede haber muchas más previsiones de las que hay decisiones viables.

Esto significa que las decisiones de la cadena de suministro pueden ser ocasionalmente (y muy a menudo) insensibles a los cambios en la precisión de la previsión. Esto es válido tanto para las previsiones de series temporales como para las previsiones probabilísticas.

La razón de esta insensibilidad se debe a las restricciones en la toma de decisiones (por ejemplo, cantidades mínimas de pedido). Es perfectamente posible que una previsión más precisa (por ejemplo, un 10% más precisa) conduzca a la misma decisión que una menos precisa. El gráfico a continuación ilustra este punto.

Un gráfico que ilustra la falta de impacto de la precisión de la previsión en las decisiones bajo la presencia de cantidades mínimas de pedido.

En el ejemplo anterior, supongamos que la previsión de consenso de 55 unidades fue más precisa que la previsión automatizada de 50 unidades. Desde una perspectiva financiera, la mayor precisión no resultó en una decisión diferente (debido a la presencia de una cantidad mínima de pedido). Por lo tanto, la previsión más precisa no agregó valor.

De hecho, hay un argumento sólido de que la previsión de consenso más precisa resultó en un valor agregado negativo. Esto se debe a que los pasos adicionales de revisión (según un proceso estándar de Valor Agregado de la Previsión) cuestan dinero (tiempo y esfuerzo adicionales) para la empresa, pero no resultaron en una mejor decisión. Desde una posición puramente financiera, esos pasos de revisión manual fueron un saldo negativo.

También consideremos un caso en el que no hay restricción de cantidad mínima de pedido.

Imagina el mismo escenario general, pero en lugar de una cantidad mínima de pedido, hay un multiplicador de lote. Las decisiones factibles son incrementos de 50 unidades (por ejemplo, 50 unidades en una caja o en un palet). En esta situación, tendríamos que comprar 50 o 100 unidades (1 o 2 cajas o palets).

Un gráfico que ilustra la falta de impacto de la precisión de la previsión en las decisiones bajo la presencia de multiplicadores de lote para la compra de bienes.

En realidad, podría ser menos rentable comprar 100 unidades (cubriendo la sugerencia de la previsión de consenso de 55 unidades) que comprar 50 unidades (ligeramente menos de lo que sugiere la previsión “más precisa”). Se podría intentar cubrir la demanda restante con backorders o simplemente perder ventas (por ejemplo, si se venden productos perecederos como alimentos frescos).

Desde una perspectiva económica, la mejor decisión financiera podría no ser seguir la previsión “más precisa”. En este escenario, tanto la previsión automatizada (50 unidades de demanda) como la previsión de consenso (55 unidades de demanda) resultan en la misma decisión (pedir 50 unidades). Por lo tanto, la previsión “más precisa” no resultó en un aumento del valor financiero.

Es cierto que no todas las situaciones son igualmente estrictas en cuanto a restricciones, sin embargo, la cadena de suministro está llena de este tipo de escenarios. Por supuesto, concedo que diferentes previsiones darán lugar a decisiones diferentes, pero la pregunta del valor sigue abierta. En todo momento, debemos considerar si el retorno adicional esperado de la compra de unidades adicionales es mayor que los recursos adicionales consumidos para mejorar la precisión de la previsión.

Tal vez la mayor precisión valga la pena en algunas situaciones. Sin embargo, los pronosticadores y los profesionales de la cadena de suministro parecen asumir reflexivamente que lo vale en términos absolutos, a pesar de que hay escenarios obvios en los que no lo es.

Un gráfico que ilustra la dificultad de evaluar el impacto financiero de la precisión de la previsión en una situación sin restricciones.

Si has pensado en un escenario que no se ajusta perfectamente a los ejemplos descritos aquí, está bien. Recuerda, el objetivo hoy es demostrar un punto general (que hay situaciones en las que no vale la pena buscar una mayor precisión de la previsión), no analizar en profundidad cada posible escenario de toma de decisiones de la cadena de suministro.

P3: ¿Cómo podemos asegurarnos de que el valor obtenido vale el costo de la intervención basada en juicio?

Un elemento fundamental de la discusión del panel en Dijon fue el valor (o no) de la intervención basada en juicio (o “anulaciones humanas”) en el proceso de previsión. Parafraseando el otro lado, “tenemos que tener personas en el proceso para corregir cuando la previsión automatizada ha pasado por alto algo”.

Esta es una perspectiva muy interesante para mí, ya que presume que la anulación humana agrega valor, de lo contrario, ¿por qué diablos alguien lo haría?

Para esta sección, voy a ignorar una discusión sobre si los humanos pueden (ocasionalmente o incluso a menudo) superar una previsión automatizada (en términos de precisión). De hecho, estoy dispuesto a conceder que, en cualquier SKU aislado, un humano puede desempeñarse tan bien o incluso mejor que una previsión automatizada en términos de precisión.

Nota: No creo que esto sea cierto si consideramos la previsión de decenas de miles de SKUs para cientos de tiendas, todos los días, según una cadena de suministro considerable1. En este último escenario, una previsión automatizada supera significativamente a equipos enteros de pronosticadores increíblemente hábiles y otros expertos funcionales simplemente porque la gran mayoría de los SKUs no se pueden revisar manualmente debido a restricciones de tiempo.

Estoy haciendo esta concesión de que el juicio humano a veces puede igualar o superar la previsión automatizada por dos razones:

  1. En mi opinión, hace que el ensayo sea más interesante, y;

  2. La fuerza de mi argumento no se basa en ninguna discusión sobre “precisión”.

Mi posición es, como probablemente puedas adivinar en este momento, que las anulaciones humanas solo “agregan valor” si…agregan valor financiero - valor que dura más que un solo ciclo de reorden. Esto es completamente independiente de cualquier beneficio de precisión.

Este valor se puede entender como “produce directamente mejores decisiones que las generadas originalmente, teniendo en cuenta las ganancias adicionales de la mejor decisión y restando el costo de la anulación”.

En pocas palabras, las intervenciones basadas en juicio (anulaciones humanas) son costosas, por lo tanto, una empresa debería esperar ver un retorno de inversión significativo. Por lo tanto, mi argumento es que la precisión de la previsión es una métrica arbitraria (cuando se evalúa aislada de las decisiones) y las empresas deberían centrarse en acciones que aumenten los retornos financieros.

La anulación humana puede aumentar la precisión de la previsión (nuevamente, hago esta concesión por el bien de la discusión), sin embargo, no necesariamente aumenta el retorno financiero. Esto realmente no debería ser una proposición radical, de la misma manera que alguien puede ser la persona más alta en una habitación y la más baja en otra.

Ten en cuenta que la responsabilidad no recae sobre mí de proporcionar evidencia de que un aumento en la precisión no se traduce en mayores ganancias. Es, por definición, responsabilidad de las personas que argumentan que un aumento en la precisión es por sí mismo rentable proporcionar alguna evidencia concreta, directa e indiscutible para esta afirmación.

Nuevamente, esto no debería ser una posición radical o contraria. Debería, en mi opinión, ser la posición predeterminada de cualquier persona “con algo en juego”.

Ten en cuenta que, para que las anulaciones humanas sean rentables, debemos tener en cuenta la totalidad de las anulaciones. Es decir, evaluar el valor financiero generado por todos los “aciertos” y restar todas las pérdidas financieras causadas por los “errores”.

Este experimento también debería realizarse a gran escala, para una enorme red de tiendas (clientes empresariales en el caso de B2B) y en todo su catálogo completo de SKU, todos los días, durante un período considerable de tiempo.

“¿Cuánto tiempo debería durar este experimento, Alexey?” En esto, soy ambivalente. Digamos un año, pero estoy muy abierto a discutir este punto. Depende de muchas cosas, incluido el número de ciclos de decisión en un año, así como los tiempos de entrega, naturalmente.

Dicho esto, toda esta discusión plantea la pregunta de cuál es el umbral aceptable de error para la anulación humana.

  • Si los aciertos superan ligeramente a los errores, ¿es eso aceptable?
  • ¿Qué hay del costo de las anulaciones humanas en sí mismas?
  • ¿Cómo debemos tener en cuenta estos costos directos e indirectos en el cálculo?

Estas no son preguntas triviales, por cierto. Son el tipo de preguntas que un estudiante de primer año haría en cualquier curso introductorio en un campo STEM (o relacionado con STEM).

Hasta que alguien proporcione pruebas definitivas de que la anulación humana, implementada a gran escala, es financieramente rentable, la posición económicamente más inteligente es suponer que no lo es y seguir confiando en las previsiones automatizadas y la toma de decisiones automatizada.

P4: ¿Cómo determinamos cuándo una previsión más precisa debe reemplazar la previsión actual con fines de toma de decisiones?

En resumen, la forma más fácil de saberlo es considerar la siguiente pregunta: ¿la nueva previsión resulta en mejores decisiones? La métrica de evaluación en este caso debería ser el retorno de la inversión financiera (ROI).

Para ser un poco más detallados, el reemplazo debe hacerse en función de la utilidad comparativa general del nuevo modelo (por ejemplo, ROI, aplicabilidad, mantenibilidad, etc.), no solo en función de su ganancia actual de precisión. El ROI es lo que guía a la empresa en la dirección del éxito. La aplicabilidad, como demostraré a continuación, está diseñada teniendo en cuenta el ROI. Recuerda: la precisión es, si se persigue de forma aislada, un KPI arbitrario.

Por ejemplo, imagina que tenemos dos modelos: uno que puede manejar el historial de faltantes de stock explícitamente y otro que ignora los faltantes de stock (utilizando algunos trucos de preprocesamiento de datos). Puede ser el caso de que los faltantes de stock no ocurrieron con tanta frecuencia y, desde una perspectiva de toma de decisiones, ambos modelos funcionan casi igual. Sin embargo, aún sería más prudente favorecer el modelo que puede manejar los faltantes de stock. Esto se debe a que, si los faltantes de stock comienzan a ocurrir con más frecuencia, este modelo será más confiable.

Esto demuestra otro aspecto de la filosofía de Lokad: corrección por diseño. Esto significa que, a nivel de diseño, buscamos diseñar un modelo que considere de manera proactiva, y sea capaz de responder, tanto a eventos probables como improbables. Esto es de suma importancia porque las mayores penalizaciones financieras a menudo se encuentran en los extremos, es decir, en los eventos improbables.

P5: ¿Cómo hacemos la transición de un modelo de pronóstico a otro en producción?

Es importante recordar que el pronóstico es solo una parte del motor de toma de decisiones en general. Como tal, actualizar algunas partes puede tener impactos menores o mayores en el rendimiento general del motor. La transición de un modelo antiguo a uno nuevo puede ser problemática, incluso si el nuevo modelo finalmente generará mejores decisiones (y, por lo tanto, más ganancias).

Esto se debe a que las decisiones mejoradas en teoría pueden enfrentar restricciones sin precedentes en la realidad si se implementan demasiado rápido.

Por ejemplo, un nuevo modelo de pronóstico puede ayudar a generar órdenes de compra mucho mejores, pero es posible que el espacio necesario para almacenar el inventario adicional aún no exista o que los proveedores no puedan ajustar de inmediato sus cadenas de suministro para satisfacer la demanda aumentada. Apresurarse a completar las órdenes de compra ahora, en busca de ganancias inmediatas, puede resultar en pérdidas en otros lugares, como daños en el stock o una mayor pérdida debido a la falta de espacio adecuado en el almacén (o límites de capacidad de la fuerza laboral).

En un escenario así, podría ser prudente hacer una transición progresiva entre modelos. En la práctica, esto podría implicar realizar algunas órdenes de compra consecutivas ligeramente más grandes para corregir gradualmente las posiciones de stock, en lugar de pasar inmediatamente a una única orden enorme.

Las personas con experiencia práctica en abordar el efecto látigo (incluidos los defensores de DDMRP) deberían ver de inmediato por qué esta es una táctica inteligente.

Reflexión final

Si has llegado hasta aquí, agradezco tu atención. Si has estado en desacuerdo en el camino, agradezco aún más tu atención.

Para aquellos que no están de acuerdo, permíteme un último intento: el valor significa más dinero, y más dinero proviene de mejores decisiones. En lo que a mí respecta, nada puede sustituir a las decisiones buenas (o mejores). Ni un pronóstico más preciso. Ni un proceso de S&OP más eficiente.

Si aún no estamos de acuerdo, está bien, al menos sabemos dónde estamos parados ambos.

Gracias por leer.

Antes de que te vayas

Aquí tienes algunos recursos adicionales que podrían serte útiles (especialmente si has estado en desacuerdo conmigo):

Notas


  1. Las cadenas de suministro más grandes representan números aún mayores: decenas de miles de tiendas en más de cien países con varios cientos de centros de distribución. Los catálogos de estos gigantes a menudo contienen cientos de miles (si no millones) de productos diferentes. ↩︎