Pronóstico probabilístico generalizado

Pronósticos probabilísticos generalizados











Inicio » Recursos » Aquí

La optimización de la cadena de suministro depende de la capacidad de anticipar las necesidades futuras del mercado. Y fue a partir del siglo XX que el pronóstico de la demanda se identificó como un ingrediente clave del proceso de optimización de la cadena de suministro. Sin embargo, la perspectiva clásica del pronóstico estaba determinada principalmente por el acceso limitado a los recursos informáticos. De hecho, algunos de los primeros métodos de pronóstico estaban incluso adaptados para los cálculos manuales. El acceso a una gran cantidad de recursos informáticos de la actualidad ha cambiado drásticamente la visión del pronóstico. Una ventaja inmediata es la mayor precisión de los pronósticos, junto con el hecho de que estos son más expresivos. Si bien puede parecer contraintuitivo, es este último aspecto el responsable de la mayoría de las mejoras de rendimiento de la cadena de suministro. Este tipo perfeccionado de pronósticos se conoce como pronósticos probabilísticos. Al combinar el punto de vista probabilístico con el conjunto de herramientas modernas ofrecidas por el machine learning —ambos algoritmos y su contrapartida de software—, la cadena de suministro puede abordar una gama mucho más amplia de desafíos que las metodología de cadena de suministro anteriores, que giraban en torno a la noción de los pronósticos clásicos.

Pronóstico clásico y sus limitaciones

Con pronósticos clásicos nos referimos al concepto de pronósticos de media de series de tiempo periódicos y regulares. Este tipo específico de pronóstico sigue siendo dominante en el mundo de la cadena de suministro y de la planificación de la demanda. Si bien este tipo de pronóstico suscita un interés práctico limitado desde el punto de vista moderno de la optimización de la cadena de suministro, su considerable importancia histórica ha dado forma a muchas metodologías de cadena de suministro, y sirve de base aún hoy para muchas de ellas. Como resultado, esas metodologías heredan las limitaciones de los pronósticos clásicos.

Veamos más en detalle esta perspectiva clásica del pronóstico:

  • Media: El pronóstico intenta calcular la media de la demanda futura; es decir, un pronóstico equilibrado tiene el 50 % de la masa de demanda futura que está por encima del pronóstico, y un 50 % que se encuentra por debajo. Es posible probar matemáticamente que el cálculo de la media es equivalente al mínimo cuadrado.
  • Periódico: La demanda futura se divide en períodos, como día, semana, mes o año. El pronóstico toma la forma de un vector real. La dimensión del vector se denomina comúnmente horizonte. Por ejemplo, cuando se pronostica a diez semanas, el período es la semana, mientras que el horizonte es 10.
  • Regular: Se supone que los períodos mantienen propiedades uniformes y, en particular, que son de duración idéntica. Esta suposición es válida para los períodos de días y semanas; sin embargo, es solo vagamente correcto para meses y años. A pesar de la aproximación, el proceso numérico de los períodos no diferencia los períodos entre sí y supone una uniformidad total.
  • Series de tiempo: Se supone que los datos históricos tienen el mismo formato que el pronóstico que se producirá. En particular, los datos históricos se modelan como un vector real relacionado con el mismo período que se ha seleccionado para el pronóstico. La longitud del vector de entrada está limitada por el detalle de los datos históricos disponibles.

A veces, el estimador de media se reemplaza por la mediana. En el caso de la mediana, un pronóstico equilibrado tiene un 50 % de probabilidad de estar por encima o por debajo de la demanda futura, independientemente de la masa de demanda. La optimización de un estimador para obtener la mejor mediana es equivalente a la minimización del error medio absoluto (el equivalente de los mínimos cuadrados para la media). En lo que concierne al tema actual, da igual que se consideren los pronósticos de media o de mediana, o que la métrica sea el MAPE (error absoluto medio relativo) o una versión ponderada del MAPE. Por lo tanto, para simplificar, nos referiremos a todos los pronósticos como clásicos, incluyendo en esta categoría a todas las variantes menores.

Esos tipos de pronósticos están tan integrados en el mundo de la cadena de suministro que dar un paso atrás y considerar las implicaciones de esta perspectiva exigiría un esfuerzo considerable. Como evidencia anecdótica, varias soluciones de software líderes codifican esos pronósticos clásicos en sus arquitecturas, con tablas de base de datos que contienen 52 columnas, cada una de las cuales se asocia a una semana específica. Al hacer esto, la misma arquitectura de esas soluciones de software no logra ver todas las clases de optimización de cadena de suministro.

Incertidumbre: la incómoda realidad

La demanda futura viene con un alto grado de incertidumbre inevitable: la mayoría de los eventos que afectan a los mercados capitalistas simplemente no pueden modelarse de modo determinista. Su empresa no puede proyectar cuándo su competidor bajará los precios, con una recaptación inmediata de cuotas de mercado. Su empresa no puede prever un accidente industrial grave en un puerto de China, que dejará a un proveedor clave imposibilitado de entregar sus productos a tiempo. Su empresa ni siquiera puede predecir si una nueva tecnología que se está desarrollando internamente resultará ser una alternativa superior a la tecnología que se utiliza actualmente.

No obstante, si bien esta incertidumbre irreducible del estado futuro de los mercados parece obvia a posteriori, resulta peculiar que los pronósticos clásicos desestimen casi por completo el desafío en lugar de afrontarlo. De hecho, desde la perspectiva del pronóstico clásico, la incertidumbre está ausente. En la práctica, la precisión de los pronósticos puede calcularse a través de técnicas como el análisis retrospectivo, pero es un proceso externo desvinculado del proceso de pronóstico.

Debido a que la incertidumbre se ignora, muchas situaciones simplemente no pueden expresarse en los pronósticos. Por ejemplo, consideremos el caso de un mayorista que sirve a un par de redes minoristas grandes. Un determinado producto puede aparecer asociado con una demanda muy estable, ya que el producto se pide de modo consistente todas las semanas en cantidades que se mantienen relativamente estables en el tiempo. Sin embargo, ahondando en la estructura de la demanda, los pedidos en realidad provienen todos de una sola red minorista. Por lo tanto, si el mayorista resulta eliminado de esta red minorista para este producto específico, la demanda se reduciría a cero, lo que haría que el stock remanente del mayorista se convirtiera inmediatamente en stock muerto. Por lo tanto, aunque la demanda promedio proyectada para el producto puede ser alta, el riesgo de que la demanda de repente se reduzca a cero es real. Este riesgo no puede modelarse mediante la simple reducción de la demanda promedio. Los pronósticos clásicos no logran expresar esta situación bimodal: un modo es más de lo mismo, mientras que el otro modo es terminación.

Sesgos conocidos en el historial de demanda

La perspectiva de las series de tiempo sobre un pronóstico de demanda supone que el registro que tenemos de la demanda histórica refleja de modo adecuado la demanda misma. Sin embargo, en la práctica, esta suposición raramente se verifica, ya que la demanda del mercado solo se observa indirectamente. Este punto es sutil, pero importante en la práctica: el historial de los pedidos del cliente es solo una aproximación de la demanda del mercado, no la demanda real del mercado, que es en cierta medida desconocida. Por ejemplo, cada vez que la empresa se enfrenta a una situación de desabastecimiento, el cliente comienza a buscar en otros lugares para obtener sus productos. Las cantidades adquiridas a través de canales alternativos para mitigar la situación de desabastecimiento no se verá reflejada en el historial de ventas, lo que genera sesgos.

Y estos sesgos están por todas partes. Aún suponiendo una situación en la que todas las demandas del cliente se registraran, sin importar si esas demandas se han satisfecho a tiempo o no, existirían sesgos. Consideremos, por ejemplo, un almacén regional que sirve a una lista de tiendas minoristas. Cada tienda envía un pedido a diario al almacén para su reabastecimiento. Los pedidos no tienen en cuenta la disponibilidad de stock del almacén; es responsabilidad del almacén esforzarse al máximo para servir a todas las tiendas de modo justo de acuerdo con el stock físicamente disponible. En esta situación, si un pedido de una tienda no puede satisfacerse en el día 1, como es habitual, este pedido se posterga al día 2, se vuelve un poco más grande y sigue enfrentándose a la misma situación de desabastecimiento, que continúa plagando el almacén. No obstante, este proceso crea otro artefacto: al enfrentarse a una situación de desabastecimiento, las tiendas prácticamente realizan muchos más pedidos de los que harían en otra situación, porque continúan reordenando las mismas cantidades que no están siendo entregadas. Por lo tanto, si bien todo se registra, las cantidades pedidas totales no pueden interpretarse como un reflejo apropiado de la demanda. En la práctica, la situación se complica más debido a las consecuencias de las situaciones de desabastecimiento del almacén que, a su vez, generan desabastecimientos en la tienda, cuyo efecto sobre los clientes que recorren los pasillos de la tienda tampoco se registra.

Considerando las herramientas estadísticas modernas que están disponibles actualmente, el problema no reside tanto en la existencia de sesgos, sino en la incapacidad de la perspectiva de pronóstico clásico para incluir esos sesgos. De hecho, la perspectiva de series de tiempo no solo es simple, sino que es simplista. Además, los datos de entrada modelados como vector real asociados con períodos pasados no pueden reflejar la información que podría estar disponible sobre esos sesgos. Como resultado, para mitigar el problema, el pronóstico clásico generalmente implica algunos pasos de preprocesamiento que utilizan de modo recurrente el proceso de pronóstico mismo para llenar los huecos durante los períodos en los que se sabe que la demanda está muy sesgada; es decir, reemplazando los ceros generados por una situación de desabastecimiento por los valores de demanda que habían sido pronosticados originalmente para esas fechas. Aún así, al hacer esto, la empresa acaba por construir pronósticos sobre pronósticos, que resultan doblemente ineficientes. En primer lugar, la método del pronóstico sobre pronóstico es la receta perfecta para generar pronósticos muy imprecisos. En segundo lugar, complica aún más la fase de preparación de datos, que ya es la parte más complicada del modelado cuantitativo.

El pronóstico no es solo la demanda futura

La perspectiva de pronóstico de series de tiempo ha llegado a ser tan dominante en el historial de la cadena de suministro que a menudo a llevado a lo que podríamos llamar un problema de martillo de oro: si solo se tiene un martillo, todo se convierte en un clavo. La demanda futura es solo uno de los muchos elementos que deben pronosticarse, y un pronóstico de serie de tiempo es solo uno de los métodos que pueden utilizarse para ejecutar el pronóstico.

Los plazos de entrega son de importancia primaria. El inventario mantenido por una empresa solo es apropiado si las cantidades mantenidas en stock son los suficientemente grandes como para cubrir la demanda durante el plazo de entrega. Almacenar más stock es innecesario, porque el stock ya se habrá reabastecido para ese momento. Sin embargo, los tiempos de entrega en sí mismo muestran comportamientos complicados. Suponer que el tiempo de entrega del proveedor es de 7 días solo porque está escrito en el contrato es ineficiente y peligroso. Es ineficiente porque los proveedores tienden a negociar los tiempos de entrega que se sienten capaces de cumplir incluso en circunstancias adversas; es decir, en el peor de los casos. Aún así, en la práctica, es frecuente ver que los proveedores, en promedio, se anticipan ampliamente a los tiempos de entrega contractuales. Además, es peligroso, porque si un proveedor sistemáticamente no cumple con sus tiempos de entrega contractuales, el resto de la cadena de suministro seguirá haciendo de cuenta que todo está bien y desestimará cualquier intento de mitigar los problemas causados por este proveedor.

Por lo tanto, los tiempos de entrega deben pronosticarse. Al igual que la demanda, los tiempos de entrega pueden pronosticarse sobre la base de los datos históricos y, al igual que la demanda, estos muestran patrones estadísticos complejos, como la estacionalidad, que puede utilizarse para perfeccionar los pronósticos. Por ejemplo, es probable que los tiempos de entrega de fabricantes de China aumenten de entre 3 y 4 semanas cada año en la época del Año Nuevo Chino, simplemente porque las fábricas se cierran durante esa época.

Además de los tiempos de entrega y la demanda, existen muchos otros elementos de cadena de suministro que también requieren de algún tipo de pronóstico. Por ejemplo, tenemos los siguientes:

  • Devoluciones de cliente: en el sector de la moda y el comercio electrónico, un cliente puede devolver una parte importante de los productos que pide. Por ejemplo, en Alemania, es habitual que los clientes pidan varios pares de zapatos para luego devolver las tallas que no les quedan bien. Existen muchas situaciones en las que las cantidades devueltas superan el 30 % de la cantidad del pedido original. Es por eso que también deberían pronosticarse las cantidades por devolver.
  • Productos recibidos no vendibles: en el sector de alimentos minorista, los productos son frágiles y perecederos, y es frecuente que una parte importante de la mercancía recibida por el almacén no pase los controles de calidad. Por ejemplo, es probable que la mitad de las cajas de fresas recibidas por un almacén se desechen en el lugar, porque el producto ya no se considera vendible. Al enviar pedidos de compra a los proveedores, es importante tener en cuenta la fracción de mercancía que se espera que no pase los controles de calidad. Por lo tanto, el pronóstico de cuánto será rechazado es altamente relevante.
  • Imprecisiones del registro electrónico: en el sector minorista, la precisión de inventario en la tienda a menudo es bastante baja. De hecho, los clientes pueden dañar, robar o simplemente desplazar productos dentro de la tienda, lo que crea discrepancias entre el registro electrónico de los niveles de stock y el nivel de stock físico real en anaquel. Las discrepancias entre el nivel de stock real y los niveles electrónicos pueden proyectarse utilizando el historial de correcciones de stock generadas por el proceso de recuento de stock.

De acuerdo con el sector, existen muchos otros problemas que requieren algún tipo de pronóstico o de cálculo estadístico predictivo. Es importante identificar esos problemas como tales, porque, de lo contrario, la cadena de suministro sigue operando según reglas que pueden no ser adecuadas, sin ponerse nunca en una posición que le permita hacer un benchmark y mejorar esas reglas.

Pronóstico generalizado con machine learning

Durante las últimas décadas, el campo del machine learning, que puede verse como una intersección entre la ciencia informática y la estadística, ha dado pasos agigantados. Lejos de haber alcanzado el apogeo, el machine learning sigue progresando más rápidamente que nunca, impulsado por los recientes descubrimientos en deep learning. El campo del machine learning ha adquirido una gran estructura, tanto de implementaciones de software como de información estratégica cuantitativa para extraer y aprovechar conocimiento que se halla en conjuntos de datos de toda clase. Si bien el machine learning en sí excede los objetivos de este documento, es importante comprender las implicaciones en lo que tiene que ver con la cadena de suministro cuantitativa.

El machine learning ofrece un método de gestión prácticamente cualquier conjunto de datos lo suficientemente grande de un modo sistemático. Más datos no hacen más complicado el desafío sino que, al contrario, lo simplifican. Este dato estratégico es muy importante y contraintuitivo desde el punto de vista de la cadena de suministro clásica. De hecho, muchos profesionales de la cadena de suministro, al enfrentarse a un desafío complejo de cadena de suministro, caen en la tentación de reducir el alcance para hacer que el problema sea más gestionable. Sin embargo, desde una perspectiva de machine learning, una menor cantidad de datos casi siempre implica que el experto de datos deberá trabajar más para obtener algoritmos que funcionen a pesar de las limitaciones del conjunto de datos. Los algoritmos de machine learning —todos ellos— están diseñados para funcionar mejor con más datos. Se podría decir que muchos de los mayores éxitos operativos en machine learning, incluido el reconocimiento vocal o la traducción automática, por nombrar algunos, se lograron porque finalmente se pudieron procesar conjuntos de datos mucho más grandes, comparados con intentos anteriores.

Una vez que se han reunido datos relevantes suficientes, el machine learning proporciona varios métodos que casi no requieren adaptaciones para comenzar a generar tipos de pronósticos muy diversos. La eliminación de casi toda la adaptación manual de los pipelines de datos potenciados por el machine learning es el resultado de décadas de esfuerzo de todo el sector, tanto en ámbitos académicos como en la industria del software. Actualmente, la mayoría de los métodos de machine learning requieren muy pocos ajustes manuales. En realidad, la comunidad del machine learning es cada vez más escéptica con respecto a la sostenibilidad de cualquier método que requiera más que algunos ajustes manuales superficiales. Esta posición ha alimentado muchos de los éxitos más importantes en los campos del machine learning y es especialmente fuerte en el deep learning. Atención: si bien los algoritmos de machine learning casi no necesitan ajustes, la preparación de los datos requiere un esfuerzo considerable. No obstante, esos esfuerzos no tienen que ver con el tipo de algoritmos de machine learning que se utilizan en fases sucesivas del pipeline de datos.

Por lo tanto, recomendamos a los profesionales de la cadena de suministro que se mantengan escépticos ante cualquier solución predictiva estadística que ofrezca siquiera la posibilidad de ajustar los pronósticos manualmente. De hecho, una función de este tipo indica que el diseño de la solución subestima algunos de los datos estratégicos más importantes adquiridos en el machine learning. En la práctica, es casi una garantía de que la solución padecerá los mismos problemas que los primeros sistemas informáticos basados en reglas, que resultan ser casi imposibles de mantener hace algunas décadas.

Una ventaja clave de la cadena de suministro predictiva obtenida de los avances en el machine learning es que la generación de diferentes tipos de pronóstico no requiere más esfuerzo que el de elaborar pronósticos de demanda tradicionales. Casi todos los esfuerzos se concentran en la preparación de los datos y, más adelante, en alinear la organización de la empresa para aprovechar al máximo esas nuevas versiones de pronóstico disponibles.

La cadena de suministro cuantitativa utiliza el machine learning para introducir capacidades de cadena de suministro predictiva cuando es relevante y factible. En lugar de concentrarse en los pronósticos de demanda puros, la cadena de suministro cuantitativa busca confrontar todas las fuentes de incertidumbre de la cadena de suministro: tiempos de entrega, defectos de producción, cambios en el mercado, etc. Tras bambalinas, la cadena de suministro cuantitativa hace un uso extensivo de las tecnologías de machine learning, que permiten la generación de diferentes tipos de pronósticos que puedan adecuarse de modo preciso a los requisitos de la cadena de suministro. Este abordaje es muy diferente del de la perspectiva clásica, que fuerza a los pronósticos de demanda semanales o mensuales para que den respuestas a problemas vagamente relacionados.

Pronósticos probabilísticos para hacer frente a la incertidumbre

Al enfrentarse a la incertidumbre irreducible, como a menudo sucede al observar el futuro pensando en cadenas de suministro complejas, es muy deseable pronosticar no solo el resultado futuro más probable, sino también varios resultados alternativos. El pronóstico probabilístico es la formalización estadística más popular de este dato estratégico. Este genera un cálculo estadístico de todos los resultados posibles: este estimador generalizado adopta la forma de una distribución de probabilidad asociada con todos los resultados posibles. El pronóstico probabilístico puede considerarse una variante más bien extrema de la metodología de escenarios hipotéticos, en la que se tienen en cuenta todos los escenarios.

Si bien el pronóstico probabilístico puede parecer un abordaje un tanto teórico, en realidad es manejable y directo. Pensemos en un pronóstico de demanda probabilístico. En lugar de calcular un solo número que represente el valor esperado de la demanda futura promedio, calculamos una lista de probabilidades: la probabilidad de observar 0, 1, 2, 3. etc. unidades de demanda. Para visualizar todas las probabilidades, el abordaje más común es el de utilizar un histograma en el que cada cubo representa la probabilidad asociada con un nivel de demanda específico. Se dice que las probabilidades reunidas forman una distribución de probabilidad.

Image

El pronóstico de distribuciones de probabilidades, es decir, el pronóstico probabilístico, es una generalización del pronóstico de media o de mediana tradicional. Si bien puede parecer mucho más complejo, es un abordaje estadístico bien establecido que ya se utiliza ampliamente en muchos ámbitos. Por ejemplo, casi todos los últimos avances en deep learning, que están haciendo realidad los automóviles sin conductor, están aprovechando la perspectiva probabilística en su núcleo (y, más específicamente, una perspectiva Bayesiana, que excede el objetivo de este documento). La práctica del pronóstico probabilístico es bien conocida: se han publicado miles de estudios académicos sobre el tema y existen varias implementaciones de software disponibles.

La cadena de suministro cuantitativa pone el énfasis en el pronóstico probabilístico como la forma preferida de pronóstico. De hecho, en la cadena de suministro, no son las situaciones promedio las que cuestan dinero, sino aquellas extremas: una demanda inesperadamente alta que tiene como resultado una situación de desabastecimiento o una demanda inesperadamente baja que crea excedente de stock. Los pronósticos probabilísticos afrontan este problema directamente, entregando probabilidades para todas las situaciones posibles, incluidas aquellas problemáticas. El pronósticos probabilístico es el pilar de la gestión de riesgos estructurada en la cadena de suministro. A través de esos pronósticos, resulta posible mitigar los problemas de modo rentable. De hecho, la cadena de suministro tiene que ver con los compromisos: generalmente, la inexistencia de desabastecimientos implica un inventario infinito, algo que claramente no es una opción razonable. Sin los pronósticos probabilísticos, comparar el costo del stock con respecto al costo de la situación de desabastecimiento es una mera adivinanza.

Una desventaja menor de los pronósticos probabilísticos es que tienden a requerir un uso mucho más intensivo de recursos informáticos que los métodos de pronóstico simples. En particular, si bien es posible implementar un modelo de pronóstico clásico (por ej.: el alisado exponencial) en Microsoft Excel, muchos, si no la mayoría, de los modelos de pronóstico probabilístico requieren más recursos informáticos que los que pueden incluirse en una hoja de cálculo. No obstante, con la llegada de la computación en la nube, los recursos informáticos se han vuelto mucho más económicos que nunca: actualmente, algunas plataformas de computación en la nube ya ofrecen precios al público por debajo de los USD 10 por 1000 horas de cálculo en un servidor de un solo núcleo de alto nivel de 2 GHz. Sin embargo, en la práctica, para aprovechar una potencia de procesamiento a tan bajo costo, el software que respalda el proceso de pronóstico probabilístico debe tener que haber sido diseñado desde el comienzo para operar dentro de plataformas de computación en la nube.

Una vez más, la mayoría de los algoritmos de pronóstico probabilístico se derivan de los datos estratégicos y los hallazgos del amplio campo del machine learning. No obstante, así como no es necesario ser un experto en el tema para disfrutar de los beneficios de un filtro de correo no deseado —potenciado por el machine learning— para mantener su bandeja de entrada ordenada, tampoco es necesario ser un experto en machine learning para llevar una cadena de suministro al siguiente nivel de rendimiento a través de tecnologías de machine learning. Como explicamos anteriormente, dos de los aspectos clave del machine learning son precisamente una concentración central en la automatización y la eliminación casi total de todas las adaptaciones manuales de los modelos estadísticos.