Muchos desafíos de la cadena de suministro se pueden plantear como problemas de clasificación o regresión. Por ejemplo, predecir la demanda se puede ver como una regresión; mientras que decidir si alinear un precio con el punto de precio de un competidor es aceptable se puede ver como una clasificación.

Un bosque aleatorio es una técnica de aprendizaje automático que se puede utilizar para aprender patrones a partir de datos, normalmente con la intención de realizar una clasificación o una regresión.

Si bien los bosques aleatorios ya no son el estado del arte en el aprendizaje automático - el aprendizaje profundo los supera en muchas, si no en la mayoría, de las situaciones - todavía existen ventajas prácticas distintivas asociadas con los bosques aleatorios, que han sido resumidas de manera excelente por Ahmed El Deeb en The Unreasonable Effectiveness of Random Forests.

De hecho, cuando Ahmed El Deeb señala que ¡Es realmente difícil construir un mal Bosque Aleatorio!, estoy de acuerdo, y esto representa una ventaja práctica significativa. En contraste, los modelos de aprendizaje profundo son, bueno, caprichosos, por decir lo menos, y un tesoro de parámetros oscuros puede mejorar - o degradar - el rendimiento de formas que no siempre son muy claras para el científico de datos.

Por lo tanto, los bosques aleatorios ahora están integrados en Envision. Bono: las predicciones de los bosques aleatorios se devuelven como variables aleatorias, lo que es una buena combinación para los enfoques probabilísticos de optimización de la cadena de suministro.

Bajo el capó, hemos implementado nuestra propia implementación de bosques aleatorios altamente optimizada. Robamos muchas ideas de xgBoost. La idea principal es que estamos aprovechando una estrategia de procesamiento de datos columnar - a diferencia de enfoques anteriores, que eran tabulares. En el contexto de Envision, este enfoque ofrece beneficios adicionales de rendimiento, ya que los datos en sí ya están organizados en un formato columnar dentro de Envision. Además, en un contexto de cadena de suministro, las características de entrada suelen ser escasas o de baja cardinalidad, por ejemplo, los productos de baja rotación. El enfoque columnar nos permite comprimir significativamente los datos, lo que proporciona una mayor aceleración para esos bosques aleatorios.

Los bosques aleatorios más rápidos pueden parecer una característica pequeña, sin embargo, el rendimiento es una característica. El recurso más escaso suele ser el científico de la cadena de suministro en sí. Pasar menos tiempo esperando a que se produzcan los resultados numéricos significa que se puede dedicar más tiempo a pensar y resolver el desafío real de la cadena de suministro.