Mejores forecast de promoción en retail
Desde nuestra actualización mayor de Tags+Events el otoño pasado, hemos estado trabajando de manera muy activa en el forecast de promotion en el retail. Ahora tenemos miles de eventos promocionales en nuestras bases de datos; y el análisis de esos eventos nos ha llevado a hallazgos muy interesantes.
Además, no es para sorprender, hemos encontrado que:
- los forecast de promoción cuando se realizan manualmente por profesionales suelen involucrar errores de forecast por encima del 60% en promedio. Tus resultados pueden variar, pero los errores típicos de forecast de ventas en retail suelen estar más cerca del 20%.
- incluir datos de promoción mediante tags y events reduce el error promedio de forecast aproximadamente un 50%. De nuevo, tus resultados pueden variar dependiendo de la cantidad de datos que tengas sobre tus eventos promocionales.
Como resultado menos intuitivo, también hemos encontrado que los métodos basados en reglas y los métodos lineales, aunque ampliamente publicitados por algunos expertos y algunas herramientas de software, son muy débiles contra el sobreajuste, y pueden distorsionar la evaluación del error de forecast, llevando a una falsa impresión del rendimiento en el forecast de promoción.
Además, ten en cuenta que esta mejora del 50% se ha logrado usualmente con una cantidad de información bastante limitada, normalmente no más de 2 o 3 descriptores binarios por promoción.
Incluso los datos crudos sobre tus promociones están llevando a mejoras significativas en el forecast, lo que se traduce en ahorros importantes en capital de trabajo.
El primer paso para mejorar tus forecast de promoción consiste en recolectar datos de promoción precisos. En nuestra experiencia, este paso es el más difícil y el más costoso. Si no tienes registros precisos de tus promociones, entonces hay poca esperanza de obtener forecasts precisos. Como dice el dicho, Garbage In, Garbage Out.
Sin embargo, notamos que incluso un único descriptor de promoción, una variable binaria que simplemente indica si el artículo está siendo promocionado o no, puede llevar a una mejora significativa en el forecast. Así, aunque tus registros deben ser precisos, no necesitan ser detallados para mejorar tus forecasts.
Por lo tanto, te recomendamos que lleves un control preciso del tiempo de tus promociones: ¿cuándo comenzaron? ¿cuándo terminaron? Ten en cuenta que para eCommerce, la exhibición en la página principal a menudo tiene un efecto comparable al de una promoción de producto, por lo que necesitas rastrear la evolución de tu página principal.
Luego, la descripción del artículo importa. De hecho, en nuestra experiencia, incluso los artículos promocionados con mayor frecuencia no tendrán más de una docena de promociones en su ciclo de vida en el mercado. En promedio, la cantidad de promociones pasadas conocidas para un artículo dado es ridículamente baja, oscilando entre cero y una promoción pasada en promedio. Como resultado, no puedes esperar resultados confiables al enfocarte en las promociones pasadas de un solo producto a la vez, porque, la mayoría del tiempo, no hay ninguna.
Así que, en cambio, tienes que enfocarte en artículos que se parezcan al artículo que planeas promocionar. Con Lokad, puedes hacerlo asociando tags a tus ventas. Típicamente, los minoristas utilizan una jerarquía para organizar su catálogo. Piensa en una jerarquía de artículos con familias, subfamilias, artículos, variantes, etc.
Traducir un catálogo jerárquico a tags se puede hacer de manera bastante simple siguiendo el proceso ilustrado a continuación para un revendedor de dulces ficticio:

Los tags asociados con el historial de ventas de paletas medianas de limón serían LOLLIPOPS, LEMON, MEDIUM
Este proceso normalmente creará de 2 a 6 tags por artículo en tu catálogo - dependiendo de la complejidad de tu catálogo.
Hemos dicho que incluso información muy limitada sobre tus promociones podría usarse para mejorar tus forecasts de ventas de inmediato. Sin embargo, una información de promoción más detallada mejora claramente la precisión del forecast.
Hemos descubierto que dos aspectos son muy valiosos para mejorar la precisión del forecast:
- el mecanismo que describe la naturaleza del descuento ofrecido a tus clientes. Los mecanismos típicos son descuento fijo (ej. -20%) pero existen muchos otros mecanismos tales como free shipping o descuento por mayores cantidades (ej: compra uno y llévate otro gratis).
- la comunicación que describe cómo se notifica a tus clientes sobre el evento promocional. Típicamente, la comunicación incluye operaciones de marketing como radio, periódico o anuncios locales, pero también el empaque personalizado (si lo hay) y la visibilidad de los artículos promocionados en el punto de venta.
En el caso de redes de distribución más amplias, la disponibilidad general de la promoción también debería describirse si los artículos no se promocionan en todas partes. Tal situación típicamente surge si los gerentes de puntos de venta pueden optar por no participar en las operaciones promocionales.
Hablando con profesionales, hemos encontrado que muchos minoristas esperan que Lokad produzca un conjunto de reglas; y se espera que esas reglas expliquen promociones tales como
IF TV_ADS AND PERCENT25_DISCOUNT
THEN PROMO_SALES = 5 * REGULAR_SALES;
Básicamente, esas reglas esperadas siempre siguen, más o menos, los mismos patrones:
- Un conjunto de condiciones binarias que definen el alcance de la regla.
- Un conjunto de coeficientes lineales para estimar el efecto de la regla.
Hemos descubierto que existen muchas herramientas en el mercado de software disponibles para ayudarte a descubrir esas reglas en tus datos; lo que, aparentemente, ha llevado a muchas personas a creer que este enfoque era el único disponible.
Sin embargo, según nuestros experimentos, los métodos basados en reglas están lejos de ser óptimos. Peor aún, esas reglas son realmente débiles contra el sobreajuste. Esta debilidad conduce frecuentemente a situaciones dolorosas donde hay una brecha significativa entre la precisión del forecast estimada y la precisión del forecast real.
Overfitting es un fenómeno muy sutil y, sin embargo, muy importante en el forecast estadístico. Básicamente, el tema central del forecasting es que deseas construir un modelo que sea muy preciso contra los datos que no tienes.
En particular, la teoría estadística indica que es posible construir modelos que son muy precisos cuando se aplican a los datos históricos, y aún así muy inexactos para predecir el futuro. El problema es que, en la práctica, si no piensas cuidadosamente en el problema del sobreajuste de antemano, construir un modelo así no es una mera posibilidad, sino el resultado más probable de tu proceso.
Por lo tanto, realmente necesitas optimizar tu modelo contra los datos que no tienes. Sin embargo, este problema parece una paradoja completa, porque, por definición, no puedes medir nada si no tienes los datos correspondientes. Y hemos descubierto que muchos profesionales se rindieron ante este problema, porque no parece ser un pensamiento tratable de todos modos.
Nuestro consejo es: NO TE RINDAS
El problema central con esas reglas es que funcionan demasiado bien con los datos históricos. Cada regla que añades reduce mecánicamente el error de forecast que mides en tus datos históricos. Si añades suficientes reglas, terminás con un error de forecast aparente cercano a cero. Sin embargo, el error empírico que mides en tus datos históricos es un artefacto del proceso utilizado para construir las reglas en primer lugar. Un error de forecast cero en los datos históricos no se traduce en un error de forecast cero en futuras promociones. De hecho, sucede lo contrario, ya que tales modelos tienden a desempeñarse muy pobremente en futuras promociones.
Aunque, optimizar para los datos que no tienes es difícil, la teoría del aprendizaje estadístico ofrece tanto una comprensión teórica como soluciones prácticas a este problema. La idea central consiste en introducir la noción de minimización del riesgo estructural, que equilibra el error empírico.
Esto se discutirá en una publicación posterior, mantente atento.
(Shameless plug) Muchas de esas soluciones modernas, es decir, modelos matemáticos que resultan ser cuidadosos con el problema del sobreajuste, han sido implementados por Lokad, para que no tengas que contratar a un equipo de expertos para beneficiarte de ellos.
Comentarios de los lectores (1)
Manejar datos de señales de demanda presenta los mismos problemas que los datos en tiempo real causan en cualquier industria: cómo acceder e integrar altos volúmenes de datos, y luego combinarlos y analizarlos junto con la información histórica.
Business Opportunities (9 years ago)