Desde nuestra importante actualización de Tags+Events el otoño pasado, hemos estado trabajando activamente en el pronóstico de promociones para el comercio minorista. Ahora tenemos miles de eventos promocionales en nuestras bases de datos; y el análisis de esos eventos nos ha llevado a conclusiones muy interesantes.

Además, no es sorprendente que hayamos descubierto que:

  • los pronósticos de promoción realizados manualmente por los profesionales suelen tener errores de pronóstico superiores al 60% en promedio. Puede variar, pero los errores típicos de pronóstico de ventas en el comercio minorista suelen ser más cercanos al 20%.
  • la inclusión de datos de promoción a través de etiquetas y eventos reduce el error de pronóstico promedio en aproximadamente un 50%. Nuevamente, puede variar dependiendo de la cantidad de datos que tenga sobre sus eventos promocionales.

Como resultado menos intuitivo, también hemos descubierto que los métodos basados en reglas y los métodos lineales, aunque ampliamente promocionados por algunos expertos y algunas herramientas de software, son muy débiles frente al sobreajuste, y pueden distorsionar la evaluación del error de pronóstico, dando una falsa impresión de rendimiento en el pronóstico de promociones.

Además, tenga en cuenta que esta mejora del 50% se ha logrado con una cantidad bastante limitada de información, generalmente no más de 2 o 3 descriptores binarios por promoción.

Incluso los datos básicos sobre sus promociones están generando mejoras significativas en el pronóstico, lo que se traduce en ahorros significativos de capital de trabajo.

El primer paso para mejorar sus pronósticos de promoción consiste en recopilar datos precisos sobre las promociones. En nuestra experiencia, este paso es el más difícil y el más costoso. Si no tiene registros precisos de sus promociones, entonces hay pocas esperanzas de obtener pronósticos precisos. Como dice la gente, basura entra, basura sale.

Sin embargo, hemos notado que incluso un solo descriptor de promoción, una variable binaria que indica si el artículo está actualmente en promoción o no, puede generar una mejora significativa en el pronóstico. Por lo tanto, aunque sus registros deben ser precisos, no es necesario que sean detallados para mejorar sus pronósticos.

Por lo tanto, le recomendamos que lleve un seguimiento preciso del momento de sus promociones: ¿cuándo comenzó? ¿cuándo terminó? Tenga en cuenta que para el comercio electrónico, la visualización en la página principal a menudo tiene un efecto comparable a una promoción de producto, por lo que debe realizar un seguimiento de la evolución de su página principal.

Luego, la descripción del artículo es importante. De hecho, en nuestra experiencia, incluso los artículos más promocionados no van a tener más de una docena de promociones en su vida útil en el mercado. En promedio, la cantidad de promociones pasadas conocidas para un artículo dado es ridículamente baja, oscilando entre cero y una promoción pasada en promedio. Como resultado, no se puede esperar ningún resultado confiable al centrarse en las promociones pasadas de un solo producto a la vez, porque la mayoría de las veces no hay ninguna.

Entonces, en su lugar, debe centrarse en los artículos que se parecen al artículo que está planeando promocionar. Con Lokad, puede hacer esto asociando etiquetas a sus ventas. Por lo general, los minoristas utilizan una jerarquía para organizar su catálogo. Piense en una jerarquía de artículos con familias, subfamilias, artículos, variantes, etc.

La traducción de un catálogo jerárquico en etiquetas se puede hacer de manera bastante sencilla siguiendo el proceso ilustrado a continuación para un vendedor ficticio de caramelos:

Las etiquetas asociadas con el historial de ventas de piruletas de limón medianas serían PIRULETAS, LIMÓN, MEDIANO

Este proceso generalmente creará de 2 a 6 etiquetas por artículo en su catálogo, dependiendo de la complejidad del mismo.

Hemos dicho que incluso información muy limitada sobre sus promociones podría utilizarse para mejorar sus pronósticos de ventas de inmediato. Sin embargo, más información detallada sobre las promociones mejora claramente la precisión del pronóstico.

Hemos descubierto que dos elementos son muy valiosos para mejorar la precisión del pronóstico:

  • el mecanismo que describe la naturaleza del descuento ofrecido a sus clientes. Los mecanismos típicos son descuentos planos (por ejemplo, -20%), pero también hay muchos otros mecanismos como envío gratuito o descuento por cantidades mayores (por ejemplo, compre uno y obtenga otro gratis).
  • la comunicación que describe cómo se notifica a sus clientes sobre el evento promocional. Típicamente, la comunicación incluye operaciones de marketing como radio, periódicos o anuncios locales, pero también el empaque personalizado (si lo hay) y la visibilidad de los artículos promocionados dentro del punto de venta.

En caso de redes de distribución más grandes, también se debe describir la disponibilidad general de la promoción si los artículos no se promocionan en todas partes. Esta situación suele surgir si los gerentes de los puntos de venta pueden optar por no participar en las operaciones promocionales.

Al hablar con profesionales, hemos descubierto que muchos minoristas esperan que Lokad produzca un conjunto de reglas; y se espera que esas reglas expliquen promociones como

SI ANUNCIOS_EN_TV Y DESCUENTO_DEL_25_PORCIENTO 
ENTONCES VENTAS_PROMOCIONALES = 5 * VENTAS_REGULARES;

Básicamente, esas reglas esperadas siempre siguen más o menos los mismos patrones:

  • Un conjunto de condiciones binarias que define el alcance de la regla.
  • Un conjunto de coeficientes lineales para estimar el efecto de la regla.

Hemos descubierto que hay muchas herramientas en el mercado de software disponibles para ayudarlo a descubrir esas reglas en sus datos; lo cual, aparentemente, ha llevado a muchas personas a creer que este enfoque era el único disponible.

Sin embargo, según nuestros experimentos, los métodos basados en reglas están lejos de ser óptimos. Peor aún, esas reglas son muy débiles contra el sobreajuste. Esta debilidad con frecuencia conduce a situaciones dolorosas en las que hay una brecha significativa entre la precisión del pronóstico estimada y la precisión del pronóstico real.

El sobreajuste es un fenómeno muy sutil y, sin embargo, muy importante, en la previsión estadística. Básicamente, el problema central en la previsión es que desea construir un modelo que sea muy preciso contra los datos que no tiene.

En particular, la teoría estadística indica que es posible construir modelos que resulten ser muy precisos cuando se aplican a los datos históricos, y aún así muy imprecisos para predecir el futuro. El problema es que, en la práctica, si no piensa cuidadosamente en el problema del sobreajuste de antemano, construir dicho modelo no es solo una posibilidad, sino el resultado más probable de su proceso.

Por lo tanto, realmente necesita optimizar su modelo contra los datos que no tiene. Sin embargo, este problema parece ser un completo paradigma, porque, por definición, no puede medir nada si no tiene los datos correspondientes. Y hemos descubierto que muchos profesionales renuncian a este problema, porque de todos modos no parece ser un pensamiento manejable.

Nuestro consejo es: NO TE RINDAS

El problema principal con esas reglas es que funcionan demasiado bien en los datos históricos. Cada regla que agregas está reduciendo mecánicamente el error de pronóstico que estás midiendo en tus datos históricos. Si agregas suficientes reglas, terminas con un aparente error de pronóstico cercano a cero. Sin embargo, el error empírico que mides en tus datos históricos es un artefacto del proceso utilizado para construir las reglas en primer lugar. Un error de pronóstico cero en los datos históricos no se traduce en un error de pronóstico cero en las promociones futuras. De hecho, estos modelos tienden a tener un rendimiento muy pobre en las promociones futuras.

Aunque, optimizar para los datos que no tienes es difícil, la teoría del aprendizaje estadístico ofrece tanto una comprensión teórica como soluciones prácticas a este problema. La idea central consiste en introducir la noción de minimización del riesgo estructural que equilibra el error empírico.

Esto se discutirá en una publicación posterior, manténganse atentos.

(Promoción descarada) Muchas de esas soluciones modernas, es decir, modelos matemáticos que tienen cuidado con el problema del sobreajuste, han sido implementadas por Lokad, para que no tenga que contratar a un equipo de expertos para beneficiarse de ellos.


Comentarios de los lectores (1)

Manejar los datos de señales de demanda presenta los mismos problemas que los datos en tiempo real causan en cualquier industria: cómo acceder e integrar grandes volúmenes de datos, y luego combinarlos y analizarlos junto con la información histórica. hace 9 años | Oportunidades de negocio