Planificación de promociones en retail – Data Challenges

El forecast es casi siempre un ejercicio difícil, pero existe un área en el comercio minorista de mercancías generales que se considera una magnitud de complejidad superior a las demás: planificación de promociones. En Lokad, la planificación de promotion es uno de los desafíos frecuentes que abordamos para nuestros clientes más importantes, típicamente a través de misiones ad-hoc de Big Data.
Esta publicación es la primera de una serie sobre planificación de promociones. Vamos a cubrir los diversos desafíos que enfrentan los minoristas al hacer forecast de la demanda promocional, y a ofrecer algunas ideas sobre las soluciones que proponemos.
El primer desafío que enfrentan los minoristas al abordar las promociones es la calidad de los datos. Este problema suele ser enormemente subestimado, tanto por minoristas medianos como grandes. Sin embargo, sin datos altamente cualificados sobre promociones pasadas, toda la iniciativa de planificación enfrenta un problema de basura entra, basura sale.
Problemas de calidad de datos en los registros de promociones
La calidad de los datos de promociones es típicamente pobre - o al menos mucho peor que la calidad de los datos de ventas regulares. Un registro promocional, en el nivel más desagregado, representa un identificador de artículo, un identificador de tienda, una fecha de inicio (una fecha de finalización) además de todas las dimensiones que describen la propia promoción.
Esos registros promocionales tienen numerosos problemas:
- Existen registros, pero la tienda no implementó completamente el plan de promociones, especialmente en lo que respecta a la presentación.
- Existen registros, pero la promoción nunca se realizó en ninguna parte de la red. De hecho, los acuerdos promocionales se negocian típicamente con 3 a 6 meses de antelación con los proveedores. A veces, un acuerdo se cancela con tan solo unas pocas semanas de aviso, pero los datos promocionales correspondientes nunca se depuran.
- Las iniciativas no registradas de las tiendas, como trasladar un artículo con exceso de stock a los estantes de final de pasillo, no se registran. La presentación es uno de los factores más fuertes que impulsan el aumento promocional, y no debe subestimarse.
- Los detalles de los mecanismos de la promoción no se registran con precisión. Por ejemplo, la presencia de un empaque personalizado y la descripción estructurada del mismo rara vez se conservan.
Después de haber observado problemas similares en los conjuntos de datos de muchos minoristas, creemos que la explicación es simple: existen pocos o ningún imperativo operacional para corregir los registros promocionales. De hecho, si los datos de ventas están incorrectos, se generan tantos problemas operativos y contables, que solventar el problema se convierte muy rápidamente en la prioridad número 1.
En contraste, los registros promocionales pueden mantenerse extremadamente inexactos durante años. Mientras nadie intente producir algún tipo de modelo de forecast basado en esos registros, los registros inexactos tienen un impacto negativo insignificante en las operaciones del minorista.
La solución principal a esos problemas de calidad de datos es los procesos de calidad de datos, y validar empíricamente cuán resilientes son esos procesos al enfrentar las condiciones reales de la tienda.
Sin embargo, el mejor proceso no puede arreglar datos históricos deteriorados. Dado que típicamente se requieren 2 años de buenos datos promocionales para obtener resultados decentes, es importante invertir de manera temprana y agresiva en la historización de los registros promocionales.
Problemas estructurales de datos
Más allá de los problemas con los registros promocionales, la planificación precisa de las promociones también sufre de problemas más amplios e insidiosos relacionados con la forma en que se recopila la información en el comercio minorista.
Truncar el historial: La mayoría de los minoristas no conservan indefinidamente su historial de ventas. Usualmente, los datos “antiguos” se eliminan siguiendo dos reglas:
- si el registro tiene más de 3 años, se elimina el registro.
- si el artículo no se ha vendido durante 1 año, se elimina el artículo, y se eliminan todos los registros de ventas asociados.
Obviamente, dependiendo del minorista, los umbrales pueden diferir, pero mientras la mayoría de los grandes minoristas han estado en el mercado durante décadas, es excepcional encontrar un historial de ventas de 5 años sin truncar. Esas truncaciones se basan típicamente en dos supuestos falsos:
- almacenar datos antiguos es costoso: Almacenar los datos de ventas completos de 10 años (hasta el nivel de los recibos) de Walmart – y tu empresa es ciertamente más pequeña que Walmart – se puede hacer por menos de 1000 USD de almacenamiento al mes. El almacenamiento de datos no es solo ridículamente barato actualmente, ya lo era ridículamente barato hace 10 años, en lo que respecta a las redes minoristas.
- los datos antiguos no sirven para nada: Aunque los datos de hace 10 años ciertamente no sirven para propósitos operativos, desde un punto de vista estadístico, incluso los datos de hace 10 años pueden ser útiles para refinar el análisis en muchos problemas. En pocas palabras, un historial largo ofrece un rango mucho más amplio de posibilidades para validar el desempeño de los modelos de forecast y para evitar problemas de sobreajuste.
Reemplazar los GTINs por códigos de producto internos: Muchos minoristas preservan su historial de ventas codificado con identificadores de artículo alternativos en lugar de los GTINs nativos (también conocidos como UPC o EAN13, dependiendo de si se está en Norteamérica o Europa). Al reemplazar los GTINs con códigos de identificación ad-hoc, se considera frecuentemente que se facilita el seguimiento de las sustituciones de GTIN y se ayuda a evitar un historial segmentado.
Sin embargo, las sustituciones de GTIN no siempre son precisas, y las entradas incorrectas se vuelven casi imposibles de rastrear. Peor aún, una vez que dos GTINs han sido fusionados, los datos anteriores se pierden: ya no es posible reconstruir los dos conjuntos originales de registros de ventas.
En cambio, es una práctica mucho mejor preservar las entradas de GTIN, porque los GTINs representan la realidad física de la información que se recopila en el POS (punto de venta). Luego, las pistas para las sustituciones de GTIN deben conservarse por separado, haciendo posible revisar las asociaciones más adelante, si surge la necesidad.
No conservar la información del empaque: En el comercio minorista de alimentos, muchos productos se presentan en una variedad de formatos distintos: desde porciones individuales hasta porciones familiares, desde botellas individuales hasta packs, desde el formato regular hasta formatos promocionales de +25%, etc.
Conservar la información sobre esos formatos es importante porque, para muchos clientes, un formato alternativo del mismo producto es con frecuencia un buen sustituto cuando falta el otro formato.
Nuevamente, aunque pueda resultar tentador fusionar las ventas en una especie de meta-GTIN en la que se han combinado todas las variantes de tamaño, puede haber excepciones, y no todos los tamaños son sustitutos iguales (por ejemplo: 18g de Nutella vs 5kg de Nutella). Por lo tanto, la información del empaque debe preservarse, pero separada de las ventas sin procesar.
La calidad de los datos, una inversión sumamente rentable
La calidad de los datos es una de las pocas áreas donde las inversiones suelen devolver beneficios decuplicados en el sector minorista. Datos de mejor calidad mejoran todos los resultados posteriores, desde los métodos más ingenuos hasta los más avanzados. En teoría, la calidad de los datos sufriría por el principio de rendimientos decrecientes; sin embargo, nuestras propias observaciones indican que, excepto por unas pocas estrellas en ascenso del online commerce, la mayoría de los minoristas están muy lejos del punto en el que invertir más en calidad de los datos no sea altamente rentable.
Entonces, a diferencia de construir modelos predictivos avanzados, la calidad de los datos no requiere tecnologías complicadas, sino mucho sentido común y un fuerte sentido de la simplicidad.
Estén atentos, la próxima vez discutiremos los desafíos de proceso para la planificación de promociones.