computación en la nube siendo tan 2011, big data será una palabra clave IT para 2012. Sin embargo, según entendemos a nuestros clientes del retail, hay una fuente de datos que posee más del 90% del valor total de información en su poder: market basket data (etiquetados con la información de la tarjeta de fidelidad cuando está disponible).

Para cualquier red de retail mediana o grande, el valor informativo de los datos de market basket eclipsa simplemente todas las demás fuentes de datos alternativas, ya sea:

  • Datos de video en tienda, que resultan difíciles de procesar y se centran principalmente en la seguridad.
  • Datos de redes sociales, que son muy ruidosos y reflejan tanto implementaciones de bots como comportamientos humanos.
  • Informes de analistas de mercado, que requieren el recurso más escaso de todos: la atención de la dirección.

Sin embargo, además de las proyecciones básicas de ventas (es decir, ventas por producto, por tienda, por región, por semana …), observamos que, desde enero de 2012, la mayoría de los minoristas están haciendo muy poco con sus datos de market basket. Incluso el forecast para la optimización de inventario suele ser nada más que una variante del promedio móvil a nivel de tienda. Se utilizan métodos más elaborados para warehouses, pero entonces, los minoristas ya no están aprovechando los datos de market basket, sino los envíos anteriores de almacén.

Los proveedores de Big Data prometen aportar un nivel sin precedentes de poder de procesamiento de datos a sus clientes para permitirles aprovechar todo el potencial de su big data. Sin embargo, ¿esto va a traer cambios rentables a los minoristas? No necesariamente así.

La capacidad de almacenamiento que se encuentra expuesta en las estanterías de un hipermercado promedio con más de 20 discos duros externos en exhibición (asumiendo 500GB por disco) generalmente supera el almacenamiento bruto necesario para conservar 3 años completos de historial de una red de 1000 tiendas (es decir, 10TB de datos de market basket). Por lo tanto, el almacenamiento de datos en bruto no es un problema, o, al menos, no es un problema costoso. Luego, el I/O de datos (entrada/salida) es un asunto más desafiante, pero de nuevo, al elegir una representación adecuada de los datos (los detalles irían más allá del alcance de este post), apenas representa un desafío a partir de 2012.

Observamos que el mayor desafío que plantea Big Data es simplemente el requerimiento de personal para hacer cualquier cosa operativa con él. En efecto, los datos son principalmente grandes en el sentido de que los recursos de la empresa, para ejecutar el software de Big Data e implementar cualquiera de las sugerencias que surjan de él, son escasos.

Generar un sinfín de métricas a partir de datos de market basket es fácil; pero es mucho más difícil construir un conjunto de métricas que valga la pena leer, considerando los costos horarios de los empleados.

Según entendemos a nuestros clientes del retail, la limitación de personal por sí sola explica por qué se hace tan poco con los datos de market basket de manera continua: mientras que la CPU nunca ha sido tan barata, el coste del personal nunca ha sido tan alto.

Por lo tanto, creemos que los éxitos de Big Data en el retail se lograrán con soluciones lean que traten, no el poder de procesamiento, sino a las personas, como el recurso más escaso de todos.


Comentarios de los lectores (1)

Joannes, estoy impresionado con el trabajo que estás haciendo. Si aún no lo has hecho, por favor revisa lo que QlickView tiene para ofrecer en “business intelligence” o “business discovery”. La plataforma es realmente rápida+avanzada en convertir datos en conocimiento. Estoy seguro de que puedes aprender algo de ellos. Pero sí, los números no pueden hablar por sí mismos, incluso en BigData, por lo que la limitación de personal no puede ser completamente eliminada. Saludos Ali (hace 5 años)