Облачные вычисления уже устарели с 2011 года, большие данные станут ключевым ИТ-термином 2012 года. Тем не менее, насколько мы понимаем наших клиентов из розничной торговли, существует один источник данных, который содержит более 90% общей информационной ценности: данные о покупательских корзинах (с информацией о карте лояльности, когда это возможно).

Для любой средней или крупной розничной сети информационная ценность данных о покупательских корзинах просто затмевает почти все другие альтернативные источники информации, будь то:

  • Видео с камер наблюдения, которые сложно обрабатывать и которые в первую очередь ориентированы на обеспечение безопасности.
  • Данные из социальных сетей, которые очень шумны и отражают работу ботов не меньше, чем поведение людей.
  • Отчеты рыночных аналитиков, которые требуют самого дефицитного ресурса: внимания руководства.

Тем не менее, помимо базовых прогнозов продаж (то есть продаж по товарам, магазинам, регионам, неделям …), мы наблюдаем, что по состоянию на январь 2012 года большинство ритейлеров делают очень мало с данными о покупательских корзинах. Даже прогнозирование для оптимизации запасов обычно представляет собой не более чем вариант скользящего среднего на уровне магазина. Более сложные методы используются для складов, но при этом ритейлеры уже не используют данные корзины, а только сведения о прошлых отгрузках со складов.

Поставщики решений Big Data обещают предоставить своим клиентам беспрецедентный уровень вычислительной мощности для обработки данных, чтобы они могли полностью использовать потенциал своих больших данных. Но приведет ли это к получению прибыли для розничных торговцев? Не обязательно.

Вместимость хранения данных, выставленная на показ на полках среднего гипермаркета с +20 внешними дисками в демонстрационном зале (при условии 500GB на диск) обычно превосходит необработанное хранилище, необходимое для сохранения трёхлетней истории сети из 1000 магазинов (то есть 10TB данных о покупательских корзинах). Следовательно, хранение сырьевых данных не является проблемой, или, по крайней мере, не дорогостоящей. Что касается ввода-вывода данных (I/O), то это более сложный вопрос, но, опять же, благодаря выбору адекватного представления данных (детали которого выходят за рамки данного поста), это едва ли является вызовом в 2012 году.

Мы замечаем, что самая большая проблема, связанная с Big Data, — это, по сути, потребности в рабочей силе, чтобы что-либо оперативно с ней сделать. Ведь данные являются большими прежде всего в том смысле, что ресурсы компании для запуска программного обеспечения Big Data и реализации любых рекомендаций, вытекающих из него, весьма ограничены.

Формирование перечня метрик на основе данных о покупательских корзинах — задача простая; однако создать набор метрик, достойных того, чтобы их изучали с учётом почасовой стоимости сотрудников, гораздо сложнее.

Насколько мы понимаем наших клиентов из розничной торговли, дефицит рабочей силы сам по себе объясняет, почему с данными о покупательских корзинах так мало что делается на постоянной основе: в то время как стоимость процессоров никогда не была такой низкой, расходы на персонал никогда не были такими высокими.

Таким образом, мы считаем, что успех Big Data в розничной торговле будет достигнут с помощью оптимизированных решений, ориентированных на то, чтобы считать не вычислительную мощность, а людей самым дефицитным ресурсом.


Комментарии читателей (1)

Joannes, я впечатлен проделанной работой. Если вы еще этого не сделали, пожалуйста, ознакомьтесь с тем, что QlikView может предложить в области “business intelligence” или “business discovery”. Платформа действительно быстрая и продвинутая в преобразовании данных в знания. Я уверен, что вы сможете чему-то у них научиться. Но да, цифры сами за себя не говорят, даже в BigData, поэтому дефицит рабочей силы никак не может быть полностью устранён. Привет Ali (5 лет назад)