00:00:08 Введение в прогнозирование спроса и агрегацию данных.
00:00:41 Различные типы гранулярности в прогнозировании спроса.
00:02:00 Проблемы различных уровней агрегации данных в прогнозировании.
00:05:28 Разагрегированный уровень: SKU в день и восстановление других уровней агрегации.
00:08:31 Крайние случаи и проблемы с перишабельными продуктами в прогнозировании спроса.
00:09:42 Важность гранулярной информации в агрегации данных.
00:11:01 Восстановление желаемого уровня агрегации из наиболее гранулярных данных.
00:13:01 Ограничения методов временных рядов в очень разагрегированных данных.
00:15:01 Методы временных рядов и предположение о том, что будущее будет больше того же самого.
00:17:00 Соблазнительная и вводящая в заблуждение природа моделей временных рядов.
00:19:03 Обсуждение недостатков агрегации в прогнозировании.
00:20:00 Исследование важности гранулярности в принятии решений.
00:21:38 Изучение соответствующих горизонтов и их влияния на решения в цепи поставок.
00:23:48 Аргументация против произвольной агрегации и ее потенциального влияния на эффективность цепи поставок.
00:26:35 Предложение сосредоточиться на гранулярности, определяемой решениями, и избегать преждевременной оптимизации.
Резюме
Йоанн Верморель, основатель компании Lokad, обсуждает важность выбора правильного уровня агрегации данных для прогнозирования спроса в интервью с Николь Зинт. Рассматриваются два аспекта: временной и структурный, включая временные интервалы, используемые для агрегации данных, и организацию цепи поставок. Верморель отмечает, что ежедневный уровень и уровень SKU наиболее применимы для большинства сетей цепей поставок, но крайние случаи могут требовать более гранулярных данных. Верморель предупреждает о ограничениях моделей временных рядов в прогнозировании цепей поставок, призывая к более широкому подходу, который учитывает такие факторы, как перишабельность, каннибализация, замещение и переменные сроки поставки. Он подчеркивает важность гранулярности, определяемой решениями, и расширения горизонтов прогнозирования за пределы сроков поставки.
Расширенное резюме
В этом интервью ведущая Николь Зинт обсуждает прогнозирование спроса и правильный уровень агрегации данных с Йоаннесом Верморелем, основателем компании Lokad, специализирующейся на оптимизации цепей поставок. Они исследуют различные типы гранулярности в прогнозировании спроса и влияние этих гранулярностей на методы прогнозирования.
Верморель объясняет, что при выборе гранулярности для прогнозирования спроса следует учитывать два основных аспекта: временной и структурный. Временной аспект относится к временным интервалам, используемым для агрегации данных, таким как почасовая, ежедневная, еженедельная, ежемесячная или ежегодная. Структурный аспект связан с организацией цепи поставок, включая категории товаров и местоположения. Это может включать агрегацию данных по SKU (Stock Keeping Unit), ссылке на товар, семейству товаров, суперсемейству товаров или категории, а затем агрегацию по сайту, региону или стране.
Обсуждая типы прогнозов, связанных с этими гранулярностями, Верморель упоминает понятие “бизнес-аналитики” или гиперкубов, популяризированное в 1990-х годах. Исторические данные могут быть представлены векторами, при этом каждый уровень гранулярности создает уникальный вектор. Когда добавляется временная размерность, эти векторы могут быть интерпретированы как временные ряды, которые затем могут быть использованы для прогнозирования.
Этот подход в основном занимается прогнозированием временных рядов, которое является основной практикой в отрасли. Верморель отмечает, что из-за разнообразия потенциальных уровней агрегации из одних и тех же данных может быть сгенерировано несколько прогнозов.
В интервью также затрагивается технический термин “равноотстоящий” в отношении временных рядов. Равноотстоящие временные ряды имеют регулярные, равномерные интервалы между точками данных. Верморель признает, что большинство людей в отрасли цепей поставок, возможно, не рассматривали работу с неравноотстоящими временными рядами, так как равноотстоящие временные ряды более распространены. Однако он указывает на то, что некоторые интервалы, например, месяцы, не являются точно регулярными в физическом смысле, так как месяцы имеют разную продолжительность.
Этот сегмент интервью фокусируется на важности выбора соответствующей гранулярности для прогнозирования спроса. Существуют два основных аспекта, которые следует учитывать: временной и структурный. Из одних и тех же данных можно сгенерировать различные типы прогнозов на основе выбранной гранулярности, причем прогнозы временных рядов являются наиболее распространенными в отрасли. Кроме того, обсуждается понятие равноотстоящих временных рядов, подчеркивая потенциальные сложности при работе с разными временными интервалами.
Верморель говорит о прогнозируемых горизонтах времени, гранулярности, определяемой решениями, и важности не ограничивать свое мышление, когда речь идет о управлении цепями поставок.
Они обсуждают проблемы уровней агрегации данных в оптимизации цепей поставок. Верморель объясняет, что выбор уровня агрегации зависит от чувствительности отрасли, поскольку некоторым отраслям может потребоваться большая детализация. Он также подчеркивает, что ежедневный уровень и уровень SKU являются наиболее осмысленными уровнями детализации для большинства сетей цепей поставок. Однако он отмечает, что крайние случаи, такие как перишабельные продукты, могут требовать более детальных данных. Верморель подчеркивает, что каждое произвольное решение об агрегации данных имеет свои плюсы и минусы, и важно понимать, откуда берутся эти решения. На вопрос о том, можно ли восстановить более детальные данные из наиболее детальных данных, Верморель объясняет, что при агрегации данных теряется информация. Таким образом, чем более детальные данные, тем более точным является прогноз. Однако наиболее детальные данные - это не агрегированные данные, а исходные транзакционные данные. Он объясняет, что люди останавливаются на уровне SKU в день, потому что это последний уровень, на котором они все еще могут работать с временными рядами. Если они идут дальше, им придется отказаться от перспективы временных рядов, так как данные не структурированы как временные ряды.
Они также обсудили ограничения моделей временных рядов в прогнозировании цепей поставок с ведущей Николь Зинт. Верморель отмечает, что хотя отрасль цепей поставок обычно работает с моделью временных рядов, техники временных рядов обычно плохо справляются с разреженными, неустойчивыми и прерывистыми данными. Он утверждает, что между прошлым и будущим существует фундаментальная асимметрия, и предположение, что будущее точно такое же, как прошлое, является ошибочным. Верморель также критикует практику агрегации данных, которая, по его мнению, приводит к потере данных и несоответствующим метрикам, и предлагает, что единственный релевантный горизонт для принятия решений - это горизонт, который имеет отношение к конкретному решению.
Верморель начинает с объяснения того, что горизонты прогнозирования должны выходить за пределы времени выполнения заказа, так как они не всегда хорошо сочетаются с традиционной перспективой временных рядов. Он утверждает, что горизонт принятия решений должен учитывать не только период между настоящим моментом и поступлением товара, но и время, необходимое для продажи полученных товаров. Применимый горизонт зависит от таких факторов, как ожидаемая скорость ликвидации запасов и изменчивость спроса. Хотя нет четкого ограничения на то, насколько далеко в будущее следует смотреть, Верморель признает, что прогнозы становятся менее точными, чем дальше они уходят. В конечном счете, компромисс заключается в балансировке затрат на вычислительные ресурсы и потенциальных улучшений цепи поставок.
Обсуждая детализацию, Верморель подчеркивает, что она должна определяться решениями, которые компания хочет принимать. Он советует не путать необходимость визуализации с другими предиктивными и оптимизационными требованиями, поскольку детализация может быть произвольной и привести к потере данных. Вместо этого он рекомендует сосредоточиться на решениях, которые имеют осязаемые финансовые последствия для цепи поставок, таких как перезаказ или корректировка цен.
Верморель предупреждает от слишком упорного фокуса на уровнях агрегации, которые он считает высокотехнологичным аспектом проблемы. Современные компьютерные системы имеют достаточно возможностей для обработки различных уровней детализации, и нет необходимости накладывать произвольные ограничения на свое мышление. В прошлом агрегация данных для визуализации была проблемой, но современные системы могут легко справиться с этим, даже с детализацией до миллисекундного уровня.
Интервьюируемый также предупреждает от полного полагания на традиционные подходы к кубам данных для оптимизации цепей поставок. Он утверждает, что это может накладывать ненужные ограничения и ограничивать область потенциальных решений. Факторы, такие как портативность, каннибализация, замещение и переменные времена выполнения, следует учитывать для более всестороннего представления цепи поставок. Верморель призывает к более широкой перспективе и избеганию произвольных ограничений, которые могут затруднять решение проблем в управлении цепями поставок.
В заключение, Жоанн Верморель выступает за учет более широкого спектра факторов при оптимизации цепей поставок, расширение горизонтов прогнозирования за пределы времени выполнения и принятие решений на основе гранулярности. Он подчеркивает важность не ограничивать свое мышление и использовать современные компьютерные системы для эффективного решения сложных проблем в управлении цепями поставок.
Полный текст
Николь Зинт: Когда речь идет о прогнозировании спроса, существует невероятное разнообразие различных методов и уровней агрегации данных, которые выбираются как между компаниями, так и внутри них. Некоторые прогнозируют ежедневно, другие - еженедельно, ежемесячно или ежегодно. Некоторые прогнозируют на уровне SKU, другие - на уровне категории. Это порождает вопрос, какой уровень агрегации данных является правильным? Это тема сегодняшнего эпизода. Прежде чем мы углубимся в ответ на этот вопрос, Жоанн, какие различные типы гранулярности можно выбрать при прогнозировании спроса?
Жоанн Верморель: При прогнозировании спроса у вас есть два основных измерения проблемы. Первое - временное, касающееся того, хотите ли вы агрегировать свои транзакционные данные на уровне часа, дня, недели, месяца или года. Другое измерение обычно связано с топологией продукта/цепи поставок, поэтому вы можете выбрать агрегацию по SKU, по ссылке на продукт, по семейству продуктов, суперсемейству, категории и т. д. У вас также есть ваши местоположения, где вы можете агрегировать по сайту, по региону или по стране. Два основных измерения - это время и структура вашего каталога/сети цепи поставок, что создает матрицу возможностей при выборе гранулярности.
Николь Зинт: Когда мы говорим об этих уровнях детализации, о каких прогнозах мы говорим? Существует ли конкретный тип прогноза?
Жоанн Верморель: У вас есть концептуальная модель, которая была популяризирована в 90-х годах, в основном под названием бизнес-аналитика или гиперкубы. У вас есть способ представить ваши исторические данные в виде векторов. Вы выбираете уровень детализации, скажем, по SKU по неделе, и затем для каждого отдельного SKU на недельном уровне у вас есть вектор значений, который, благодаря временному измерению, можно интерпретировать как временной ряд. Затем вы можете прогнозировать этот временной ряд в будущем. Из-за множества потенциальных уровней агрегации, на основе одних и тех же данных можно сделать множество прогнозов. Таким образом, когда мы обсуждаем эту проблему, мы говорим о прогнозах временных рядов, по крайней мере, это практика, распространенная в индустрии.
Николь Зинт: Что насчет временной шкалы во временных рядах, они все равномерно распределены или есть другой подход?
Жоанн Верморель: “Равномерно распределенный” - это очень технический термин, с которым большинство людей в индустрии цепей поставок, возможно, никогда не сталкивались. Равномерное распределение - это техническая деталь, где вы говорите, что ваш временной ряд разделен на полностью регулярные интервалы. Однако имейте в виду, что это некоторая абстракция, потому что, например, месяцы не являются точно регулярными в физическом смысле. Физики скажут, что есть месяцы, которые длиннее других, поэтому они регулярны только согласно нашему календарю.
Николь Зинт: Еще один вопрос, когда речь идет о месяце: у нас разное количество, скажем, пятниц или выходных в месяце, и если мы видим всплески продаж по пятницам, это не нарушит прогноз?
Жоанн Верморель: Здесь мы подходим к такому вопросу: какой уровень агрегации выбрать? У вас может возникнуть множество проблем. Очевидно, что некоторые уровни агрегации имеют определенные эффекты. Если вы смотрите на уровень по часам, то, скорее всего, он будет очень детализированным и, возможно, даже не имеет смысла в ночное время, потому что, возможно, есть много областей, где, скажем, в рознице ночью ничего не происходит. Так что это может быть даже неразумно.
Затем, действительно, если вы выбираете месячную агрегацию, это всегда сложно, потому что у вас есть факт того, что некоторые месяцы имеют пять дней определенного дня недели, и вы можете иметь либо четыре, либо пять. Так что это сложный аспект, который фактически вносит некоторые виды предвзятости в то, как вы смотрите на эту запись и, возможно, на то, как вы строите свой прогноз. Но это также верно и для других измерений, например, смотрите ли вы по SKU или по продукту или по категории? Все они вносят свои собственные проблемы.
Николь Зинт: Итак, когда речь идет об этих разных уровнях агрегации данных, мы не можем просто выбрать, скажем, SKU в день, который является наиболее детализированным уровнем, и затем восстановить практически любой другой уровень агрегации из этого?
Жоанн Верморель: Во-первых, да, есть такая искушение выбрать супер детализированные уровни. В цепи поставок наиболее разумным уровнем детализации по времени является уровень по дням. Однако это довольно произвольное решение. Мы могли бы решить, что это будет по минутам, и, например, если вы управляете колл-центром и хотите посмотреть на скорость поступления входящих звонков, у вас будет намного более детализированный уровень наблюдения за входящими звонками. Так что это действительно зависит от того, какие вещи имеют смысл для основной ситуации в цепи поставок.
Теперь, если мы немного вернемся назад во времени, нам нужно немного понять, откуда мы идем. Давайте посмотрим на типичный магазин с 10 000 SKU в типичной розничной сети с 100 магазинами. Так что это даже не очень большая розничная сеть. Речь идет о 10 000 умножить на 100, что равно 1 миллиону SKU, а затем о ежедневных данных. Так что если мы хотим иметь историю за три года, речь идет о тысяче дней. Так что мы говорим о миллиарде точек данных. Чтобы представить ежедневные агрегированные данные на уровне SKU в скромной розничной сети, мы уже говорим о чем-то, что составляет миллиард точек данных.
На компьютере это уже будет четыре гигабайта памяти. Если мы вернемся немного назад во времени, мы увидим, что такой объем памяти даже не был доступен до 90-х годов. Кстати, термин “бизнес-аналитика” как класс программного обеспечения предприятия появился в 90-х годах, именно когда появились на рынке компьютеры с объемом памяти в гигабайты. Так что эти две вещи шли рука об руку. Вам нужны были компьютеры, способные представлять такие большие объемы данных.
Николь Зинт: Итак, эти большие кубы на самом деле были программным обеспечением, разработанным для работы в памяти, что просто грандиозным образом означало, что давайте воспользуемся этой новой случайной доступной памятью. И на основе этого она становится стандартной, хотя мы не должны забывать, что это было довольно произвольным. Когда вы говорите, что это наименьший уровень, который имеет смысл для цепей поставок, является ли этот уровень агрегации по дням и SKU точным?
Жоанн Верморель: Да, но у вас есть много крайних случаев. Например, если у вас есть товар, который подвержен порче, вопрос в том, достаточно ли агрегации по дням и SKU, чтобы дать вам точное представление о вашем уровне запаса. Если вы смотрите на товар, который подвержен порче, ответ - нет. У вас может быть 10 единиц на складе, но если 9 из 10 единиц собираются истечь завтра, то то, что у вас на самом деле есть на складе, в основном одна единица плюс девять, которые на грани исчезновения. Так что в этом случае уровень запаса не достаточно детализирован, и уровень SKU не достаточно детализирован. Вы бы хотели иметь уровень запаса, соответствующий хотя бы одной неделе срока годности, и, возможно, уровень запаса, соответствующий хотя бы одному месяцу срока годности. Так что вы бы ввели еще одно измерение, чтобы получить лучшее представление.
Nicole Zint: А что насчет времени? Ежедневный уровень подходит или нам следует рассмотреть более детализированный уровень?
Joannes Vermorel: Ежедневный уровень может быть подходящим, за исключением того, что могут быть магазины, которые открыты, скажем, только в выходные или только утром. Если вы не знаете, что у вас есть магазин, который открыт только полдня, вам не хватает информации. Так что, возможно, иметь более детализированный уровень, например, утро и вечер, даст вам более ценную информацию. Каждое произвольное решение о вашем уровне агрегации имеет свои плюсы и минусы. Мое сообщение здесь заключается в том, что это довольно произвольно, и в этом нет никакой великой истины, но очень интересно понять, откуда берутся эти решения.
Nicole Zint: Предположим, мы находим самый детализированный уровень, который соответствует нашим ценовым возможностям. Если у нас есть доступ к самому детализированному уровню, но мы все равно хотим смотреть прогноз на недельной основе, например, можем ли мы просто восстановить уровень, который мы хотим получить, просто из самого детализированного уровня?
Joannes Vermorel: Конечно. Если мы вернемся к исходной транзакционной истории, то при любой агрегации вы теряете данные в терминах информации. Независимо от того, какую агрегацию вы выполняете, вы всегда можете восстановить более высокий уровень из самых детализированных данных.
Nicole Zint: Фактически, это процесс с потерей информации, поэтому вы теряете информацию. Таким образом, у вас меньше информации, поэтому, вероятно, имеет смысл, что точность уменьшается, верно? Чем выше уровень агрегации, тем менее точным он становится?
Joannes Vermorel: Да, но то, что у нас есть, это именно то, почему мы хотим иметь такую агрегацию. Я бы сказал, что это связано с кубом, потому что у нас есть программное обеспечение, которое работает относительно быстро. Идея заключается в том, что когда у вас есть гиперкуб, операции, такие как срез и нарезка, могут выполняться очень эффективно. Это очень техническая причина. Таким образом, если вы хотите перейти от ежедневного к недельному, это очень эффективная операция, которую вы можете выполнить на кубе.
Фактически, с точки зрения чистой теории информации, когда мы переходим на более агрегированный уровень, мы теряем информацию. Таким образом, в теории, если мы хотим иметь что-то, что было бы более точным утверждением о будущем, мы бы хотели работать с наиболее детализированными данными. Однако люди думают, что наиболее детализированные данные будут данные по SKU по дням, и я бы сказал, подождите, наиболее детализированные данные - это даже не агрегированные данные вообще. Это будут исходные транзакционные данные.
Причина, по которой люди останавливаются на уровне SKU в день, заключается в том, что это последний уровень, на котором вы все еще работаете с временными рядами. Если вы хотите пойти дальше и работать с исходной транзакционной историей, то, по сути, вам придется отказаться от перспективы временных рядов. Почему? Потому что данные не структурированы как временной ряд. Это буквально реляционные данные, поэтому у вас есть таблицы в вашей базе данных. Это больше не структурировано как временной ряд, конечно, не как равноотстоящий временной ряд.
Временные ряды возникают только тогда, когда вы по существу создаете векторы, в которых вы говорите, что на каждый период (период может быть днем, неделей или месяцем) у вас есть количество, а затем у вас есть вектор количеств. Вы хотите расширить это с помощью модели временных рядов. Если вы работаете только с таблицей с, скажем, 100 столбцами, это не временной ряд; это просто реляционная таблица в базе данных. Это очень распространено, но это не временной ряд. Ограничивающим фактором является выбранный метод прогнозирования.
Вопрос в том, почему это так привлекательно? Ответ в том, что большинство отраслей цепочки поставок работают с моделью временных рядов. Таким образом, очевидно, если вы решили, что все должно соответствовать модели временных рядов, то гиперкуб является очень привлекательным фактором, потому что все, на что вы смотрите, пока одно из измерений - это время, вы всегда смотрите на временные ряды в той или иной форме на разных уровнях агрегации.
Но вот здесь кроется суть. Хотя, в теории, теория информации говорит нам, что чем больше мы дезагрегируем, тем больше информации у нас есть и, следовательно, тем больше мы можем узнать о будущем. Реальность заключается в том, что техники временных рядов, большинство из них, не все, склонны очень плохо работать с очень разреженными, неустойчивыми, прерывистыми данными. Проблема заключается в том, что при работе с очень дезагрегированными данными техники временных рядов менее эффективны.
Nicole Zint: С вашей точки зрения вашей техники временных рядов, а не с реальной точки зрения, реальная точка зрения заключается в том, что у вас есть все больше и больше данных, но с точки зрения вашей техники временных рядов у вас есть вектор, который становится все более разреженным, так что больше нулей. И временной ряд - это больше одного и того же, верно? Так что мы предполагаем, что будущее симметрично прошлому. Отсюда исходит это?
Joannes Vermorel: Да, но это верно для всех методов, основанных на данных. Так что все методы, основанные на данных, в основном полагаются, одним образом или другим, на идее, что будущее будет больше того же самого. Видите ли, это действительно не зависит от того, можно сказать, что это машинное обучение, искусственный интеллект, временные ряды, что угодно, это всегда одна и та же идея. Все наши статистические методы основаны на идее, что будущее будет больше того же самого по сравнению с прошлым.
Nicole Zint: Но, конечно, если вы становитесь более детализированными, вы теряете, например, сезонность и так далее, верно?
Joannes Vermorel: Нет, характеристика временных рядов - это очень техническая характеристика. Это то, что модель временных рядов дает вам очень симметричную модель в том смысле, что будущее, с точки зрения структуры данных, выглядит точно так же, как прошлое. Это что-то очень специфичное для временных рядов. Когда вы говорите о большем количестве одного и того же, да, но я делаю заявление о будущем. Это заявление не обязательно должно иметь точную форму и формат по сравнению с моими историческими записями. Так оно может быть, но может и не быть.
Временные ряды крайне обольщают, но я считаю, что они также очень вводят людей в заблуждение. Они крайне обольщают, потому что сущность будущего и прошлого абсолютно симметрична. И когда я говорю об абсолютной симметрии, просто представьте себе ваш гиперкуб или куб. У вас есть измерение для SKU, измерение для дня, измерение для чего-то еще, и, по сути, будущее просто берет ваше измерение для дня и расширяет это измерение, скажем, на 100 ячеек.
И вот оно, у вас есть будущее, и тогда вы бы сказали, что прогноз просто заполняет пробелы. Так что буквально вы бы сказали, что это те же самые данные; есть данные, которые я наблюдал, а затем данные, в которые я собираюсь заполнить пробелы с помощью моей модели прогнозирования временных рядов. Однако между прошлым и будущим есть очень радикальная и фундаментальная асимметрия.
Если вы придерживаетесь классической перспективы среднего прогноза временных рядов, вы делаете то, что делает вид, что будущее точно такое же, как прошлое, по своей природе, не только потому, что оно еще не произошло. Это буквально в терминах формата данных, в терминах того, как о нем думать, вы просто говорите, что это полностью то же самое. И мое предложение, которое больше похоже на философское заявление, чем на научное, состоит в том, что нет, это очень разное.
Nicole Zint: Я все еще вижу много запросов на предложения, и они спрашивают у поставщиков, можете ли вы дать нам все эти уровни сразу? Разные уровни агрегации, почему?
Joannes Vermorel: Опять же, это стандартный вопрос. Люди настаивают на этом, потому что они привыкли к этому, но важно признать, что разные уровни агрегации могут привести к очень разным результатам и идеям.
Nicole Zint: Здесь ложь заключается в том, что вы начинаете с этой модели временных рядов, и эта модель временных рядов имеет своего аналога в программной индустрии с бизнес-аналитикой, где все в основном является кубом или версией, которая нарезана или нарезана из куба. Теперь люди понимают, что они теряют информацию, когда они идут, но каким-то образом они не очень уверены, почему. Метрика говорит им, что их очень детализированный прогноз - полная ерунда. Реальность может быть в том, что просто потому, что они не используют правильный метод, он действительно очень плохой.
Joannes Vermorel: Итак, они говорят: “Хорошо, наш прогноз очень плохой.” Я говорю: “Ну, нам нужна возможность подняться на более высокий уровень агрегации. Это может быть, например, по неделям или по продукту вместо того, чтобы иметь по SKU.” Но они не знают, какой они хотят выбрать. Поэтому, когда они обращаются к поставщику, они хотят оставить открытыми свои варианты и в результате получают полу-смешные запросы на предложения, в которых есть более ста вопросов, и они хотят иметь все уровни агрегации.
Просто потому, что с их точки зрения они оставляют открытой возможность применения модели прогнозирования временных рядов на каком-то уровне. Но здесь я действительно оспариваю сам факт, почему вы должны агрегировать свои данные в первую очередь, и почему ваша техника прогнозирования должна начинать отбрасывать данные еще до того, как она начнет работать? Вы теряете данные, поэтому это проблема, и агрегирование больше просто заставляет вас терять больше данных.
И если вы скажете: “Но подождите, мы не можем работать на очень детализированном уровне, потому что наша метрика, которая является процентом ошибки, говорит нам, что это очень плохо.” Мы говорим: “Да, но вы не оптимизируете процент ошибки; вы хотите оптимизировать долларовую ошибку. Но вы смотрите на метрику процентов, поэтому она не соответствует долларам.”
Nicole Zint: Да, и именно. Потому что если вы идете по этой ложной идее, вы переходите от ежедневного к еженедельному, получаете более точный прогноз; затем от еженедельного к ежемесячному, более точный прогноз; затем от еженедельного к ежегодному. И тогда люди говорят: “О, подождите, годовой прогноз, что я буду делать с годовым прогнозом? Если вы принимаете решения на еженедельной основе, как поможет вам ежемесячный прогноз?”
Joannes Vermorel: Вот в чем проблема. Реальность заключается в том, что единственный релевантный горизонт - это тот, который релевантен для вашего решения. Но давайте рассмотрим очень простое решение, такое как пополнение запасов. Дайте нам пример того, что является релевантным горизонтом. Ответ очень сложный. Сначала у вас будут лид-таймы, но лид-тайм не гарантирован. Допустим, у вас есть поставщик из-за рубежа, поэтому ваши лид-таймы могут быть - это не постоянное значение, это что-то, что меняется. Так что ваш лид-тайм может быть чем-то вроде 10 недель, но потенциально с возможностью огромных отклонений.
Некоторые из этих отклонений, кстати, сезонные, как, например, Китайский Новый год. Фабрики в Китае закрываются, поэтому у вас появляются четыре дополнительные недели лид-таймов. Так что ваш горизонт, если мы просто смотрим на лид-таймы, - это нечто очень изменчивое и потребует своего собственного прогноза. Кстати, одна из проблем с этими моделями временных рядов заключается в том, что мы всегда смотрим на что-то вроде продаж. Все остальное, что вам нужно прогнозировать, например, ваши лид-таймы, они все еще постоянны. Это еще хуже, они даже не существуют, знаете ли вы.
Nicole Zint: Итак, куб даже не представляет собой такого рода литературу; он выбран произвольно. Ваш горизонт будет вашими лид-таймами, но вашим лид-таймам потребуется прогнозирование красной зоны, которая не очень подходит для этой перспективы временных рядов и программного обеспечения куба. Но должен ли ваш горизонт для оценки действительности вашего решения останавливаться только на лид-тайме?
Joannes Vermorel: Нет, потому что очевидно, если вы решите разместить повторный заказ сейчас, вы хотите удовлетворить спрос, который возникнет между сейчас и датой поступления вашего товара. Но затем вам придется продать то, что вы только что получили. Чтобы оценить целесообразность заказа, вы должны посмотреть, что происходит после этого. И насколько в далекое будущее вы должны смотреть? Ну, это зависит. Если заказ, который вы передаете, вызывает всплеск спроса, то вы можете фактически получить товары и продать все за два дня. Но что, если наоборот, и у вас происходит снижение спроса? Вы можете хранить запасы в течение целого года, конечно, если они не подвержены порче, но я просто упрощаю.
Итак, горизонт, который применим, - это нечто, что чрезвычайно зависит от того, как вы смотрите в будущее, и это свой собственный прогноз, потому что это прогноз, в котором вам нужно предсказать лид-таймы. И тогда горизонт, который мы должны рассмотреть, даже если мы смотрим только на спрос, зависит от того, насколько быстро вы ожидаете фактически реализовать свои запасы. Таким образом, в конечном счете, нет четкого ограничения в терминах применимого горизонта для вашего прогноза. Единственное, что волнует, - чем дальше мы заглядываем в будущее, тем неопределеннее становится прогноз.
Однако это технический момент, и в какой-то момент возникает компромисс между стоимостью ЦП и потенциальным маргинальным улучшением для вашей цепочки поставок. Но, видите ли, с концептуальной точки зрения нет ограничений на то, насколько далеко вы хотите заглянуть в будущее.
Nicole Zint: Итак, чтобы заключить, уровень детализации всегда должен соответствовать уровню принимаемых вами решений?
Joannes Vermorel: Да, я бы сказал, что ваша детализация будет очень сильно зависеть от принимаемых решений. Но имейте в виду, что эта идея агрегации делает предположение о том, какой метод вы хотите использовать. Мое предложение состоит в том, чтобы сосредоточиться на самом решении, которое вы принимаете. Решения - это то, что имеет осязаемое влияние на вашу цепочку поставок, такие как повторный заказ, изменение цены вверх или вниз и другие действия, которые имеют реальное финансовое осязаемое влияние на цепочку поставок. Но затем я бы сказал, остерегайтесь самой идеи детализации. Это очень выдумано, очень произвольно, и не путайте вашу потребность в визуализации, что вполне нормально - вы хотите иметь возможность визуализировать - с детализацией, которая необходима для принятия решений.
Nicole Zint: Временные ряды - это невероятно мощный инструмент для визуализации данных. Однако не путайте эту потребность в визуализации с другими требованиями к прогнозированию и оптимизации, которые не обязаны работать с любым произвольным уровнем детализации. Когда я говорю о произвольном уровне детализации, я имею в виду все, что не является просто отражением данных, как они существуют в ваших корпоративных системах. Любая агрегация, которую вы добавляете сверху, приведет к потере данных.
Joannes Vermorel: Возможно, это будет хороший компромисс в том смысле, что, возможно, путем агрегации вы сэкономите ЦП или память, но, возможно, и нет. Это очень техническое обсуждение, и мое предложение состоит в том, чтобы не делать какой-либо преждевременной оптимизации. Постарайтесь не сразу думать о тех уровнях агрегации, как о сложных проблемах; они в основном являются простыми проблемами, когда речь идет о визуализации. С современными компьютерными системами очень легко иметь избыток возможностей по сравнению с вашими фактическими потребностями.
В 90-х годах было сложно агрегировать данные по дням, но сейчас это не так. Если поставщик говорит вам, что у него есть ограничение на пять лет истории, это просто странно. Такого ограничения нет. Есть множество способов справиться с любым уровнем детализации, даже до миллисекунды. Однако это не обязательно то, что является особенно разумным, и вы не хотите делать это с фактическим кубом, где вы используете один байт памяти для каждой ячейки в вашем кубе. Это очень технический аспект.
Современные системы предоставят вам любой вид агрегации, который вам нужен и даже больше. Это не ограничение. Не рассуждайте по аналогии, пытаясь думать о всех техниках, которые вы хотите использовать на основе этого куба, как если бы это был единственный способ рассмотреть проблему. Это не так. Многое теряется, такие как перишируемость, каннибализация, замещение и изменяющиеся лидирующие сроки. Факт того, что вы все ограничиваете кубом, накладывает ограничения на то, о чем вы можете даже думать о вашей цепочке поставок, и это плохо. Мое предложение - не заключайте свой разум в клетку. Просто попробуйте иметь широкую перспективу, потому что есть так много произвольных ограничений, которые не помогают решать проблемы вашей цепочки поставок.
Nicole Zint: Большое спасибо, Йоаннес, за то, что поделились своими мыслями по этой теме. Спасибо за просмотр, и увидимся на следующей неделе.