Вероятностное экспоненциальное сглаживание для объяснимого ИИ в сфере цепочек поставок
Одно из направлений исследований компании Lokad заключается в пересмотре чего-то простого (и фундаментального) с целью сделать это немного лучше (и еще проще). Такой подход противоположен большинству исследовательских работ, которые зачастую представляют собой более сложные версии предыдущих исследований. Таким образом, по умолчанию мы стремимся к большей простоте, а не к излишней утонченности. Один из инженеров R&D компании Lokad, Антонио Чифонелли, применил этот подход в своей докторской диссертации, взявшись за классическую модель экспоненциального сглаживания, чтобы улучшить её характеристики — а именно, сделать её более объяснимой.

Объяснимость как качество модели часто неправильно понимается как по своей природе, так и по назначению — по крайней мере, когда речь идет о цепочках поставок. Наличие объяснимой модели не означает получение результатов, которые могут быть легко поняты или проверены человеческим разумом. Это было бы ошибкой, поскольку полдюжины операций с плавающей запятой уже достаточно, чтобы запутать большинство людей, включая тех, кто считает себя уверенными в работе с числами. Человеческий мозг просто не приспособлен к выполнению базовой арифметики; в конце концов, именно эта область первой уступила свое место машинам в 1950-х годах. Кроме того, объяснимость не предназначена для того, чтобы сделать модель заслуживающей доверия — ну, почти. Существуют более надежные инструменты (ретроспективное тестирование, кросс-валидация и т.д.) для оценки того, можно ли доверять модели. Способность выстраивать повествование о модели и ее результатах не должна считаться достаточным основанием для доверия.
С точки зрения Lokad, цель объяснимости заключается в сохранении возможности управлять цепочкой поставок посредством варианта модели при возникновении срыва, который делает исходную модель недействительной. Нарушения бывают разнообразными: войны, тарифы, локдауны, банкротства, штормы, судебные тяжбы и т.д. Когда происходит сбой, прогностическая модель становится недействительной в тонких, но важных аспектах. Однако это не означает, что все шаблоны, когда-либо зафиксированные моделью, теряют свою актуальность. Например, профиль сезонности модели может оставаться полностью неизменным.
Таким образом, объяснимая модель должна предоставлять возможности специалисту по цепям поставок для модификации, настройки или искажения исходной модели с целью получения варианта, который адекватно отразит возникший сбой. Естественно, такие изменения предполагаются как приблизительные оценки — эвристического характера, поскольку точные данные еще недоступны. Тем не менее, как гласит девиз Lokad, лучше быть примерно правильным, чем абсолютно ошибочным.
Для получения дополнительных сведений о том, как могут выглядеть объяснимые модели, ознакомьтесь с докторской диссертацией д-ра Чифонелли ниже.
Автор: Антонио Чифонелли
Дата: Декабрь 2023
Аннотация:
Ключевая роль, которую ИИ может сыграть в улучшении бизнес-процессов, известна уже давно (по крайней мере, с 2017 года), однако процесс внедрения этой новой технологии столкнулся с определенными препятствиями в компаниях, в частности, с затратами на внедрение. Компании продолжают цепляться за свои старые системы из-за энергии и средств, необходимых для их замены. В среднем от выбора поставщика до полного внедрения нового решения проходит 2,8 года. При разработке новой модели следует учитывать три фундаментальных аспекта: несогласованность ожиданий, необходимость понимания и объяснения, а также проблемы с производительностью и надежностью. В случае моделей, работающих с данными о цепочках поставок, существует еще пять специфических моментов:
- Управление неопределенностью. Точность — не самое главное. Лица, принимающие решения, ищут способ минимизировать риск, связанный с каждым их решением в условиях неопределенности. Получение точного прогноза является преимуществом; получение достаточно точного прогноза и вычисление его границ является реалистичной и обоснованной задачей.
- Обработка целочисленных и положительных данных. Большинство товаров, продаваемых в розничной торговле, не могут продаваться дробными единицами, например, банка с продуктами, запасная деталь или футболка. Этот простой аспект продаж приводит к ограничению, которое должно соблюдаться: результат любой модели должен быть положительным целым числом.
- Наблюдаемость. Спрос потребителей нельзя измерить напрямую, можно лишь зафиксировать продажи, которые используются как индикатор спроса.
- Скудность и бережливость. Продажи являются дискретной величиной: один товар может хорошо продаваться на одной неделе, а на следующей вовсе не продаваться. Записывая продажи по дням, весь год сводится к всего 365 (или 366) точкам. Более того, большая их часть окажется нулевой.
- Оптимизация в режиме just-in-time. Прогнозирование является ключевой функцией, но оно — лишь один элемент в цепочке процессов, поддерживающих принятие решений. Время — драгоценный ресурс, который нельзя полностью посвятить одной функции. Процесс принятия решений и связанные с ним адаптации должны осуществляться в рамках ограниченного временного интервала и с достаточной гибкостью, чтобы при необходимости их можно было прервать и возобновить для учета непредвиденных обстоятельств или необходимых корректировок.
Диссертация вписывается в этот контекст и является результатом работы, проведенной в самом сердце Lokad — парижской компании-разработчика программного обеспечения, цель которой заключается в преодолении разрыва между технологиями и цепочками поставок. Докторское исследование было профинансировано Lokad в сотрудничестве с ANRT по контракту CIFRE. Предлагаемая работа стремится быть хорошим компромиссом между новыми технологиями и бизнес-ожиданиями, затрагивая все упомянутые аспекты. Мы начали прогнозирование с использованием базовых методов — семейства экспоненциального сглаживания — которые просты в реализации и исключительно быстры в работе. Поскольку они широко используются в индустрии, они уже заслужили доверие пользователей. Более того, их легко понять и объяснить неспециалисту. Используя более современные методы ИИ, можно преодолеть некоторые ограничения используемых моделей. Кросс-обучение оказалось релевантным подходом для экстраполяции полезной информации, когда количество доступных данных было крайне ограничено. Поскольку обычное гауссовское предположение не подходит для дискретных данных о продажах, мы предложили использовать модель, основанную либо на распределении Пуассона, либо на отрицательном биномиальном распределении, которое лучше соответствует природе явлений, подлежащих моделированию и прогнозированию. Мы также предложили использовать моделирование для учета неопределенности. С помощью Монте-Карло симуляций генерируется, отбирается и моделируется ряд сценариев с использованием распределения. На основе этого распределения можно вывести доверительные интервалы различных размеров, адаптированные к ситуации. Используя реальные данные компании, мы сравнили наш подход с передовыми методами, такими как модель Deep Auto-Regressive (DeepAR), модель Deep State Space (DeepSSMs) и модель Neural Basis Expansion Analysis (N-Beats). В итоге была выведена новая модель на основе метода Хольта-Уинтерса. Эти модели были внедрены в рабочий процесс Lokad.
Жюри:
Защита состоялась перед жюри, состоящим из:
- M. Massih-Reza AMINI, профессор Université Grenoble, Alpes, рецензент.
- M.me Mireille BATTON-HUBERT, профессор École des Mines de Saint-Étienne, рецензент.
- M.me Samia AINOUZ, профессор INSA Rouen, Нормандия, экзаменатор.
- M. Stéphane CANU, профессор INSA-Rouen, Нормандия, научный руководитель диссертации.
- M.me Sylvie LE HÉGARAT-MASCLE, профессор Paris-Saclay, экзаменатор.
- M. Joannes VERMOREL, генеральный директор Lokad, приглашенный член.