Одним из направлений исследований Lokad является пересмотр простых (и фундаментальных) вещей и попытка сделать их немного лучше (и немного проще). Такой подход обычно является прямой противоположностью большинства научных статей, которые, как правило, являются более сложными версиями некоторой предыдущей работы. Таким образом, по умолчанию мы стремимся к большей простоте, а не к большей сложности. Один из инженеров R&D Lokad, Антонио Чифонелли, применил этот подход в своей докторской диссертации, взяв за основу уважаемую модель экспоненциального сглаживания и придав ей лучшие характеристики, а именно, сделав ее более объяснимой.

Две фигуры из докторской диссертации о вероятностном экспоненциальном сглаживании для объяснимого искусственного интеллекта в области цепочки поставок.

Объяснимость, как качество модели, часто неправильно понимается как в своей природе, так и в своем намерении, по крайней мере, в отношении цепочек поставок. Иметь объяснимую модель не означает получать результаты, которые могут быть легко поняты или проверены человеческим разумом. Это было бы очень ошибочно, учитывая, что полдюжины операций с плавающей запятой уже достаточно, чтобы запутать большинство людей, включая тех, кто считает себя владеющими числами. Человеческий разум просто не (естественно) способен, когда дело доходит до базовой арифметики; в конце концов, это была первая область, которую машины завоевали в 1950-х годах. Кроме того, объяснимость не предназначена для того, чтобы сделать модель надежной - ну, не совсем. Есть более надежные инструменты (обратное тестирование, кросс-валидация и т. д.), чтобы оценить, следует ли доверять модели или нет. Возможность создать повествование о модели и ее результатах не должна считаться достаточным основанием для доверия.

С точки зрения Lokad, цель объяснимости заключается в сохранении возможности управления цепочкой поставок с помощью варианта модели при столкновении с нарушением, которое делает исходную модель недействительной. Нарушения в цепочке поставок разнообразны: войны, тарифы, блокировки, банкротства, штормы, судебные разбирательства и т. д. Когда происходит нарушение, прогностическая модель становится недействительной в тонких, но важных аспектах. Однако это не означает, что все образцы, когда-либо захваченные моделью, перестают быть актуальными. Например, профиль сезонности модели может остаться полностью неизменным.

Таким образом, объяснимая модель должна предоставлять способы специалисту по цепям поставок изменять, настраивать или искажать исходную модель, чтобы получить вариант, который адекватно отражает нарушение. Естественно, эти изменения должны быть приблизительными - эвристическими по своей природе, так как точные данные еще не доступны. Тем не менее, как гласит девиз Lokad, лучше быть приблизительно правильным, чем точно неправильным.

Для получения дополнительной информации о том, как могут выглядеть объяснимые модели, ознакомьтесь с диссертацией доктора Чифонелли ниже.

Автор: Антонио Чифонелли

Дата: декабрь 2023 года

Аннотация:

Ключевую роль, которую искусственный интеллект может сыграть в улучшении бизнес-процессов, известно уже давно (по крайней мере, с 2017 года), но процесс проникновения этой новой технологии столкнулся с определенными препятствиями внутри компаний, в частности, с затратами на внедрение. Компании остаются привязанными к своим старым системам из-за энергии и денег, необходимых для их замены. В среднем проходит 2,8 года от выбора поставщика до полного внедрения нового решения. При разработке новой модели необходимо учитывать три основных аспекта. Несоответствие ожиданий, необходимость понимания и объяснения, а также проблемы производительности и надежности. В случае моделей, работающих с данными цепи поставок, существуют еще пять специфических проблем:

  • Управление неопределенностью. Точность - не все. Принимающие решения ищут способ минимизировать риск, связанный с каждым принимаемым ими решением в условиях неопределенности. Получение точного прогноза - это преимущество; получение достаточно точного прогноза и расчет его пределов - это реалистично и целесообразно.
  • Обработка целых и положительных данных. Большинство товаров, продаваемых в рознице, не могут быть проданы в подразделениях, например, банка пищи, запасной части или футболки. Этот простой аспект продажи приводит к ограничению, которому должен удовлетворять результат любого данного метода или модели: результат должен быть положительным целым числом.
  • Наблюдаемость. Потребность клиента нельзя измерить напрямую, можно записать и использовать только продажи в качестве приближенной меры спроса.
  • Ограниченность и скудность. Продажи - это дискретная величина: продукт может хорошо продаваться одну неделю, а затем совсем не продаваться на следующей. Записывая продажи по дням, целый год сжимается в всего 365 (или 366) точек. Более того, большая часть из них будет равна нулю.
  • Оптимизация “вовремя”. Прогнозирование - это ключевая функция, но она является только одним элементом в цепи процессов, поддерживающих принятие решений. Время - это ценный ресурс, который нельзя полностью посвятить одной функции. Процесс принятия решений и связанные с ним адаптации должны быть выполнены в ограниченные сроки и достаточно гибко, чтобы их можно было прервать и возобновить при необходимости для учета непредвиденных событий или необходимых корректировок.

Эта диссертация вписывается в этот контекст и является результатом работы, проведенной в центре компании Lokad, парижской компании по разработке программного обеспечения, стремящейся сократить разрыв между технологиями и цепью поставок. Докторская работа была финансирована компанией Lokad в сотрудничестве с ANRT в рамках контракта CIFRE. Предлагаемая работа стремится найти хороший компромисс между новыми технологиями и ожиданиями бизнеса, рассматривая вышеупомянутые аспекты. Мы начали прогнозирование с использованием базовых методов - семейства экспоненциального сглаживания - которые легко реализовать и очень быстро выполнять. Поскольку они широко используются в индустрии, они уже завоевали доверие пользователей. Более того, их легко понять и объяснить неподготовленной аудитории. Используя более продвинутые методы искусственного интеллекта, можно преодолеть некоторые ограничения используемых моделей. Показалось, что кросс-обучение является релевантным подходом для экстраполяции полезной информации, когда количество доступных данных очень ограничено. Поскольку обычное гауссово предположение не подходит для дискретных данных о продажах, мы предложили использовать модель, связанную либо с распределением Пуассона, либо с отрицательным биномиальным распределением, которое лучше соответствует характеру явлений, которые мы пытаемся моделировать и прогнозировать. Мы также предложили использовать симуляцию для работы с неопределенностью. С помощью симуляций методом Монте-Карло генерируются, выбираются и моделируются несколько сценариев с использованием распределения. Из этого распределения можно вывести доверительные интервалы различных и подходящих размеров. Используя реальные данные компании, мы сравнили наш подход с передовыми методами, такими как модель Deep Auto-Regressive (DeepAR), модель Deep State Space (DeepSSMs) и модель Neural Basis Expansion Analysis (N-Beats). Мы вывели новую модель на основе метода Хольта-Винтера. Эти модели были реализованы в рабочем процессе Lokad.

Жюри:

Защита состоялась перед жюри, в состав которого входили:

  • М. Массих-Реза АМИНИ, профессор Университета Гренобля, Альпы, Рецензент.
  • М. Мирей БАТТОН-ЮБЕР, профессор Школы горных инженеров Сент-Этьенна, Рецензент.
  • М. Самия АЙНУЗ, профессор ИНСА Руан, Нормандия, Экзаменатор.
  • М. Стефан КАНУ, профессор ИНСА-Руан, Нормандия, Руководитель диссертации.
  • М. Сильви ЛЕ ЭГАРА-МАСКЛ, профессор Париж-Сакле, Экзаменатор.
  • М. Жоанн ВЕРМОРЕЛ, генеральный директор Lokad, Приглашенный член.

Скачать диссертацию (PDF)