Данные цепочки поставок представляют себя в основном как реляционные данные: заказы, клиенты, поставщики, продукты и т. д. Эти данные собираются через бизнес-системы - ERP, CRM, WMS - которые используются для работы компании.

Однако большинство основных методов машинного обучения плохо подходят для работы с реляционными данными. Работа с реляционными данными обычно является послесловием и обычно включает некоторые умные хаки поверх дизайна, который решительно не соответствует реляционной перспективе.

Различение реляционных запросов

Lokad разработала свою собственную версию дифференцируемого программирования, делая реляционный случай использования в центре внимания. Действительно, мы хотим, чтобы наши инструменты машинного обучения нативно учитывали реляционную природу данных. По сравнению с альтернативными вариантами, этот подход дает множество преимуществ, эти модели:

  • проще в написании
  • легче понять и анализировать
  • более интерпретируемые
  • быстрее обучаются и выполняются
  • и т. д.

Платформа Lokad является программной и с самого начала фокусировалась на обработке и визуализации реляционных данных. Однако в 2019 году мы отправились в новое путешествие, решив сделать нашу полную стопку инструментов машинного обучения также принять реляционную парадигму.

Различение реляционных запросов - это небольшой, но фундаментальный строительный блок в этом направлении. Это средство передачи градиентов через реляционные запросы. Эти градиенты используются, в свою очередь, для выполнения стохастического градиентного спуска, который обычно представляет собой основу логики обучения/оптимизации.

Ниже представлен вклад Поля Пезе (Lokad) по этой очень важной теме.


Title: Различение реляционных запросов

Author: Поль Пезе, Lokad

Из Материалы докторской диссертации VLDB 2021, 16 августа 2021 года.

Аннотация: Эта работа посвящена выполнению автоматического дифференцирования запроса в контексте реляционных баз данных и запросов. Это делается для выполнения оптимизации с помощью градиентного спуска в этих реляционных базах данных. В этой работе описывается форма автоматического дифференцирования для подмножества реляционных запросов.

Скачать статью (PDF)

Скачать слайды (PDF)