Дифференцирование реляционных запросов
Данные цепочки поставок представлены почти исключительно реляционными данными: заказы, клиенты, поставщики, продукты и т.д. Эти данные собираются через бизнес-системы — ERP, CRM, WMS — которые используются для управления компанией.
Тем не менее, большинство популярных методов машинного обучения плохо подходят для работы с реляционными данными. Работа с реляционными данными обычно является второстепенной задачей, часто требующей умелых обходных решений поверх дизайна, категорически не соответствующего реляционной перспективе.

Компания Lokad разработала свою собственную вариацию дифференцируемого программирования, выдвигая реляционный случай использования на первый план. Действительно, мы хотим, чтобы наши инструменты машинного обучения естественно учитывали реляционную природу данных. По сравнению с альтернативными вариантами, этот подход дает многочисленные преимущества, среди которых:
- проще написать
- легче понять и анализировать
- более интерпретируемые
- быстрее обучаются и выполняются
- и т.д.
Платформа Lokad является программируемой и с самого начала сосредоточена на обработке и визуализации реляционных данных. Однако в 2019 году мы отправились в новое путешествие, решив, что весь наш стек машинного обучения должен также включать реляционную парадигму.
Дифференцирование реляционных запросов является небольшим, но фундаментальным строительным блоком в этом направлении. Это средство для передачи градиентов через реляционные запросы. Эти градиенты, в свою очередь, используются для выполнения стохастического градиентного спуска, который обычно представляет собой основную логику обучения и оптимизации.
Ниже представлена работа, в которой Пол Пезо (Lokad) вносит свой вклад по этому вопросу.
Название: Дифференцирование реляционных запросов
Автор: Paul Peseux, Lokad
Из Трудов VLDB 2021 PhD Workshop, 16 августа 2021 года.
Аннотация: Эта работа посвящена выполнению автоматического дифференцирования запроса в контексте реляционных баз данных и запросов. Это делается для проведения оптимизации с помощью градиентного спуска в этих реляционных базах данных. В работе описывается форма автоматического дифференцирования для подмножества реляционных запросов.