機械学習(ML)の広範な分野は、さまざまな状況をカバーする多くの技術と手法を提供しています。しかし、サプライチェーンには独自のデータの課題があり、サプライチェーンの実践者にとって「基本的」と思われる側面でも、満足のいくMLの手段を提供していないことがあります。これは、サプライチェーンにおいては「カテゴリカル変数」が頻繁に存在し、製品カテゴリ、原産国、支払方法などを表すために使用されるためです。そのため、私たちの一部は、差分可能プログラミングの観点からカテゴリカル変数の概念を再評価することにしました。

カテゴリカル特徴量の勾配推定子を用いた確率的勾配降下法

サプライチェーンでは、カテゴリカル変数が頻繁に欠落していることがあります。これは、データが不明ではないためではなく、分類自体が常に「意味をなさない」ためです。たとえば、「カット」(ストレート/スキニー/スリムなど)はパンツに適用されますが、ベルトには適用されません。したがって、「欠損データ」と「適用不可能データ」の区別は微妙ですが、重要です。これは、モデルの振る舞いがきちんとしたものから奇妙なものに変わる要因です。

以下の論文は、Paul Peseux(Lokad)、Victor Nicollet(Lokad)、Maxime Berar(Litis)、Thierry Paquet(Litis)の貢献を紹介しています。

Title: カテゴリカル特徴量の勾配推定子を用いた確率的勾配降下法

Authors: Paul Peseux、Maxime Berar、Thierry Paquet、Victor Nicollet

Abstract: カテゴリカルデータは、健康やサプライチェーンなどの重要な領域に存在し、このデータには特別な処理が必要です。最近の機械学習モデルをこのようなデータに適用するためには、エンコーディングが必要です。解釈可能なモデルを構築するためには、ワンホットエンコーディングはまだ非常に良い解決策ですが、このようなエンコーディングはスパースなデータを作成します。勾配推定子はスパースなデータに適していません:勾配は主にゼロと見なされますが、それは常に存在しないため、新しい勾配推定子が導入されました。この推定子が理論的に最小化するものを示し、複数のモデルアーキテクチャを持つさまざまなデータセットでその効率性を示します。この新しい推定子は、類似の設定下で一般的な推定子よりも優れたパフォーマンスを発揮します。実世界の小売データセットも匿名化された後に公開されます。全体として、この論文の目的は、カテゴリカルデータを徹底的に考慮し、モデルと最適化手法をこれらの重要な特徴に適応させることです。

論文をダウンロードする(PDF)