予測技術の向上
Lokad の創業以来、私たちの目標は、卓越したサプライチェーン最適化を提供するために、予測技術を絶えず向上させることでした。ほぼ 10 年前、私はすでに、機械学習企業であることの奇妙さについて書いていました。進歩は着実でありながらも、非線形で不規則です。さらに、他分野では常識とされる多くの見解が、機械学習ではまったく的外れであることも少なくありません。しかし、だからといって進歩が偶然に委ねられているわけではなく、そこには確固たる方法論があります。
予測技術の向上は、まずデータの改善から始まります。適切なデータ準備がなければ、そのプロセスは、いわゆるガーベジイン・ガーベジアウトに陥ります。プロモーション、品切れ、リードタイムが各データセットで正しく表現されていることを確認するには、多大な時間と専門知識が必要です。実際、データの複雑さは分野固有の問題であるため、航空宇宙、ファッション、食品小売など、多岐にわたる分野のデータセットを統合するには、Lokad の サプライチェーンサイエンティスト チーム全体が必要になります。
そして、新たな統計手法を発明1すると、その手法はあるデータセットでは優れた性能を示す一方で、別のデータセットでは劣る結果になるのが普通です。残念ながら、このような場合、新しい統計手法は脆弱になりがちで、多少の幸運に頼っていたり、あるいは過学習の問題の犠牲になっていたりする可能性があります。そのため、Lokad の特定のクライアント向けに、ある統計手法が優れているように見えるからといって特別扱いするのは魅力的かもしれませんが、私たちはそのような運用はしていません。10 年にわたる経験が示すように、そうした結果は必ずしも安定せず、一見優れている手法でも長く性能を維持できないことがあります。クライアント企業が大きな変化を遂げた場合には、それが Lokad 自身の取り組みに起因するものであったとしても、新しい手法の性能は崩れるかもしれません。
そのため、私たちはむしろ、多様な状況下、かつ一見無関係な複数の分野において、一様に向上をもたらす統計手法の発見に注力しています。理想的には、改善と退行が混在するのではなく、どこにおいても均一な向上を実現することが求められます。このアプローチは、単に同じ機械学習アルゴリズムを使い回しながら、徹底的な2特徴量エンジニアリングを施すという、現代の多くのデータ解析機関が取る方法よりも、はるかに困難です。
このアプローチは、統計的予測の基盤そのものを見直すことを余儀なくさせます。たとえば、予測精度を評価する優れた指標としてクロスエントロピーを採用した転換は、ディープラーニングを最大限に活用するうえで重要な役割を果たしました。最近では、サプライチェーンにおける複雑な裾野の挙動を捉えるため、強力でありながらあまり活用されてこなかったアプローチ3である混合密度ネットワークへとアップグレードしました。これらの混合密度ネットワークは、航空宇宙などの産業分野において極めて重要な希少事象の発生確率を、確実に推定するための実行可能な解を提供します。
私たちの予測技術は未だ進行中のプロジェクトです。十分に解決されていない多くの課題が存在します。例えば、カニバリゼーションや価格変動に対する市場の反応は、依然として非常に困難な課題です。それにもかかわらず、私たちは決して諦めることなく、10年以上の研究開発の末もなお進歩を遂げ続けています。
-
私たちは巨人の肩の上に立っています。Lokad の研究開発の取り組みは、サプライチェーンの問題に直接取り組むのではなく、パターン検出、音声認識、自然言語処理など、より主流の問題に取り組む広範な機械学習コミュニティから得られた洞察を変形したものにすぎません。 ↩︎
-
特徴量エンジニアリングとは、特定の機械学習アルゴリズムに適したデータセットの表現を手動で作成するプロセスを指します。これは、機械学習アルゴリズムの既知の弱点を緩和するための強力な手段です。 ↩︎
-
Christopher M. Bishopによるオリジナルの論文「Mixture Density Networks (MDN)」は1994年に発表されました。しかし、この先駆的な研究が開いた可能性にハードウェアが追いつくまでには、ほぼ20年を要しました。ロボットの逆運動学に適用されたオリジナルの論文とは異なり、私たちはMDNを用いて確率的な需要予測を提供しています。 ↩︎