予測技術の向上

6月 25, 2018

supply chain science

Joannes Vermorel

Lokadの創業以来、私たちの目標は、卓越した供給チェーン最適化を提供するために、予測技術を絶えず向上させることでした。ほぼ十年前、私はすでに機械学習企業であることが奇妙であると指摘していました：進歩は着実でありながらも、非線形で不規則です。さらに、他の分野で常識とされる多くの見解が、機械学習においては全く的外れであることが多いのです。しかし、これは進歩が偶然に任されているという意味ではなく、そこには確固たる方法論が存在するのです。

予測技術の向上は、まずデータの改善から始まります。適切なデータ準備がなければ、そのプロセスはゴミが入ればゴミが出る、いわゆるガーベジイン・ガーベジアウトの結果となります。プロモーション、ストックアウト、リードタイムが各データセットで正しく表現されることを確認するには、多大な時間と専門知識が必要です。実際、データの複雑さは分野特有の問題であるため、航空宇宙、ファッション、食品小売など、多岐にわたる分野のデータセットを統合するには、Lokadのサプライチェーンサイエンティストのチーム全体が必要となります。

そして、新たな統計手法を発明¹すると、その手法はあるデータセットでは優れたパフォーマンスを示す一方で、別のデータセットでは劣る結果となるのが通常です。残念ながら、このような場合、新しい統計手法は脆弱になりがちで、多少の運任せであったり、もしくは過学習の問題の犠牲となる可能性があります。そのため、Lokadの特定のクライアント向けに、ある統計手法が優れているように見えるからといって特別なケースを作るのは魅力的かもしれませんが、私たちはそのような運用はしていません。10年にわたる経験が示すように、そうした結果は必ずしも安定せず、一見優れている手法も長くはその性能を維持できない可能性があります。もしクライアント企業が大きな変化を遂げた場合―それはLokad自身の取り組みに起因することも十分にあり得ます―新しい手法のパフォーマンスは崩れるかもしれません。

そのため、私たちはむしろ、多様な状況下、かつ一見無関係な複数の分野において、一様に向上をもたらす統計手法の発見に注力しています。理想的には、改善と退行が混在するのではなく、どこにおいても均一な向上を実現することが求められます。このアプローチは、単に同じ機械学習アルゴリズムを使い回しながら、徹底的な²特徴量エンジニアリングを施すという、現代の多くのデータ解析機関が取る方法よりも、はるかに困難です。

このアプローチは、統計的予測の基盤そのものを見直すことを余儀なくさせます。例えば、クロスエントロピーを、予測精度を評価するための優れた指標として採用する転換は、ディープラーニングを最大限に活用する上で重要な役割を果たしました。最近では、供給チェーンにおける複雑な裾野の挙動を捉えるため、強力でありながらあまり利用されていないアプローチ³である混合密度ネットワークへとアップグレードしました。これらの混合密度ネットワークは、航空宇宙などの産業分野において極めて重要な、希少事象の発生確率を確実に推定するための実行可能な解を提供します。

私たちの予測技術は未だ進行中のプロジェクトです。十分に解決されていない多くの課題が存在します。例えば、カニバリゼーションや価格変動に対する市場の反応は、依然として非常に困難な課題です。それにもかかわらず、私たちは決して諦めることなく、10年以上の研究開発の末もなお進歩を遂げ続けています。

我々は巨人の肩の上に立っています。Lokadの研究開発の取り組みは、供給チェーンの問題に直接取り組むのではなく、パターン検出、音声認識、自然言語処理などの主流の問題に取り組む広範な機械学習コミュニティから得られた洞察の変形にすぎません。 ↩︎
特徴量エンジニアリングとは、特定の機械学習アルゴリズムに適したデータセットの表現を手動で作成するプロセスを指します。これは、機械学習アルゴリズムの既知の弱点を緩和するための強力な手段です。 ↩︎
Christopher M. Bishopによるオリジナルの論文「Mixture Density Networks (MDN)」は1994年に発表されました。しかし、この先駆的な研究が開いた可能性にハードウェアが追いつくまでには、ほぼ20年を要しました。ロボットの逆運動学に適用されたオリジナルの論文とは異なり、私たちはMDNを用いて確率的な需要予測を提供しています。 ↩︎

ブログに戻る ›

予測技術の向上

その他の投稿