多くのサプライチェーンの課題は、分類または回帰の問題としてフレーム化することができます。たとえば、需要予測は_回帰_と見なすことができます。一方、競合他社の価格との整合性を判断することは、_分類_と見なすことができます。

ランダムフォレストは、分類または回帰を行うためのデータからパターンを_学習_するために使用される機械学習手法です。

ランダムフォレストは最新の機械学習ではなくなりましたが、多くの場合、ディープラーニングに比べて優れた実用的な利点がまだあります。これらの利点は、Ahmed El DeebがThe Unreasonable Effectiveness of Random Forestsで素晴らしくまとめています。

実際、Ahmed El Deebが「悪いランダムフォレストを作るのは本当に難しい!」と指摘しているように、私も同意し、これは重要な実用的な利点です。対照的に、ディープラーニングモデルは、少なくとも言っても、非常に神経質であり、データサイエンティストにとっては常に明確でない方法でパフォーマンスを向上させたり低下させたりするための多くの不明瞭なパラメータがあります。

したがって、ランダムフォレストは現在Envisionに組み込まれています。ボーナス:ランダムフォレストの予測はランダム変数として返されるため、サプライチェーン最適化の確率的アプローチに最適です。

内部では、私たちは独自の高度に最適化されたランダムフォレストの実装を展開しました。私たちはxgBoostから多くの洞察を盗みました。主な洞察は、私たちが_カラム形式_のデータ処理戦略を活用していることです。これは、以前のアプローチとは異なり、_表形式_でした。Envisionのコンテキストでは、このアプローチはデータ自体が既にカラム形式で組織化されているため、さらなるパフォーマンスの利点をもたらします。また、サプライチェーンのコンテキストでは、入力特徴は頻繁に疎または低基数であり、例えばスロームーバーです。カラム形式のアプローチにより、データを大幅に圧縮することができ、これによりそれらのランダムフォレストの速度が向上します。

より速いランダムフォレストは小さな機能のように思えるかもしれませんが、パフォーマンスは機能です。最も希少なリソースは通常、サプライチェーンサイエンティスト自体です。数値結果の生成を待つ時間を短縮することで、実際のサプライチェーンの課題の考え方と解決により多くの時間を費やすことができます。