私たちは内部でどのような予測モデルを使用していますか?これはLokadの顧客やパートナーからよく尋ねられる質問です。

この質問に答えるのは難しい理由が2つあります:

  • 私たちのテクノロジーは核となる資産です。したがって、すべての詳細を公開する予定はありません(完全に秘密主義でもありません)。
  • 私たちのテクノロジーは複雑です。私たちは多くのモデルを使用しており、モデル選択が特に重要なコンポーネントです。

したがって、Lokadが使用しているモデルの正確なリストを提供する代わりに、私自身のお気に入りのモデルのリストを示します。これらのモデルがLokadで使用されているモデルの完全なリストを表しているわけではないし、これらのモデルが実際にLokadで本番で使用されているわけでもありませんが、Lokadで行っていることについての洞察を提供するはずです。

まず、古典的なモデルがあります:自己回帰、移動平均、(二重、三重)指数平滑化、Box-Jenkins、Holt-Winters、ARMA、ARIMA … これらのモデルは通常、マルチシリーズやタグやイベントを扱いませんが、多くの状況で単純さが重要です。あまりにも単純すぎて良くないように見えるからといって、移動平均を無視しないでください。

次に、より高度なモデルについては、モデルというよりも_アプローチ_と言った方がいいでしょう。実際、モデルが複雑になるほど、数学者には予測モデルの振る舞いを微妙な方法で微調整する余地が増えます。

ベイジアンアプローチ:関係のグラフを確立することは、Lokadのような環境での相関関係の利用に特に役立ちます。また、時系列の間の相関関係を扱うためにも役立ちます。これは、タグイベントを扱うためにも役立ちます。

広範なマージンアプローチ:サポートベクターマシン(SVM)はこれらの日々で非常に人気があります。ただし、時系列に関しては、私たちにとって最も有用なのはサポートベクターレグレッション(SVR)です。少し欠点としては、SVMとSVRは通常、処理能力の点でかなり高価です。

混合/ブースティングアプローチ:多くの単純な予測子を組み合わせて全体の予測を改善することはうまく機能します。大量の単純な予測子の組み合わせは、非常に複雑な振る舞いを反映するために使用できます。

メタヒューリスティックアプローチ:遺伝アルゴリズム、ニューラルネットワーク、遺伝プログラミングなどの進化的/適応的アプローチ。これらのアプローチは強力ですが、多くの「調整」パラメータに対して感度が高いことで悪名高いです。

最後に、私たちのテクノロジーはまだ速いペースで進化しています。新しいモデルは毎月ほどに本番環境に導入されます。このリストは最終的なものではなく、クラウドコンピューティングは過去には高価すぎたモデルを導入するための多くの機会を実際に提供しています。