統計的予測は直感に反する科学です。これは以前にも言われていましたが、この点を再度強調します。

頻繁に、Lokadにデータをアップロードした直後に、得られる予測が一定であるため、サポートを求める人々がいます。つまり、予測値はすべてのステップに対して一定です。例えば、6ヶ月先の月次販売予測では、次の6ヶ月間の販売値が一定です。

しかし、次の6ヶ月間のビジネスの売上が完全に一定である可能性はまったくないので、なぜLokadはこのような意味のない結果を出し続けるのでしょうか?

まあ、確かにビジネスは次の6ヶ月間に変化する(少なくとも少しは)ことは確かです。その点については疑問ありません。しかし、問題は次のようなものです:将来の変化にできるだけ近い予測をどのように作成できるか?統計的な手法を取る場合、予測には統計モデルが必要です。

問題は、良い予測モデルが必要であり、統計的予測の基本的なルールは、モデルが複雑であるほど、信頼性を確保するために必要なデータが増えるということです。各ステップに対して異なる予測を行うモデルは、すべてのステップに対して同じ値を生成するモデルよりも明らかに複雑です。

逆に言えば、これらのより複雑なモデルは、限られたデータセットでは信頼性が低くなる可能性が高いとも言えます。つまり、特定の状況で全体的な予測精度を低下させる可能性が非常に高いということです。

フラットな予測について苦情を言う人々の状況に戻ると、通常起こっていることは、アップロードされたデータが非常に短い(たとえば、月次履歴がわずか3ヶ月しかない)か、非常にまばらな(たとえば、各製品ごとにわずかな販売しかない)ということです。このような状況では、Lokadは頻繁にフラットな予測を行います。

これはバグではなく、精度向上の機能です。


リーダーコメント(6)

こんにちはJohan、時系列をリレーショナルデータベースに効率的に表現することは非常に難しいビジネスです。要するに、考慮している時系列の長さに非常に依存しています。また、ソースコード自体についても、考慮している時系列の長さと数に非常に依存しています。お役に立てれば幸いです。 7年前 | Joannes Vermorel


私たちは典型的な時系列定義と観測を持つ時系列プロジェクトに取り組んでいます。以下の点でお手伝いできますか:

  1. 時系列定義と関連する観測のための業界標準の構造はありますか(DB設計の観点から)。
  2. 時系列を表すコードのベストプラクティスは何ですか、例えば[レベル1].[レベル2].[シーケンス番号].[バージョン]。 ご指導とご支援をいただければ幸いです。 7年前 | Johan Strydom

こんにちはIzi、それは興味深い考えです :-) 私たちは最初からこの種の「攻撃」について考えていましたが、ウェブサイトでは広く宣伝されていません。 基本的には、ターゲットがLokadに送信しているデータを非常に正確に知る必要があります。また、私たちが見ている相関のタイプを非常に正確に知る必要もあります。単純な時系列のシフトは、実際のビジネスデータでは「自然」ではありません。最後に、非課金ユーザーからのデータは信頼していないため、それにはお金がかかります。 私たちの技術に関しては、多くのモデルを複雑に組み合わせて使用しています。これにはよく知られたクラシックなモデルも含まれています。このトピックは私たちにとって明らかに少し敏感な問題ですが、後でいくつかの詳細な概要を投稿しようと思います。また、まだ急速に進化していることに注意する必要があります。 9年前 | Joannes Vermorel


ですから、私が間違ったデータをアップロードし、それがあなたの製品を使用しているサプライヤー/パートナーと相関するように注意深く作成した場合、彼の結果を台無しにすることができますか?それは興味深いですし、それはかなり簡単にできるようにも思えます!それ以外の場合、ARIMA、ANNなどの使用している技術についてもっと知りたいです。 9年前 | Izi


こんにちはStephenさん、 いいポイントです。ここでの根本的な問題は、ユーザーが予測そのものだけでなく、その背後にある理論または少なくともコメントも望んでいるかもしれないということです。 将来的には、Lokadのクライアントアプリを自動ガイドラインで改善し、Lokadが提供する予測に「コメント」を付けることができるようにするかもしれません。 9年前 | Joannes Vermorel


こんにちはJoannesさん、 ユーザーが期待するものを説明するための有用なユーザーフィードバックだと思いますか?おそらく、ユーザーに対して数ヶ月(例:3ヶ月)の予測タスクのみを許可し、それ以上の場合は予測の精度に影響があることについて警告を表示することができるかもしれません。また、これは歴史的データの利用可能性にも依存するかもしれませんので、両者を関連付ける方法があるかもしれません。ユーザーの観点からは、フラットな予測を返すことがより正確かもしれませんが、この場合について何らかの通知を受けるか、より素朴な結果を受け入れるかの選択肢が与えられるといいと思います。 9年前 | Stephen