Quel type de modèles de prévision utilisez-vous en interne ? C’est une question fréquemment posée à la fois par les clients et les partenaires de Lokad.

Répondre à cette question est délicat pour nous pour deux raisons:

  • Notre technologie est un atout essentiel. Ainsi, nous n’avons aucun projet de divulguer tous les détails (même si nous ne sommes pas complètement secrets non plus).
  • Notre technologie est complexe. Nous utilisons de nombreux modèles, et un composant central est précisément la sélection de modèles.

Ainsi, plutôt que de fournir la liste exacte des modèles utilisés chez Lokad, je vais énumérer ma propre liste personnelle de modèles favoris. Je ne prétends pas que ces modèles représentent la liste complète des modèles utilisés chez Lokad ni que tous ces modèles sont effectivement utilisés en production chez Lokad ; cependant, cela devrait vous donner un aperçu de ce que nous faisons chez Lokad.

Tout d’abord, il y a les bons vieux classiques : autorégressif, moyenne mobile, (double, triple) lissage exponentiel, Box-Jenkins, Holt-Winters, ARMA, ARIMA … Ces modèles ne gèrent généralement ni les multi-séries ni les tags ou événements ; pourtant, la simplicité reste primordiale dans de nombreuses situations. N’écartez pas la moyenne mobile juste parce que elle semble trop simple pour être bonne.

Ensuite, pour des modèles plus avancés, je préfère parler d’approches plutôt que de modèles. En effet, plus le modèle est complexe, plus le mathématicien dispose d’une latitude importante pour ajuster de manière subtile le comportement du modèle de prévision.

L’approche bayésienne : établir des graphes de relations est particulièrement utile dans le contexte de Lokad où nous exploitons les corrélations entre séries temporelles. C’est également utile pour traiter des tags et des events.

L’approche de grande marge : les Support Vector Machines (SVM) sont devenues incroyablement populaires ces derniers temps. Bien que, pour ce qui est des séries temporelles, c’est plutôt la Support Vector Regression (SVR) qui est la plus utile pour nous. Comme inconvénient mineur, les SVM et SVR sont généralement assez coûteuses en termes de puissance de traitement brute.

L’approche de mélange / boosting : combiner une multitude de prédicteurs simples afin d’améliorer la prévision globale fonctionne bien. La combinaison d’un grand nombre de prédicteurs simples peut être utilisée pour refléter des comportements réellement complexes.

L’approche méta-heuristique : algorithme génétique, réseaux de neurones, programmation génétique et autres approches évolutives / adaptatives. Ces approches sont puissantes mais également réputées pour leur sensibilité intrinsèque à de nombreux paramètres de tuning.

En conclusion, notre technologie est encore en pleine évolution rapide. De nouveaux modèles sont mis en production environ chaque mois. Cette liste n’est pas définitive et cloud computing crée en fait de nombreuses opportunités pour nous permettre de pousser des modèles qui étaient tout simplement trop coûteux dans le passé.