Technologie de Prévisions
La prévision statistique ne date pas d'hier. Prévoir les ventes futures pour optimiser les achats a toujours été nécessaire pour assurer une bonne gestion des affaires. Les marchands ont ainsi eu recours à des prévisions bien avant l'apparition de l'ordinateur; et, l'économie mondiale n'a pas non plus attendu que Lokad élabore
ses propres méthodes de prévisions.
Cependant, nous pensons que
Lokad apporte quelque chose de nouveau en matière de prévisions statistiques. Nous pensons que notre approche est à la fois plus simple, plus économique et plus fiable que les méthodes traditionnelles. Cette page a pour objectif de vous permettre de mieux comprendre notre technologie.
La prévision en tant que Service
De façon générale, les clients envoient leurs données vers Lokad, et Lokad leur transmet en retour leurs prévisions. Une fois les données transférées à Lokad, vos prévisions sont calculées de manière
totalement automatisée. Ce système vous garantit que vos prévisions seront livrées dans les meilleurs délais.
Notre technologie est conçue pour traiter vos données telles qu'elles sont. Avec les outils traditionnels de prévisions, vous commencez généralement par des manipulations longues et compliquées, par exemple en retirant les valeurs
exceptionnelles, en précisant la présence de
saisonnalité...
En revanche, Lokad gère toutes ces étapes de manière autonome. Préparer vos données avant de les envoyer à Lokad est susceptible d'améliorer un peu la qualité des prévisions, mais si vous ne disposez pas du temps ou des connaissances pour le faire, Lokad se chargera d'adapter vos données, et fournira des prévisions de qualité.
Conçu pour intégrer les applications clients
Evidemment, pour bénéficier des services de Lokad, les entreprises doivent être à même d'envoyer leurs données et d'intégrer directement les prévisions. C'est pourquoi, Lokad a été conçu, dès son lancement, pour faciliter l'intégration d'applications clients.
Nous mettons à la disposition des développeurs une
interface de programmation de prévisions (en anglais
Forecasting Application Programming Interface ou
Forecasting API). Il s'agit d'un protocole de communication entre plusieurs machines qui utilise un standard quasiment universel nommé SOAP. Ce standard est utilisé pas les principaux éditeurs logiciel, comme Microsoft, IBM, SAP, Google, ... Cette API de prévisions permet d'intégrer la technologie Lokad dans pratiquement n'importe quelle application tiers, pourvu qu'une connexion Internet soit disponible.
Afin toujours de faciliter l'intégration de notre technologie, en particulier pour les petites et moyennes entreprises, nous proposons aussi des
applications clients dédiées, par exemple, pour optimiser les niveaux d'inventaires ou les effectifs d'un centre d'appels. Ces applications se chargent de télécharger vos données vers Lokad et de récupérer vos prévisions. Lokad est compatible avec plus d'une trentaine d'applications courantes, comme Excel, QuickBooks, PayPal, Sage, ...
La prévision à grande échelle : le cloud computing
En règle générale, les méthodes de prévisions traditionnelles n'ont pas un coût très élevé en termes de puissance de calculs; un simple ordinateur étant capable de produire plusieurs milliers de prévisions. Cependant, si vous souhaitez des prévisions plus fiables, vous avez besoin d'utiliser des méthodes de prévision plus subtiles. D'après notre expérience, des méthodes de prévisions plus sophistiquées permettent de réduire, en général, l'erreur de prévisions
de près de 20% par rapport à des méthodes
plus simples. Mais ces méthodes posent alors problème avec les outils traditionnels de prévisions. En effet, ces méthodes nécessitent des capacités de calcul 1000 fois supérieures; un ordinateur de bureau ou les serveurs d'une entreprise n'ont donc pas les capacités nécessaires pour effectuer les prévisions dans les délais adéquats.
De plus, d'après notre expérience,
le nombre de prévisions nécessaires tend à augmenter très fortement, dès lors que l'entreprise se rend compte qu'ajuster les processus à l'aide de prévisions automatisées permet de réaliser des profits considérables. Par exemple, une chaîne de supermarchés avec 5000 produits référencés et 10 points de vente, nécessite en règle générale plus de 4x7x5000x10x30 =
40 millions de prévisions par mois (si l'on souhaite obtenir les prévisions des ventes du mois prochain) pour automatiser totalement le processus de réapprovisionnement.
40 millions de prévisions par mois pour une entreprise de taille moyenne peut sembler extravagant. Cependant, les puissances de calcul n'ont jamais été aussi bon marché.
1 mois de capacité de calcul d'un ordinateur capable d'effectuer 2 milliards d'opérations élémentaires, coûte désormais moins de $10 (*). De plus, l'emploi d'un système de calculs parallèles permet d'utiliser plusieurs ordinateurs simultanément et accélérer formidablement la vitesse de calcul. Il est désormais possible de réaliser des calculs qui prendraient normalement des mois en quelques heures.
(*) Tarif Amazon MapReduce
(mai 2009) pour l'utilisation sans interruption d'une unité de 2GHz pendant 1 mois.Le calcul parallèle est l'un des éléments majeurs de notre technologie de prévision. Depuis le lancement initial de Lokad fin 2006, nous avons conçu et amélioré une
grille de calcul, c'est à dire un réseau d'ordinateurs qui traite les données et calcule les prévisions.

Depuis début 2009,
nous effectuons la migration de Lokad vers des services de cloud computing (
informatique dans les nuages: externalisation des ressources informatiques vers des datacenters). En particulier, nous recevons actuellement de l'aide des équipes de Microsoft pour migrer vers Windows Azure,
la plateforme de cloud computing de Microsoft. Windows Azure va permettre à Lokad de louer des milliers de serveurs additionnels pour pouvoir calculer les prévisions de nos clients.
Nous pensons que notre technologie est aujourd'hui l'une des technologies - voire
la technologie - la plus à même de passer à grande échelle. Avec l'aide de Microsoft, nous pensons qu'une fois Windows Azure commercialisé, probablement fin 2009, nous serons à même de fournir des capacités quasi-illimitées de prévision à nos clients.
Modéliser la demande client réelle: les «events»
Les ventes, les volumes d'appels, ou encore les flux de trésorerie, peuvent être représentés par des séries temporelles, c'est à dire une suite de valeurs numériques
datées. La plupart des méthodes de prévision reposent sur l'analyse de séries temporelles. Cependant, les séries temporelles ne
représentent pas toujours la demande client réelle. Par exemple, lorsqu'un magasin est confronté à une rupture de stocks, les ventes chutent, mais cela ne signifie pas que la demande client diminue réellement. Il y a juste moins de produits disponibles pour les acheteurs. D'après notre expérience, cette difficulté est fréquente, lorsque des événements, comme des campagnes publicitaires ou des promotions, impactent les affaires.
Avec uniquement l'analyse de séries temporelles brutes, les outils statistiques n'arrivent pas à obtenir une vision correcte de la demande passée, et de ce fait, ne fournissent pas des prévisions fiables. C'est pour cette raison que Lokad dispose d'un système de gestion de données plus adapté, qui gère aussi les
tags et les
events (
mots clefs et
événements/promos) en plus des séries
temporelles brutes. A l'aide de ce système, il est possible d'indiquer des événements passés comme:
- La mise en place d'une promotion
- La rupture des stocks
- L'interruption de courant d'un centre d'appels
Ces events sont analysées de manière automatique par Lokad pour que les prévisions reflètent au mieux la demande client future, sans reproduire les artefacts que comportent vos données passées. Lokad requiert seulement de la part de ses utilisateurs qu'ils indiquent les éléments pertinents au regard de leur activité. En particulier, les utilisateurs n'ont pas à indiquer l'impact réel de l'événement (comme la promotion), car cette analyse est réalisée de manière automatique par Lokad.
A notre connaissance, Lokad est le seul fournisseur de prévisions à
gérer de manière automatique des «events». Avec la plupart des technologies concurrentes, c'est à l'utilisateur d'effectuer des opérations complexes pour préparer les données, en supprimant
manuellement les
artefacts, ou en configurant des modèles statistiques spécifiques avec des
variables indépendantes pour traiter les événements exogènes.
Indiquer les produits comparables à l'aide des «tags»
Essayer de prévoir les ventes d'un seul produit est une tâche très difficile. En effet, si l'on considère que la durée de vie moyenne d'un produit manufacturé est inférieure à trois ans, un produit a en moyenne 18 mois d'historique de ventes, que l'on peut représenter par 18 points (un point étant le volume de ventes mensuelles). De toute évidence, 18 points sont bien peu en matière de prévisions statistiques. En plus, si ce
court historique a été impacté par des opérations publicitaires, calculer des prévisions devient encore plus compliqué.
Les méthodes traditionnelles de prévisions se révèlent très peu performantes face à des historiques de ventes très courts. La plupart des outils nécessitent en général un an d'historique de ventes, voire plus. Or, les prévisions sont particulièrement nécessaires lors du lancement du produit, lorsque ces données ne sont justement pas disponibles. Face à des données insuffisantes, la plupart des outils statistiques emploient des méthodes de prévisions plus simples, comme la moyenne mobile, qui sont incapables de modéliser une saisonnalité ou une tendance.
Lokad, en revanche, utilise une approche radicalement différente. Prévoir les ventes futures d'un seul produit est en effet difficile, mais les entreprises vendent en général de très nombreux produits et
nombre d'entre eux sont comparables. Ainsi, si l'entreprise vend 10 produits comparables, nous disposons alors de 10 fois plus de données pour affiner les prévisions du produit concerné. Cette approche est appelée prévision de séries temporelles concurrentes. Lokad utilise
les corrélations entre les différentes séries temporelles pour améliorer la qualité des prévisions de chaque série temporelle.
Cependant, il n'est pas possible de trouver des corrélations lorsque la série temporelle est trop courte (ex: les ventes d'un produit lancé depuis quelques semaines). C'est pour cette raison que Lokad a introduit la notion de
tags (mots clefs). Les Tags permettent de qualifier les séries temporelles et ainsi marquer le fait que des séries temporelles sont comparables. A l'aide des tags, Lokad peut calculer des prévisions fiables pour des produits qui n'ont quasiment pas d'historique de ventes.
A notre connaissance, Lokad est également le seul fournisseur de prévisions à
gérer de manière automatique des «tags». Les produits de nos concurrents requièrent généralement l'intervention de professionnels spécialisés qui vont définir les règles applicables lorsque les données se révèlent insuffisantes.
WEB 2.0 et amélioration des prévisions
Equation de minimisation du risque structurel On a vu l'importance que peuvent avoir les corrélations entre les historiques de ventes et plus généralement, entre les séries temporelles. Ces corrélations sont indispensables pour affiner la qualité des prévisions lorsqu'il n'y a pas assez de données. Cependant, la mauvaise nouvelle est qu'il n'y a jamais assez de données.
Plus de données signifie moins d'erreurs de prévisions, et en retour plus de profits. Notre métier est justement de diminuer les erreurs de prévisions.
C'est pourquoi, nous avons décidé de prendre le problème autrement. Pour calculer les prévisions, nous ne nous limitons pas seulement aux données de votre entreprise,
nous utilisons l'ensemble des données à notre disposition pour améliorer la qualité de nos prévisions. Cela signifie également que vos données peuvent servir à améliorer la qualité globale des prévisions de Lokad.
Notre solution est sans risque. A aucun moment vos données ne sont transmises à un tiers, et certainement pas un autre client de Lokad. Optimiser les prévisions à l'aide des données de plusieurs entreprises consiste en un processus indirect qui rend impossible l'accès aux données des tiers.
De plus, contrairement à des idées reçues, le principal intérêt dans l'utilisation des données de plusieurs entreprises n'est pas de détecter des corrélations. Les corrélations sont d'un intérêt secondaire, car l'objectif majeur est
d'identifier le «bruit». Avec l'observation des données d'une entreprise, il est généralement très difficile de distinguer la tendance, ou encore la saisonnalité associée à son activité, des mouvements aléatoires du marché, c'est à dire le «bruit».
En revanche, si vous disposez des données d'une centaine d'entreprises, distinguer la tendance du bruit devient bien plus facile. Par exemple, si la même saisonnalité apparaît chez d'autres entreprises, la probabilité que cette saisonnalité ne soit qu'un mouvement aléatoire du marché devient bien plus faible. Une meilleure détection du bruit permet une reconnaissance plus fiable de la tendance de l'activité de l'entreprise et au bout du compte, des prévisions meilleures.
Nous pensons que
notre technologie qui associe réseau social et apprentissage statistique est unique, et nous sommes enthousiastes à l'idée que chaque nouvel utilisateur améliore indirectement les prévisions pour tous.
Les modèles statistiques utilisés par Lokad
Estimer la
qualité d'un modèle de prévision est très subtile. La clef en matière de prévisions statistiques est de choisir le modèle qui diminue les erreurs non pas par rapport à vos données (passées), mais par rapport aux données que vous n'avez pas encore, c'est à dire les données futures. Nous pensons que ce problème, désigné habituellement par le terme de
surapprentissage n'est pas bien connu, alors que son impact sur les affaires peut être considérable. Regardez notre vidéo
Overfitting: when accuracy measure goes wrong (Le surapprentissage: l'estimation de la qualité de vos prévisions faussée) pour en savoir plus.
Lokad utilise une
librairie étendue de modèles statistiques comprenant les modèles les plus classiques, comme la méthode Box-Jenkins, le lissage exponentiel, le processus autorégressif et leurs variantes. Mais, d'après notre expérience, ces méthodes classiques ne permettent que difficilement de:
- qualifier les séries temporelles avec des «tags» (des mots clefs, ex.: la description du produit),
- évaluer les corrélations entre différentes séries temporelles,
- traiter des séries temporelles très courtes.
C'est pourquoi Lokad a aussi mis au point d'autres modèles plus complexes, qui offrent ces fonctionnalités. Nous ne prétendons pas avoir inventé de nouvelles théories mathématiques (du moins pour l'instant); notre technologie repose principalement sur la théorie de l'apprentissage statistique ou
théorie de Vapnik-Chervonenkis.
Le plus difficile n'est pas tant de créer le modèle statistique que de
choisir celui qui convient le mieux. A nouveau, Lokad utilise les corrélations entre les séries temporelles pour affiner le choix du modèle. Nous sommes bien plus confiants dans le choix d'un modèle pour une série temporelle donnée si ce modèle est également utilisé pour de nombreuses séries temporelles similaires.
Un suivi et des améliorations en continu
Les prévisions sont livrées de manière totalement automatique. Mais cela ne signifie pas que le travail effectué en amont par les équipes de Lokad s'est fait sans l'intervention d'experts statisticiens, bien au contraire.
Nous réalisons un suivi permanent de notre système de prévisions. Ce processus s'effectue à l'échelle de Lokad, ce qui nous permet de diminuer drastiquement nos coûts, car chaque expert est capable de suivre un grand nombre d'entreprises à la fois.
Tous les jours, nous effectuons des simulations de prévision pour
déterminer les points faibles de notre technologie de prévisions. Ce suivi est permanent. Vous n'avez pas à faire quoi que ce soit de spécial, si ce n'est télécharger vos données vers Lokad pour en bénéficier.
Grâce à ce suivi, les problèmes sont d'abord identifiés, puis
les solutions potentielles deviennent partie intégrante de notre projet de développement.Bien évidemment, de nombreux progrès restent à faire et le domaine des prévision statistiques est en pleine évolution, mais notre approche Web2.0 permet d'explorer des solutions qui n'étaient jusqu'alors pas concevables.
Contrairement aux outils de prévisions classiques, choisir Lokad signifie que vos prévisions sont
passées en revue par des experts et comparées à celles d'entreprises similaires, ce qui facilite beaucoup la correction d'erreurs potentielles. De plus, avec Lokad,
vos prévisions, en même temps que notre technologie, s'améliorent naturellement au cours du temps. Choisir Lokad, c'est s'assurer que votre entreprise ne se fasse dépasser par la concurrence du fait de modèles de prévisions qui ne sont pas mis à jour suffisamment fréquemment.
Inscrivez-vous, 30 jours gratuits.