Le mot prévision couvre un très large spectre de processus, de technologies et même de marchés. Dans le passé, nous avons présenté les mondes des logiciels de prévision, en distinguant entre :

Lokad appartient à la dernière catégorie car notre technologie est purement statistique. Pourtant, Lokad est loin de couvrir l’ensemble du spectre statistique par lui-même. Deux grandes catégories de prévisions existent dans la prévision statistique (*):

  • Prévisions de classification
  • Prévisions de régression

(*) Nous simplifions ici dans un souci de clarté, car les subtilités de l’apprentissage statistique dépassent largement le cadre de ce modeste article de blog.

La classification tente de séparer (ou classer) les objets en fonction de leurs propriétés. L’illustration ci-dessous de Tomasz Malisiewicz illustre une tâche de classification qui tente de séparer les images représentant une chaise des images représentant une table.

Illustration provenant du blog de tombone

Le résultat d’une classification est binaire (ou plutôt discret) : les objets sont attribués à des classes avec plus ou moins de confiance, c’est-à-dire des probabilités plus élevées ou plus faibles.

En revanche, les régressions produisent généralement des courbes. L’illustration ci-dessous considère une série chronologique représentant les ventes historiques et affiche la prévision correspondante.

La prévision de régression est une courbe plutôt qu’un paramétrage binaire (ou une combinaison binaire). Les entrées sont prolongées dans le futur.

Comment cette distinction impacte-t-elle l’entreprise ?

Eh bien, il s’avère que Lokad - tel qu’il est début 2010 - ne fournit que des prévisions de régression. Ainsi, de nombreux problèmes intéressants ne peuvent pas être abordés par Lokad car il s’agit de problèmes de classification :

  • Segmentation des clients : pour chaque client, nous aimerions évaluer la probabilité de réaliser une vente supplémentaire réussie grâce à une action de marketing direct. Dans le même esprit, nous pourrions également essayer de prédire le churn.
  • Détection de fraude : pour chaque transaction, nous aimerions évaluer - en fonction du modèle de transaction - la probabilité que l’opération soit une tentative de fraude.
  • Priorisation des offres : en fonction des caractéristiques du prospect (disponibilité du budget, secteur d’activité, rang du contact dans l’entreprise, niveau d’intérêt exprimé, …), nous aimerions évaluer la probabilité d’obtenir une offre rentable de chaque prospect afin de prioriser les efforts de l’équipe commerciale.

Nous sommes souvent interrogés sur la possibilité pour Lokad de fournir également des prévisions de classification. Malheureusement, la réponse sera négative pour le moment. Bien que reposant sur la même théorie mathématique, la classification et la régression impliquent des technologies très différentes ; et Lokad concentre tous ses efforts sur les problèmes de régression.

Bien que nous ne négligions pas les problèmes de classification, ils méritent vraiment une attention et des efforts. Pour 2010, nous nous en tenons à notre feuille de route, mais à l’avenir, la classification pourrait être une extension naturelle de nos services de prévision.