Régression quantile
La régression quantile est un type de régression (c’est-à-dire une prévision) qui introduit volontairement un biais dans le résultat. Au lieu de chercher la moyenne de la variable à prédire, une régression quantile recherche la médiane et d’autres quantiles (parfois appelés percentiles). Les quantiles sont particulièrement utiles pour l’optimisation de stocks en tant que méthode directe pour calculer le point de commande.
La notion de régression quantile est un sujet statistique relativement avancé ; l’objectif de cet article n’est pas d’aborder ce sujet de manière rigoureuse, mais plutôt de donner une introduction (relativement) intuitive au sujet pour les praticiens du commerce de détail ou de la fabrication.
Illustration visuelle des quantiles

Le graphique ci-dessus illustre 3 prévisions distinctes:
- en rouge, une prévision quantile à 75%.
- en noir, une prévision moyenne.
- en vert, une prévision quantile à 25%.
Visuellement, les quantiles se comportent comme des intervalles de confiance. Cependant, en pratique, le quantile n’est nécessaire que pour un pourcentage cible unique.
Quantiles (ou percentiles) de la demande future
La prévision classique, et la plus intuitive, est la prévision moyenne : les poids respectifs de la surestimation et de la sous-estimation devraient être égaux, sinon la prévision est biaisée (plus précisément biaisée contre la moyenne).
Un premier raffinement de cette vision est la prévision médiane : la fréquence respective de la surestimation et de la sous-estimation devrait être égale, sinon la prévision est biaisée contre la médiane.
À ce stade, nous avons déjà décalé la notion de prévisions non biaisées des poids égaux vers des cotes égales. Ce changement est subtil, mais dans certaines situations, il peut avoir un impact numérique important.
Illustration : Revenu moyen vs médian des ménages aux États-Unis
Le revenu des ménages illustre la différence profonde entre la moyenne et la médiane.
Cette disparité s’explique par les revenus (relativement) élevés du ménage américain le plus riche par rapport au reste de la population. Une telle divergence entre la moyenne et la médiane se retrouve dans toutes les distributions non symétriques, typiquement dans toutes celles qui ne suivent pas une distribution normale.
Généralisation de la médiane
La médiane représente le seuil où la distribution se divise en chances de 50/50. Cependant, il est possible d’envisager d’autres ratios de fréquence. Par exemple, on peut considérer 80/20 ou 90/10, ou tout autre ratio où le total reste à 100 %.
Les quantiles représentent une généralisation de la médiane à n’importe quel pourcentage. Pour τ, une valeur comprise entre 0 et 1, la régression quantile Q(τ) représente le seuil pour lequel la probabilité d’observer une valeur inférieure est exactement τ.
Prévisions quantiles
Les prévisions classiques et quantiles prennent toutes deux en entrée une série temporelle. La série temporelle représente les données d’entrée. En plus des données, une prévision moyenne de série temporelle classique requiert deux paramètres structurels supplémentaires :
- la période, comme jour, semaine ou mois.
- l’horizon, un entier représentant le nombre de périodes à prévoir.
Implicitement, la série temporelle est agrégée selon la période, et l’horizon est choisi suffisamment grand pour être utile en pratique, généralement supérieur au lead time.
Les prévisions moyennes bénéficient d’une propriété très pratique : il est mathématiquement correct de sommer les prévisions. Par exemple, si y1, y2, y3 et y4 représentent la prévision sur 4 semaines, alors si nous avons besoin uniquement de la demande attendue pour les deux prochaines semaines, nous pouvons sommer y1+y2.
Cependant, additionner des prévisions quantiles est mathématiquement incorrect, ou plus précisément, la somme des quantiles ne donne pas le quantile de la somme (la somme des segments).
Puisque les prévisions quantiles ne peuvent être sommées, les prévisions de séries temporelles quantiles doivent repenser la notion même d’agrégation par période. En effet, produire des prévisions quantiles par période est vain, car ces prévisions élémentaires ne peuvent pas être combinées pour produire des quantiles corrects sur des segments.
Ainsi, la prévision de série temporelle quantile adopte une structure distincte :
- τ le quantile ciblé, un pourcentage.
- λ l’horizon exprimant une durée (généralement en jours).
Par exemple, si la série temporelle représente les ventes d’un produit A, et que nous avons les paramètres τ=0,90 et λ=14 jours, alors la prévision quantile (τ, λ) renverra la valeur de la demande ayant exactement 90 % de chances d’être supérieure à la demande totale observée sur 14 jours (et respectivement 10 % de chances d’être inférieure à la demande sur les mêmes 14 jours).
Contrairement aux prévisions classiques, les prévisions quantiles produisent une et une seule valeur par série temporelle, indépendamment de l’horizon. Dans une certaine mesure, les prévisions quantiles sont plus indépendantes de la période que leurs homologues classiques.
Le piège de Lokad
À première vue, les prévisions quantiles semblent quelque peu plus compliquées que les prévisions classiques. Néanmoins, dans de nombreuses situations réelles, les praticiens finissent par produire d’abord des prévisions moyennes afin de les extrapoler immédiatement en prévisions quantiles, en supposant généralement que les prévisions suivent une distribution normale. Cependant, cette étape d’extrapolation représente souvent le maillon faible du processus et peut dégrader significativement le résultat final. La technologie de prévision devrait s’adapter aux exigences pratiques, c’est-à-dire fournir des prévisions quantiles natives, et non l’inverse.
Pour aller plus loin
- Point de commande, comment les quantiles s’appliquent à l’optimisation de stocks.
- Fonction de perte flippeur, comment mesurer la précision d’une prévision quantile.
- Roger Koenker, Kevin F. Hallock, (2001) Régression quantile, Journal of Economic Perspectives, 15 (4), 143–156
- Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Estimation non paramétrique des quantiles, Journal of Machine Learning Research 7 1231–1264