分位点回帰

Joannès Vermorel著, 2012年2月

分位点回帰とは、結果に意図的にバイアスを導入する回帰（すなわち予測）の一種です。予測対象の変数の平均を求める代わりに、分位点回帰は中央値およびその他の任意の分位数（時にはパーセンタイルと呼ばれる）を求めます。分位数は、在庫最適化の直接的な手法としてリオーダー-ポイント-定義の算出に特に有用です。

回帰はここでは予測の同義語です。「回帰」は数学的アプローチを強調し、「予測」は結果の実用面を強調します。

分位点回帰の概念は比較的高度な統計学の話題ですが、本記事の目的はこの主題を厳密に解説することではなく、小売業や製造業の実務者向けに（比較的）直感的な入門を提供することにあります。

分位数の視覚的イラスト

上記のグラフは、3種類の異なる予測を示しています：

赤色は75%の分位数予測を示しています。
黒色は平均予測を示しています。
緑色は25%の分位数予測を示しています。

視覚的には、分位数はほぼ信頼区間と同様の挙動を示します。しかし、実際には分位数は単一の目標パーセンテージに対してのみ必要とされます。

将来需要の分位数（またはパーセンタイル）

従来の、かつ最も直感的な予測は平均予測です：過大予測と過少予測のそれぞれの重みは等しくあるべきであり、さもなければ予測はバイアスを持つことになります（より正確には平均に対してバイアスがある）。

バイアスのない 予測を持つことは望ましい特性ですが、それ自体は予測の_精度_について何も示しません。特に、予測はバイアスがなくとも大きく不正確である可能性があります。ここでいうバイアスは、将来の値を過大または過小評価する予測モデルの傾向のみを指します。

最初の洗練は中央値予測です：過大予測と過少予測のそれぞれの頻度が等しくあるべきであり、さもなければ予測は中央値に対してバイアスがあるとされます。

この時点で、バイアスのない 予測の概念は等しい重みから等しい確率へとシフトしています。この変化は微妙ですが、場合によっては大きな数値的影響を及ぼす可能性があります。

例：米国における平均世帯収入と中央値世帯収入の比較

世帯収入は、平均と中央値の間にある大きな違いを示しています。

米国国勢調査局によれば、2004年に中央値の世帯収入は$44,389であったのに対し、同年の平均（アベレージ）収入は$60,528であり、中央値より約40%高かった。

この差異は、最も裕福な米国の世帯が他の世帯に比べて（比較的）高い収入を持つことにより説明されます。このような平均と中央値の間の差は、対称でないすべての分布、通常は正規分布に従わないすべての分布で見られるでしょう。

中央値の一般化

中央値は分布が50/50に分割される閾値を表します。しかし、他の頻度比率を考慮することも可能です。例えば、80/20や90/10、その他合計が100%となる任意の比率を検討できます。

分位数は、任意のパーセンテージに対する中央値の一般化を表します。0から1の値τに対して、分位点回帰 Q(τ) は、その閾値未満の値が観測される確率が正確にτとなる閾値を示します。

分位数予測

クラシックな予測と分位数予測はどちらも、時系列を入力として利用します。時系列は入力データを表しています。データに加えて、クラシックな平均時系列予測には追加で2つの構造的設定が必要です：

期間、例えば日、週、または月。
ホライズン、予測する期間の数を表す整数。

暗黙のうちに、時系列は_期間_に従って集計され、ホライズンは実用的な用途に十分な大きさ、通常はリード-タイムを超えるように選定されます。

平均予測は非常に便利な性質を持っています：予測を数学的に合計することが正しいとされています。例えば、y1, y2, y3およびy4が4週間先の予測を表す場合、次の2週間のみの予想需要が必要であれば、y1+y2と合計できます。

しかし、分位数予測を合計することは数学的に正しくなく、より正確には分位数の合計は合計値の分位数（各セグメントの合計）を与えません。

なぜ分位数が合計できないのかを説明しましょう。例えば、ギャンブラーが毎週$1のコインをスロットマシンに投入すると仮定します。賞金$50を得る確率が1%で、それ以外はゼロであると仮定します。期待される報酬の99%分位数を見ると、毎週$50の報酬が得られることになります。しかし、2週間にわたる99%分位数を見ると、期待報酬は依然として$50に等しくなります。実際、2回連続で勝つ確率はわずか0.01%（1%を掛け合わせた値）であるため、99%分位数は変わりません。2つの99%の週間分位数を合計すると$100になりますが、実際には99%分位数として$100の利益を蓄積するには16週間かかります（この数値結果の証明は、本記事の範囲を超えるため省略します）。

分位数予測は合計できないため、分位数時系列予測では期間集計という概念自体を再考する必要があります。実際、各期間ごとの分位数予測を行っても無意味であり、なぜならその個々の予測を組み合わせてもセグメント全体の正しい分位数は得られないからです。

したがって、_分位数_時系列予測は独自の構造を持ちます：

τ：目標とする分位数（パーセンテージ）。
λ：期間を表すホライズン（通常は日単位）。

例えば、時系列が製品Aの売上を表し、設定がτ=0.90およびλ=14日である場合、分位数予測 (τ, λ) は、14日間に観測される総需要よりも大きくなる確率が正確に90%（逆に、同期間における需要よりも小さくなる確率が10%）である需要値を返します。

クラシックな予測とは対照的に、分位数予測はホライズンに関係なく、時系列ごとにたった一つの値のみを生成します。ある意味、分位数予測はクラシックな予測よりも期間に依存しない性質を持っています。

Lokadの落とし穴

一見すると、分位数予測はクラシックな予測よりもやや複雑に見えます。しかし、多くの実際の状況において、実務者は最初に平均予測を行い、それを直ちに分位数予測として外挿する傾向にあります。通常、予測が正規分布に従うと仮定します。しかし、この外挿ステップはしばしばプロセスの最も脆弱な部分となり、最終的な結果を著しく劣化させる可能性があります。予測技術は実際の要求に適応すべきであり、すなわちネイティブな分位数予測を提供すべきであって、その逆ではありません。

参考文献

リオーダー-ポイント-定義、分位数が在庫最適化にどのように適用されるか。
ピンボール-損失-関数-定義、分位数予測の予測-精度-定義をどのように測定するか。
Roger Koenker, Kevin F. Hallock, (2001) 分位点回帰, Journal of Economic Perspectives, 15 (4), 143–156
Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), ノンパラメトリック分位数推定, Journal of テクノロジー Research 7 1231–1264