跳转至正文
GZ Cloudhome Logo

分位回归(Quantile Regression)

发布于:2023 年 6 月 9 日

在回归分析中,平方误差是最常用的;它有一个简单的理论基础,以及有简单的算法可以求解它;此外,我们也可以通过使用多种几何来可视化增进理解。我们在 统计决策理论 里面已经讨论过回归函数,即 μ(x)=E(YX=x)\mu(x) = \mathbb{E}(Y | X = x),它最小化的期望误差是平方误差:E((Yμ(x))2X=x)\mathbb{E}((Y - \mu(x))^2 | X = x);而条件中位数最小化的是绝对值误差 E(Yμ(x)X=x)\mathbb{E}(|Y - \mu(x)| | X = x)

给定 0<τ<10 < \tau < 1,如果我们想要对一个条件分位数 Qτ(YX=x)Q^\tau(Y | X = x) 进行建模,怎么办呢?条件分位数 QτQ^\tau 满足 Pr(YQτ)=τ\mathrm{Pr}(Y \le Q^\tau) = \tau,我们期望找到一个函数 f:xQτ(YX=x)f: x \mapsto Q^\tau(Y | X=x)。我们看看能不能找到一个损失,使得这个损失的条件期望是条件分位数。

Check function

ρτ(u)={τu,u0(1τ)u,u0.\rho_\tau (u) = \left\{ \begin{aligned} &\tau |u|, && u \ge 0 \\ &(1 - \tau) |u|, && u \le 0. \end{aligned} \right.

上述的 check function 中,ρτ(0)=0\rho_\tau(0) = 0。当 u>0u > 0 时,这个函数以斜率 τ\tau 递增,当 u<0u < 0 时以斜率 1τ1 - \tau 递减。

分位回归

现在假设 YY 有概率密度函数 ff,概率质量函数 FF

基于 莱布尼兹积分定理,我们可以证明函数

EY(ρτ(Yθ))=ρτ(yθ)f(y)dy\mathbb{E}_Y(\rho_\tau(Y - \theta)) = \int_{-\infty}^\infty \rho_\tau(y - \theta) f(y) dy

θ=F1(τ)=Qτ(Y)\theta = F^{-1}(\tau) = Q^\tau(Y) 有最小值。

因此,在分位回归中,我们寻找 β\beta,使得

E(ρτ(YiZiTβ))  for IID data\mathbb{E}(\rho_\tau(Y_i - Z_i^T \beta)) ~~ \text{for IID data}

有最小值,那么

β^=β^(τ)=argminβRτ(β),\hat{\beta} = \hat{\beta}(\tau) = \arg \underset{\beta}{\min} R_\tau(\beta),

其中

Rτ(β)=i=1nρτ(yiziTβ).R_\tau(\beta) = \sum_{i=1}^n \rho_\tau (y_i - z_i^T \beta).

函数 RτR_\tau 相比较于均方误差更难优化。它可以基于线性规划来求解。

模型

分位回归中,隐含的模型假设为

Yi=ZiTβ+εi,   εii.i.d.V.Y_i = Z_i^T \beta + \varepsilon_i, ~~~ \varepsilon_i \overset{\mathrm{i.i.d.}}{\sim} V.

其中 ZiZ_i 是一个表示输入变量的向量,且为了方便对偏置建模,在第一个元素的位置插入了 1。VV 则是另一个分布。那么,

Qτ(YX=x)=ZiTβ+Qτ(V).Q^\tau (Y | X = x) = Z_i^T \beta + Q^\tau (V).

我们可以看到,改变 VV 只影响 β\beta 中的偏置项。不管 VV 是高斯分布,指数分布甚至是柯西分布,我们都能得到同样的 β\beta,只有偏置项 β0\beta_0 有所不同。