Skip to content

Commit

Permalink
glr
Browse files Browse the repository at this point in the history
  • Loading branch information
endymecy committed Jan 25, 2017
1 parent ec08417 commit 585b1a4
Showing 1 changed file with 3 additions and 2 deletions.
5 changes: 3 additions & 2 deletions 分类和回归/线性模型/广义线性回归/glr.md
Original file line number Diff line number Diff line change
Expand Up @@ -26,9 +26,10 @@ $$E[Y] = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + … + \beta_{p-1} x_{p-1}$$
- 响应变量$Y$和误差项$\epsilon$的分布推广至指数分散族(`exponential dispersion family`)。在`spark ml`中,广义线性回归支持的分布分别是正态分布、泊松分布、二项分布以及伽玛分布。
- 连接方式:广义线性模型里采用的链接函数(`link function`)理论上可以是任意的,,而不再局限于$f(x)=x$。

  这里需要重点说明一下链接函数。链接函数描述了线性预测$X\beta$与分布期望值$E[Y]$的关系。一般情况下,正态分布对应于恒等式,泊松分布对应于自然对数函数等。
  这里需要重点说明一下链接函数。链接函数描述了线性预测$X\beta$与分布期望值$E[Y]$的关系:$E[Y] = \mu = g^{-1}(X\beta)$
一般情况下,正态分布对应于恒等式,泊松分布对应于自然对数函数等。
下面列出了`spark ml`中提供的链接函数。

| 连接函数名称 | 公式 | 对应的指数分布 |
|------------|-------|-------------|
| identity(恒等)| $g=X\beta$ | 高斯分布,泊松分布,伽马分布 |
| identity(恒等)| $\mu = X\beta$ | 高斯分布,泊松分布,伽马分布 |

0 comments on commit 585b1a4

Please sign in to comment.