From ec08417332ca267fc83a20410b046aed4a9d5bf3 Mon Sep 17 00:00:00 2001 From: endy Date: Wed, 25 Jan 2017 14:06:47 +0800 Subject: [PATCH] glr --- .../glr.md" | 6 +++++- 1 file changed, 5 insertions(+), 1 deletion(-) diff --git "a/\345\210\206\347\261\273\345\222\214\345\233\236\345\275\222/\347\272\277\346\200\247\346\250\241\345\236\213/\345\271\277\344\271\211\347\272\277\346\200\247\345\233\236\345\275\222/glr.md" "b/\345\210\206\347\261\273\345\222\214\345\233\236\345\275\222/\347\272\277\346\200\247\346\250\241\345\236\213/\345\271\277\344\271\211\347\272\277\346\200\247\345\233\236\345\275\222/glr.md" index d9c7b1d..39f443a 100644 --- "a/\345\210\206\347\261\273\345\222\214\345\233\236\345\275\222/\347\272\277\346\200\247\346\250\241\345\236\213/\345\271\277\344\271\211\347\272\277\346\200\247\345\233\236\345\275\222/glr.md" +++ "b/\345\210\206\347\261\273\345\222\214\345\233\236\345\275\222/\347\272\277\346\200\247\346\250\241\345\236\213/\345\271\277\344\271\211\347\272\277\346\200\247\345\233\236\345\275\222/glr.md" @@ -26,5 +26,9 @@ $$E[Y] = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + … + \beta_{p-1} x_{p-1}$$ - 响应变量$Y$和误差项$\epsilon$的分布推广至指数分散族(`exponential dispersion family`)。在`spark ml`中,广义线性回归支持的分布分别是正态分布、泊松分布、二项分布以及伽玛分布。 - 连接方式:广义线性模型里采用的链接函数(`link function`)理论上可以是任意的,,而不再局限于$f(x)=x$。 -  这里需要重点说明一下链接函数。链接函数描述了线性预测$\beta^{T} X$与分布期望值$E[Y]$的关系。一般情况下,正态分布对应于恒等式,泊松分布对应于自然对数函数等。 +  这里需要重点说明一下链接函数。链接函数描述了线性预测$X\beta$与分布期望值$E[Y]$的关系。一般情况下,正态分布对应于恒等式,泊松分布对应于自然对数函数等。 +下面列出了`spark ml`中提供的链接函数。 +| 连接函数名称 | 公式 | 对应的指数分布 | +|------------|-------|-------------| +| identity(恒等)| $g=X\beta$ | 高斯分布,泊松分布,伽马分布 |