From 585b1a4b4c15d0f207b57434a698d00cdee3c609 Mon Sep 17 00:00:00 2001 From: endy Date: Wed, 25 Jan 2017 14:11:14 +0800 Subject: [PATCH] glr --- .../glr.md" | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git "a/\345\210\206\347\261\273\345\222\214\345\233\236\345\275\222/\347\272\277\346\200\247\346\250\241\345\236\213/\345\271\277\344\271\211\347\272\277\346\200\247\345\233\236\345\275\222/glr.md" "b/\345\210\206\347\261\273\345\222\214\345\233\236\345\275\222/\347\272\277\346\200\247\346\250\241\345\236\213/\345\271\277\344\271\211\347\272\277\346\200\247\345\233\236\345\275\222/glr.md" index 39f443a..68de5c6 100644 --- "a/\345\210\206\347\261\273\345\222\214\345\233\236\345\275\222/\347\272\277\346\200\247\346\250\241\345\236\213/\345\271\277\344\271\211\347\272\277\346\200\247\345\233\236\345\275\222/glr.md" +++ "b/\345\210\206\347\261\273\345\222\214\345\233\236\345\275\222/\347\272\277\346\200\247\346\250\241\345\236\213/\345\271\277\344\271\211\347\272\277\346\200\247\345\233\236\345\275\222/glr.md" @@ -26,9 +26,10 @@ $$E[Y] = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + … + \beta_{p-1} x_{p-1}$$ - 响应变量$Y$和误差项$\epsilon$的分布推广至指数分散族(`exponential dispersion family`)。在`spark ml`中,广义线性回归支持的分布分别是正态分布、泊松分布、二项分布以及伽玛分布。 - 连接方式:广义线性模型里采用的链接函数(`link function`)理论上可以是任意的,,而不再局限于$f(x)=x$。 -  这里需要重点说明一下链接函数。链接函数描述了线性预测$X\beta$与分布期望值$E[Y]$的关系。一般情况下,正态分布对应于恒等式,泊松分布对应于自然对数函数等。 +  这里需要重点说明一下链接函数。链接函数描述了线性预测$X\beta$与分布期望值$E[Y]$的关系:$E[Y] = \mu = g^{-1}(X\beta)$ +一般情况下,正态分布对应于恒等式,泊松分布对应于自然对数函数等。 下面列出了`spark ml`中提供的链接函数。 | 连接函数名称 | 公式 | 对应的指数分布 | |------------|-------|-------------| -| identity(恒等)| $g=X\beta$ | 高斯分布,泊松分布,伽马分布 | +| identity(恒等)| $\mu = X\beta$ | 高斯分布,泊松分布,伽马分布 |