diff --git "a/\346\234\200\344\274\230\345\214\226\347\256\227\346\263\225/L-BFGS/lbfgs.md" "b/\346\234\200\344\274\230\345\214\226\347\256\227\346\263\225/L-BFGS/lbfgs.md" index 505cb68..d26d15d 100644 --- "a/\346\234\200\344\274\230\345\214\226\347\256\227\346\263\225/L-BFGS/lbfgs.md" +++ "b/\346\234\200\344\274\230\345\214\226\347\256\227\346\263\225/L-BFGS/lbfgs.md" @@ -153,11 +153,11 @@ $$J(x) = l(x) + r(x)$$   `L1`正则化的形式如下: -$$J(x) = l(x) + r(x) = l(x) + C|x|_{1} = l(x) + C\sum_{i} |x_{i}|$$ +$$ J(x) = l(x) + r(x) = l(x) + C||x||_{1} = l(x) + C\sum_{i} |x_{i}| $$   `L2`正则化的形式如下: -$$J(x) = l(x) + r(x) = l(x) + C|x|_{2} = l(x) + C\sum_{i} x_{i}^{2}$$ +$$ J(x) = l(x) + r(x) = l(x) + C||x||_{2} = l(x) + C\sum_{i} x_{i}^{2} $$   `L1`正则化和`L2`正则化之间的一个最大区别在于前者可以产生稀疏解,这使它同时具有了特征选择的能力,此外,稀疏的特征权重更具有解释意义。如下图: