From d9f30466f129fc87d2d333b0b9647bf1c4dae276 Mon Sep 17 00:00:00 2001 From: shataowei Date: Sat, 21 Dec 2019 16:37:26 +0800 Subject: [PATCH] fix bug --- .idea/workspace.xml | 213 ++++++++++++++---- .../GBDT.md" | 4 +- .../GloVe.md" | 3 + 3 files changed, 177 insertions(+), 43 deletions(-) diff --git a/.idea/workspace.xml b/.idea/workspace.xml index 33e9a27..847d288 100644 --- a/.idea/workspace.xml +++ b/.idea/workspace.xml @@ -2,8 +2,8 @@ - - + + @@ -24,11 +24,11 @@ - + - + @@ -48,6 +48,78 @@ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + @@ -114,7 +186,6 @@ @@ -239,6 +312,38 @@ \ No newline at end of file diff --git "a/\346\234\272\345\231\250\345\255\246\344\271\240/\351\233\206\346\210\220\345\255\246\344\271\240/GBDT.md" "b/\346\234\272\345\231\250\345\255\246\344\271\240/\351\233\206\346\210\220\345\255\246\344\271\240/GBDT.md" index 7c97d22..83be8b5 100644 --- "a/\346\234\272\345\231\250\345\255\246\344\271\240/\351\233\206\346\210\220\345\255\246\344\271\240/GBDT.md" +++ "b/\346\234\272\345\231\250\345\255\246\344\271\240/\351\233\206\346\210\220\345\255\246\344\271\240/GBDT.md" @@ -14,8 +14,8 @@ adaboost,gbdt等等 # gbdt和boostingtree的boosting分别体现在哪里? -- boostingtree利用基模型学习器,拟合的是当前模型与标签值的残差 -- gbdt利用基模型学习器,拟合的是当前模型与标签值的残差的负梯度 +- boostingtree利用基模型学习器,拟合的是mse(回归)或者指数损失函数(分类) +- gbdt利用基模型学习器,拟合的是当前模型与标签值的损失函数的负梯度 # gbdt的中的tree是什么tree?有什么特征? Cart tree,但是都是回归树 diff --git "a/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/GloVe.md" "b/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/GloVe.md" index 2c6f87a..9692151 100644 --- "a/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/GloVe.md" +++ "b/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/GloVe.md" @@ -8,3 +8,6 @@ - GloVe算法本身使用了全局信息,自然内存费的也就多一些 - 公现矩阵,NXN的,N为词袋量 - W2V的工程实现结果相对来说支持的更多,比如most_similarty等功能 + +# 如何处理未出现词? +按照词性进行已知词替换,\[unknow-n],\[unknow-a],\[unknow-v]...,然后再进行训练。实际去用的时候,判断词性后直接使用对应的unknown-?向量替代