diff --git a/.idea/workspace.xml b/.idea/workspace.xml index c5784ae..0c717c6 100644 --- a/.idea/workspace.xml +++ b/.idea/workspace.xml @@ -2,8 +2,6 @@ - - @@ -25,11 +23,11 @@ - + - + @@ -49,12 +47,12 @@ - + - - + + @@ -132,8 +130,8 @@ @@ -1285,11 +1283,11 @@ - + - - + + @@ -1298,7 +1296,7 @@ - + @@ -1307,11 +1305,11 @@ - + - - + + @@ -1320,7 +1318,7 @@ - + diff --git "a/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/LDA.md" "b/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/LDA.md" index d8cb028..38aedb3 100644 --- "a/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/LDA.md" +++ "b/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/LDA.md" @@ -81,7 +81,6 @@ - alpha越小,文档属于某一个主题的概率很大,接近于1,属于其他主题的概率就很小,文章的主题比较明确 - beta同理,但是一般不会刻意去改beta,主要是压缩alpha到一定小的程度 - chucksize大一些更新的过程比较平稳,收敛更加平稳 -- 迭代次数一般不超过2000次,200万doc大约在2300次收敛 # 使用过LDA,你有什么问题?