From 4a380c5284eac37ed7ce9b6dda6aeccfc37c3ae5 Mon Sep 17 00:00:00 2001 From: shataowei Date: Sun, 13 Sep 2020 15:51:31 +0800 Subject: [PATCH] =?UTF-8?q?=E8=A1=A5=E5=85=85=E4=BA=86LDA=E7=9A=84?= =?UTF-8?q?=E9=97=AE=E9=A2=98=E9=9B=86=E5=90=88?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .idea/workspace.xml | 30 +++++++++---------- .../LDA.md" | 1 - 2 files changed, 14 insertions(+), 17 deletions(-) diff --git a/.idea/workspace.xml b/.idea/workspace.xml index c5784ae..0c717c6 100644 --- a/.idea/workspace.xml +++ b/.idea/workspace.xml @@ -2,8 +2,6 @@ - - @@ -25,11 +23,11 @@ - + - + @@ -49,12 +47,12 @@ - + - - + + @@ -132,8 +130,8 @@ @@ -1285,11 +1283,11 @@ - + - - + + @@ -1298,7 +1296,7 @@ - + @@ -1307,11 +1305,11 @@ - + - - + + @@ -1320,7 +1318,7 @@ - + diff --git "a/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/LDA.md" "b/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/LDA.md" index d8cb028..38aedb3 100644 --- "a/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/LDA.md" +++ "b/\350\207\252\347\204\266\350\257\255\350\250\200\345\244\204\347\220\206/LDA.md" @@ -81,7 +81,6 @@ - alpha越小,文档属于某一个主题的概率很大,接近于1,属于其他主题的概率就很小,文章的主题比较明确 - beta同理,但是一般不会刻意去改beta,主要是压缩alpha到一定小的程度 - chucksize大一些更新的过程比较平稳,收敛更加平稳 -- 迭代次数一般不超过2000次,200万doc大约在2300次收敛 # 使用过LDA,你有什么问题?