Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于聚类后如何再分类的问题 #1

Open
UPUPGOO opened this issue Dec 25, 2019 · 3 comments
Open

关于聚类后如何再分类的问题 #1

UPUPGOO opened this issue Dec 25, 2019 · 3 comments

Comments

@UPUPGOO
Copy link

UPUPGOO commented Dec 25, 2019

非常感谢你的分享。
我有个疑问关于optics的,如何在聚类之后为未知的数据再进行预测分类呢?
在sckit-learn我找到kmeans方法有predict但其他的聚类方法都没有,所以想自己写一下,在这个方面,有没有可以指教一二的?
非常感谢了。

@GISerWang
Copy link
Owner

非常感谢你的分享。
我有个疑问关于optics的,如何在聚类之后为未知的数据再进行预测分类呢?
在sckit-learn我找到kmeans方法有predict但其他的聚类方法都没有,所以想自己写一下,在这个方面,有没有可以指教一二的?
非常感谢了。

我不知道我有没有理解错你的意思。
关于kmeans方法,是寻找多个聚类中心,当找到聚类中心后,我对未知数据求距离,就可以对未参加聚类的数据进行预测分类(我理解的是:未参加聚类的数据就是你说的未知数据)。但是kmeans是一个基于划分的聚类方法,簇集是呈现类圆分布,因此会存在聚类中心。
但是optics是一个基于密度的聚类算法,聚类结果并不存在聚类中心,所以也就不存在所谓的预测(仅是我个人理解),因为密度聚类的形状是各种各样的。但是我们是否可以换个角度想?因为optics算法是核心点驱动的,那么处于核心点邻域内部的点是可以有类别的,我们可以将未参加聚类的数据与核心点求距离,然后在于空间邻域作比较,从而预测类别呢?
这只是我个人的一点看法,仅供参考。

@UPUPGOO
Copy link
Author

UPUPGOO commented Dec 30, 2019

非常感谢你的分享。
我有个疑问关于optics的,如何在聚类之后为未知的数据再进行预测分类呢?
在sckit-learn我找到kmeans方法有predict但其他的聚类方法都没有,所以想自己写一下,在这个方面,有没有可以指教一二的?
非常感谢了。

我不知道我有没有理解错你的意思。
关于kmeans方法,是寻找多个聚类中心,当找到聚类中心后,我对未知数据求距离,就可以对未参加聚类的数据进行预测分类(我理解的是:未参加聚类的数据就是你说的未知数据)。但是kmeans是一个基于划分的聚类方法,簇集是呈现类圆分布,因此会存在聚类中心。
但是optics是一个基于密度的聚类算法,聚类结果并不存在聚类中心,所以也就不存在所谓的预测(仅是我个人理解),因为密度聚类的形状是各种各样的。但是我们是否可以换个角度想?因为optics算法是核心点驱动的,那么处于核心点邻域内部的点是可以有类别的,我们可以将未参加聚类的数据与核心点求距离,然后在于空间邻域作比较,从而预测类别呢?
这只是我个人的一点看法,仅供参考。

很感谢你的回复。核心点这个词很有兴趣,请问有相关的论文或者博客提到这个知识吗?核心点的定义和划分都是个问题。

@GISerWang
Copy link
Owner

非常感谢你的分享。
我有个疑问关于optics的,如何在聚类之后为未知的数据再进行预测分类呢?
在sckit-learn我找到kmeans方法有predict但其他的聚类方法都没有,所以想自己写一下,在这个方面,有没有可以指教一二的?
非常感谢了。

我不知道我有没有理解错你的意思。
关于kmeans方法,是寻找多个聚类中心,当找到聚类中心后,我对未知数据求距离,就可以对未参加聚类的数据进行预测分类(我理解的是:未参加聚类的数据就是你说的未知数据)。但是kmeans是一个基于划分的聚类方法,簇集是呈现类圆分布,因此会存在聚类中心。
但是optics是一个基于密度的聚类算法,聚类结果并不存在聚类中心,所以也就不存在所谓的预测(仅是我个人理解),因为密度聚类的形状是各种各样的。但是我们是否可以换个角度想?因为optics算法是核心点驱动的,那么处于核心点邻域内部的点是可以有类别的,我们可以将未参加聚类的数据与核心点求距离,然后在于空间邻域作比较,从而预测类别呢?
这只是我个人的一点看法,仅供参考。

很感谢你的回复。核心点这个词很有兴趣,请问有相关的论文或者博客提到这个知识吗?核心点的定义和划分都是个问题。

DBSCAN和OPTICS算法原理中,都对核心点做了定义:若点pt在r邻域中点个数大于Minpts,则称pt为核心点。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants