如何获得优于k-Means聚类的性能?

黄金黄金 成员职位:12贡献我
大家好
我有个问题。我想用k均值聚类后的性能。为了达到这个目的,我必须在聚类后对标签使用地图聚类,当我运行这个项目时,我看到了一个错误,我必须改变K的数量,而我不允许改变K的数量,因为我正在做论文,这对我来说是不可能的。这个问题有什么解决办法吗?请看这幅画。
在第二步中,我认为我可以使用样本来解决这个问题,但我看到了一个关于样本大小的错误。我不知道这样做的最佳样本量是多少?这种方法正确吗?请看图片(图片中的样品尺寸是100)。
谢谢您的关注。

答案

  • ceaperezceaperez 成员职位:434独角兽
    @gold

    首先,在Rapidminer操作符教程中有一个关于分类性能的优秀示例模型。请搜索性能分类(分类)操作符并打开其教程(在性能(分类)中使用性能端口)
    为了响应您在图片中显示的错误,Map Clustering on Labels操作符中的错误可能是由于,为了映射标签和集群,您需要在标签属性和集群中拥有相同数量的元素。

    我希望这能帮到你

    最好的

    塞萨尔
    lionelderkrikor
登录注册置评。