聚类距离性能算子的计算

amitdamitd 委员、大学教授职位:49Maven
2021年11月编辑 帮助
我在复制"平均在簇内距离指标产生的性能(集群距离性能)操作符。

操作人员文档说明-“avg._within_centroid_distance:平均簇内距离是通过平均质心和集群所有示例之间的距离来计算的。”术语“avg_within_centroid_distance”似乎让我感到困惑,因为定义实际上是说它是“avg_within_cluster_distance”,这完全是两个不同的概念。此外,除了为每个集群计算度量之外,还不清楚如何计算总体的“avg._within_centroid_distance”。

我附上了Iris数据集的示例计算以及RapidMiner进程。我能够复制Davies Bouldin指数,但不能复制“avg. _within_centerid_distance”。任何帮助都将非常感激。

与此相关的是,我也不清楚性能(集群密度性能)运算符是如何计算的。我确实读了操作人员文档,但对我来说没有意义。


答案

  • amitdamitd 委员、大学教授职位:49Maven
    我发现“avg._within_centroid_distance”计算的是平方欧几里得距离每个观测值与相应质心之间的距离,而不是欧几里得距离。

    如果有人能解释一下性能(集群密度性能)操作员正在计算,这将有所帮助。谢谢。
登录注册置评。