性能(二项分类)错误:不兼容的标签和预测

amitdamitd 委员、大学教授职位:49Maven
2021年3月编辑 帮助
我有一个简单的例子来演示不同阈值对误差、准确性、灵敏度等的影响。当我选择分类误差和准确性作为度量时,它工作得很好。然而,当我添加精确度、召回率、AUC等指标时,我就会在性能(二项分类)操作符中得到错误:
“不兼容的标签和预测”,包含以下详细信息:预测属性的值与标签属性的值不匹配。如果预测属性的值与标签属性的值不匹配,则无法计算性能。
虽然我理解错误试图告知的内容,但没有迹象表明预测属性的值与标签的值不匹配。我已经用断点等检查了这一点。我附上了数据CSV文件、工作流程RMP文件和错误流程RMP文件。

@sgenzer或者还有其他人可以帮忙吗?

标记:

最佳答案

  • rdesairdesai 雇员、研究员、会员职位:14RM研究
    解决方案接受
    问题是,当您想使用Recall和Precision时,它期望属性(标签(类)和预测)的值相同。在您的示例中,您设置了阈值0.0,并为优化网格操作符选择了“出错失败”。所以现在类和预测列的值(owner和true)与您的类列(nonowner和owner)不匹配。请看下面的图片。
    因此,尝试设置不同的阈值或选择“忽略错误”来优化网格操作符。那么您的类和预测列将看起来像这样。
    二项分类包括查全率和查准率的结果是这样的


    希望这对你有帮助!
    登录注册置评。