性能(分类)问题

tonyboy9tonyboy9 成员职位:107因素二世
2020年9月编辑 帮助
请注意我的信用卡数据集的左右两侧进行聚类:





接下来是进程,由于性能错误消息而中断了太长时间。这是最新的坏事:缺少标签。输入示例集没有标签属性。我检查了设置角色操作符参数有一个标签属性。



我又跑了一次。现在我得到了非标称标签。标签属性(Purchases_Frequency)必须是标称的,用于计算分类任务的性能标准。

我真的很想把比赛进行到底,证明成绩(排名)是值得的。请给我一些有用的建议。谢谢你的宝贵时间。
托尼



标记:

答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    我会在该操作符之前添加一个断点,并检查群集操作符是否修改了您的角色。如果是这样,那么您只需在Performance操作符之前添加另一个Set Role,以便根据需要进行设置。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
  • tonyboy9tonyboy9 成员职位:107因素二世
    好吧,布莱恩,我是断点的新手,我想我在这里迷路了。我去了性能,之前安装了一个断点。



    然后尝试Shift + F7,没有。然后点击Run按钮,在Results中看到这个。



    我哪里做错了?谢谢。

    托尼
  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    在我看来,你在这一点上并没有象征性的作用(你的绿色列看起来像是数字)。因此,只需在性能(分类)操作符之前添加另一个Set Role,并将适当的属性设置为label的角色,并确保数据类型是标称的。
    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
  • tonyboy9tonyboy9 成员职位:107因素二世
    Brian,我们可以回到RapidMiner对k-means算子的定义吗?我正在尝试使用k-means算子将信用卡客户划分为不同的组。

    作为没有标签属性是必需的,聚类可用于未标记的数据,是一个算法无监督机器学习。的k-意味着算法确定了一组k并将每个示例分配给确切的一个集群。集群由相似的示例组成。

    不知何故,我认为我需要有一个标签属性,所以在Set Role中,我选择购买频率作为标签。这不是违背了k-means算子的目的吗?

    现在要使性能工作,我需要另一个具有不同属性的设置角色,这是标称的,而不是购买频率(绿色列),这是数字。

    我理解这一点的唯一方法是回到TurboPrep改变购买频率属性类型,而不是“数字”。

    谢谢你的宝贵时间。




登录注册置评。