关于数据挖掘的问题
最佳答案
-
yyhuang 管理员,员工,RapidMiner认证分析师,RapidMiner认证专家,成员职位:363
RM数据科学家
嗨@andre5007,
我的老师说,在他得到模型之前,他必须安排训练CSV的其他壮举之间的关系,以便知道使用哪个模型。
我在这里的理解是尝试探索预测器/特征和标签之间的潜在关系/相关性(所谓的特征工程)。
https://academy.m.turtlecreekpls.com/learn/video/feature-engineering-intro
有一些有用的操作符可供选择:
“生成属性”,例如:壮举1 *壮举2,壮举1 +壮举4,壮举1 /壮举5
《汽车特征工程》,//m.turtlecreekpls.com/resource/automatic-feature-engineering/
通过“前向选择”或“后向消除”或类似的方法进行特征选择/缩减
在这里可以找到有用的文档//m.turtlecreekpls.com/blog/data-prep-feature-generation-selection/
HTH !
YY1