特征选择:根据数据类型选择方法

Casper72Casper72 成员职位:17因素二世
亲爱的快船矿工们:

我试图预测一个大型(80000 obs.)数据集的二进制依赖结果,有210个可能的预测因子。在尝试任何向后消除或甚至暴力破解方法之前,我想确定最有用的变量以减少计算时间。变量既可以是连续测量值,也可以是分类序数和标称数。我的知识有限,但我认为根据数据类型使用不同的特征选择方法可能是合适的。

对于每种数据类型(加权信息增益,卡方等),您将使用哪种运算符?或者我应该考虑一种完全不同的特征选择方法?
    登录注册置评。