类别:机器学习

新的学习算法不包括在RapidMiner核心。

异常检测
异常检测扩展包括最著名的无监督异常检测算法,将个别异常分数分配给示例集的数据行


深度学习
这个扩展提供了在CPU和GPU上执行的深度学习功能。

Edda -双名文本分类的扩展(主题模型和正则表达式)
文件、发现和分析中的证据(EDDA)。这项工作由美国国家医学图书馆、美国国立卫生研究院批准。R00LM010943。PI Tanja Bekhuis。开发者Kevin Mitchell和Eugene Tseytlin。EDDA团队在GNU Affero通用公共许可证下提供的所有软件。

特征选择扩展
这个rapidminer插件由用于特征选择和分类的操作符(主要用于高维(微阵列)数据)和一些帮助类/操作符组成。

预测
这个扩展提供了两个新的操作符,Foreacast(单变量)和Forecast(多变量),允许简单但强大的时间序列预测。

预测
这个扩展提供了两个新的操作符,Foreacast(单变量)和Forecast(多变量),允许简单但强大的时间序列预测。

Holt-Winters过滤
这是一个时间序列预测算子。它计算给定时间序列的Holt-Winters滤波。通过最小化预测误差的平方来确定未知参数。

信息选择
该扩展包括一组操作符,用于从分类和回归问题的训练集中选择信息。这些操作符用于实例选择(示例集选择)、实例构造(创建表示一组其他实例的新示例)、聚类、LVQ神经网络、降维等。这些算子可用于异常值消除和训练集压缩。

解释
这个扩展为您提供了来自解释和可解释AI空间的额外操作符。目前它涵盖了LIME, SHAP和Shapely。注意,这是一个alpha版本。

Keras扩展
Keras扩展允许使用Keras,一个用于深度学习的高级Python库,利用Tensorflow, Microsoft Cognitive Toolkit (CNTK)或Theano作为计算后端。

生活方式营销
生活方式营销允许基于原始交易和问卷调查/影响数据进行财务结果预测,与对照组/平均值进行比较。它自动生成所有关键字和值的行为和人口统计特征,包括RFM,并构建最具经济效益的(给定统计置信度)预测模型。在一台普通PC上分析数百万条观测数据需要几分钟到几个小时。免费版本在Windows上运行,限制为100K观测值。

MDL-Extension
这是一个基于MDL(最小描述长度)扩展实现的项目。MDL原理可以应用于获得数据集的更短的描述,使用它的规律来参考适当的压缩。因此,最好的描述被视为对数据集压缩最好的描述。MDL扩展目前包括一个用于实现KRIMP算法的运算符,该运算符可用于修剪一组频繁模式。

MonkeyLearn
MonkeyLearn是一个人工智能平台,允许公司使用机器学习轻松分析文本。像Clearbit、Segment和Drift这样的客户正在使用MonkeyLearn将电子邮件、支持票、客户反馈和文档转化为可操作的数据。

规范的分析
这个扩展提供了一个算子来做规定性优化。这意味着您可以改变示例的值来优化自定义适应度函数,该函数可能来自模型。目前支持的优化器:-网格-进化- BYOBA
注意:这是一个测试版!

销售预测模型
Cappius开发的销售预测模型使用用户定义的窗口,通过线性回归来预测时间序列的未来值。可以使用的模型是神经网络或支持向量机。模型的性能也通过残差分析进行评估。

微笑
这个扩展包装功能从Smile库(http://haifengl.github.io/smile/),并提供他们作为操作符。

WhiBo
WhiBo是一个设计和评估白盒的框架。基于组件的决策树算法及其组成部分。它旨在供数据挖掘从业者、研究人员和算法开发人员使用,但也用于决策树算法的教学。扩展的官方网页是www.whibo.fon.bg.ac.rs。

Word2Vec
Word2Vec是一种流行的算法,基于:向量空间中单词表示的有效估计,Mikolov等人(2013)。在单个语料库上训练,算法将为每个单词生成一个多维向量。已知这些向量具有赛门铁克含义。常用的距离度量是余弦相似度。这个实现是基于word2vec端口的:https://github.com/allenai/Word2VecJava

XGBoost扩展
这个扩展嵌入了XGBoost eXtreme梯度增强库,用于RapidMiner。它实现了一个名为XGBoost的操作符,与RapidMiner的内置学习器兼容。