RapidMiner市场 - 乐鱼平台app

异常检测

异常检测扩展包括最著名的无监督异常检测算法，将个别异常分数分配给示例集的数据行

语料库语言学插件LDA

深度学习

这个扩展提供了在CPU和GPU上执行的深度学习功能。

Edda -双名文本分类的扩展(主题模型和正则表达式)

文件、发现和分析中的证据(EDDA)。这项工作由美国国家医学图书馆、美国国立卫生研究院批准。R00LM010943。PI Tanja Bekhuis。开发者Kevin Mitchell和Eugene Tseytlin。EDDA团队在GNU Affero通用公共许可证下提供的所有软件。

特征选择扩展

这个rapidminer插件由用于特征选择和分类的操作符(主要用于高维(微阵列)数据)和一些帮助类/操作符组成。

预测

这个扩展提供了两个新的操作符，Foreacast(单变量)和Forecast(多变量)，允许简单但强大的时间序列预测。

预测

这个扩展提供了两个新的操作符，Foreacast(单变量)和Forecast(多变量)，允许简单但强大的时间序列预测。

Holt-Winters过滤

这是一个时间序列预测算子。它计算给定时间序列的Holt-Winters滤波。通过最小化预测误差的平方来确定未知参数。

信息选择

该扩展包括一组操作符，用于从分类和回归问题的训练集中选择信息。这些操作符用于实例选择(示例集选择)、实例构造(创建表示一组其他实例的新示例)、聚类、LVQ神经网络、降维等。这些算子可用于异常值消除和训练集压缩。

解释

这个扩展为您提供了来自解释和可解释AI空间的额外操作符。目前它涵盖了LIME, SHAP和Shapely。注意，这是一个alpha版本。

Keras扩展

Keras扩展允许使用Keras，一个用于深度学习的高级Python库，利用Tensorflow, Microsoft Cognitive Toolkit (CNTK)或Theano作为计算后端。

生活方式营销

生活方式营销允许基于原始交易和问卷调查/影响数据进行财务结果预测，与对照组/平均值进行比较。它自动生成所有关键字和值的行为和人口统计特征，包括RFM，并构建最具经济效益的(给定统计置信度)预测模型。在一台普通PC上分析数百万条观测数据需要几分钟到几个小时。免费版本在Windows上运行，限制为100K观测值。

MDL-Extension

这是一个基于MDL(最小描述长度)扩展实现的项目。MDL原理可以应用于获得数据集的更短的描述，使用它的规律来参考适当的压缩。因此，最好的描述被视为对数据集压缩最好的描述。MDL扩展目前包括一个用于实现KRIMP算法的运算符，该运算符可用于修剪一组频繁模式。

MonkeyLearn

MonkeyLearn是一个人工智能平台，允许公司使用机器学习轻松分析文本。像Clearbit、Segment和Drift这样的客户正在使用MonkeyLearn将电子邮件、支持票、客户反馈和文档转化为可操作的数据。

规范的分析

这个扩展提供了一个算子来做规定性优化。这意味着您可以改变示例的值来优化自定义适应度函数，该函数可能来自模型。目前支持的优化器:-网格-进化- BYOBA
注意:这是一个测试版!

销售预测模型

Cappius开发的销售预测模型使用用户定义的窗口，通过线性回归来预测时间序列的未来值。可以使用的模型是神经网络或支持向量机。模型的性能也通过残差分析进行评估。

微笑

这个扩展包装功能从Smile库(http://haifengl.github.io/smile/)，并提供他们作为操作符。

WhiBo

WhiBo是一个设计和评估白盒的框架。基于组件的决策树算法及其组成部分。它旨在供数据挖掘从业者、研究人员和算法开发人员使用，但也用于决策树算法的教学。扩展的官方网页是www.whibo.fon.bg.ac.rs。

Word2Vec

Word2Vec是一种流行的算法，基于:向量空间中单词表示的有效估计，Mikolov等人(2013)。在单个语料库上训练，算法将为每个单词生成一个多维向量。已知这些向量具有赛门铁克含义。常用的距离度量是余弦相似度。这个实现是基于word2vec端口的:https://github.com/allenai/Word2VecJava

XGBoost扩展

这个扩展嵌入了XGBoost eXtreme梯度增强库，用于RapidMiner。它实现了一个名为XGBoost的操作符，与RapidMiner的内置学习器兼容。