用于特定应用程序域或用例的算法和运算符。
这个扩展提供了一个简单的机制,从文本提取词性和命名实体识别标签。
Diffbot (http://www.diffbot.com/)客户端,适用于RapidMiner 6.1或以上版本,用于分析网页。
HanMiner扩展提供了一个快速和易于使用的工具集,以执行中文普通话(汉语)的文本处理和挖掘任务。
信息提取扩展为信息提取目的提供了几个操作符。分词器用于将文档分成更小的部分(句子、单词……)。
将无意义云的文本分析集成到您的工作流程中。包含了几个具有经典自然语言处理(NLP)任务的api:主题提取、术语化、分类、深度分类和情感分析。我们提供10种语言:全面覆盖英语、西班牙语、法语、意大利语和葡萄牙语,部分覆盖北欧语言、阿拉伯语、汉语和俄语。使用我们的自定义工具来创建自定义资源,并最大化您的文本分析的准确性。乐鱼体育安装
ProM框架和工具集已经成为过程挖掘的事实上的标准。ProM是一个可插拔的环境,用于使用MXML、SA-MXML或XES作为输入格式的流程挖掘。现在ProM框架和RapidMiner数据分析解决方案连接起来了。因此,ProM的任何发现、一致性或扩展算法都可以在RapidMiner分析过程中使用,也可以构建专门的过程挖掘分析。
RapidMiner的本体扩展支持在语义丰富的数据中进行聚类和频繁的模式发现。
操作符,用遗传操作符创建分级标签导航。看到相关的论文。
文本扩展添加了统计文本分析和自然语言处理(NLP)所需的所有操作符。您可以从许多不同的数据源加载文本,通过大量不同的过滤技术对它们进行转换,最后分析文本数据。
Web挖掘扩展提供了对互联网资源的访问,如网页、RSS提要和Web服务。它还能够处理和转换网页上的内容。
WordNet扩展提供了操作符来利用WordNet数据库进行词干提取和检测相关单词(同义词、超级词、下义词等)。