RapidMiner和Python
在这个页面上,我们收集了RapidMiner的所有特性,这些特性可以将RapidMiner的潜能释放给那些喜欢在项目中使用(Python)代码的数据爱好者。我们还将展示所有您可以将此转化为团队工作的方法,与团队中喜欢使用RapidMiner经过验证的创作方法(使用操作符和流程)的其他人进行交互。
从RapidMiner调用Python
作为一个RapidMiner项目的用户,你会经常发现它很有用从RapidMiner进程调用Python代码.更进一步,你可以做到将Python编写的模型训练或ETL转换“打包”为RapidMiner操作符并将其分发给团队中的其他人。在一些典型的场景中,这将派上用场:
- 你会发现将数据准备步骤或建模步骤编写为Python代码更容易或更方便
- 你想重用团队中某个人创建的一段Python代码
- 你想用一个前沿的Python库来扩展RapidMiner
从Python调用RapidMiner
当使用Python代码(可能是笔记本)时,您可能希望访问存储在RapidMiner项目和存储库中的数据和元数据,这对调用RapidMiner Studio或RapidMiner AI Hub来运行一些进程.我们提供了一个Python库,它允许你处理这些典型的场景:
- 你想要利用存储和准备在RapidMiner存储库或项目中的数据
- 你想运行一个内置在RapidMiner中的进程,并将其输出作为代码的输入
- 您希望访问外部数据源,而不需要在代码中处理凭据
RapidMiner笔记本
RapidMiner笔记本提供一个熟悉的基于笔记本的代码创作环境,作为RapidMiner AI Hub的一部分。它允许精通代码的数据科学家和数据工程师以熟悉的方式完成他们的工作,同时还允许使用RapidMiner与其他团队成员进行开箱即用的协作,以进行创作和部署。RapidMiner笔记本可以派上用场的一些典型场景:
- 你的公司已经采用了RapidMiner AI Hub,你希望继续在Notebook环境中工作
- 你正在使用RapidMiner项目与他人合作
- 你需要使用存储在RapidMiner项目或存储库中的数据集,用于基于Notebook的项目
- 你需要一个RapidMiner进程的输出作为你基于Notebook的项目的输入
体系结构
这个图表解释了高级组件,它们一起实现了RapidMiner AI Hub中Python代码编写和执行的集成。这些都支持上面提到的所有用例,只需要很少或不需要手动配置。

平台管理提供了可能性集中管理编码环境横跨AI Hub,用虚线箭头表示。
剩下的箭头表示Python代码中的RapidMiner进程执行使用我们的Python库
启用Python脚本扩展Python代码在产品各个组件中的执行(RapidMiner Server用于类似web服务的执行,RapidMiner Job Agents用于调度和临时批处理执行)。