将预处理后的文本数据导出为Excel文件

lolollolol 成员职位:5新手

你好,

我真的需要你的帮助。我创建了一个预测模型。我使用的数据集包含几个文本属性,这些属性在预处理阶段合并为一个文本属性/列。该预处理包括标记化、停止词删除、标记过滤、词干提取和生成n-gram等步骤。你能指导我如何不合并回所有这些文本属性,并进入不同的列,因为他们以前?此外,我想将数据导出到Excel文件中,以便我可以将原始未处理的文本与预处理的文本进行比较。谢谢你的帮助。

答案

  • ruhailaruhaila 成员职位:48大师
    嗨。

    由于没有.rmp或数据文件包含在您的帖子中,我只是假设您可以使用SELECT ATTRIBUTES操作符来取消合并属性。导出Excel有WRITE Excel操作符。hth。
  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:926独角兽
    嗨!

    通常,获取初始数据的最简单方法是创建一个ID(如果还没有ID)并将数据集相乘。然后执行任意预处理,保留ID属性,然后在处理后返回。

    问候,
    Balazs
    ceaperez
登录注册置评。