看起来你是新来的。登录或注册开始。
你好,
我真的需要你的帮助。我创建了一个预测模型。我使用的数据集包含几个文本属性,这些属性在预处理阶段合并为一个文本属性/列。该预处理包括标记化、停止词删除、标记过滤、词干提取和生成n-gram等步骤。你能指导我如何不合并回所有这些文本属性,并进入不同的列,因为他们以前?此外,我想将数据导出到Excel文件中,以便我可以将原始未处理的文本与预处理的文本进行比较。谢谢你的帮助。
答案
由于没有.rmp或数据文件包含在您的帖子中,我只是假设您可以使用SELECT ATTRIBUTES操作符来取消合并属性。导出Excel有WRITE Excel操作符。hth。
通常,获取初始数据的最简单方法是创建一个ID(如果还没有ID)并将数据集相乘。然后执行任意预处理,保留ID属性,然后在处理后返回。
问候,
Balazs