从Excel数据中删除带有“@”和表情符号的提及
你好,RapidMiner社区,
我目前正在研究一个监督情绪分析。我在情感分析方面取得了成功,但我对它使用的数据并不满意。
作为数据准备的一部分,我想删除提及(即“@”后面的名称),并且我尝试了一些建议。我目前生成的流程和测试数据都上传到这里。
我正在使用“替换”操作符,但遗憾的是,按照这个过程,结果仍然包含一些提及。这些提及仍然存在,因为a)它们是一行中的第二个提及,或者b)它们提到的不是一行的开头。
你们有人对此有什么意见吗?
总的来说,我想要达到的目标是:
-删除任何以“@”开头的单词(不是整行)。
删除空行
删除重复的
-删除表情符号(现在,在这个过程中,我结束了问号而不是表情符号作为输出,所以我宁愿立即删除表情符号)
感谢任何建议!
安娜可能
我目前正在研究一个监督情绪分析。我在情感分析方面取得了成功,但我对它使用的数据并不满意。
作为数据准备的一部分,我想删除提及(即“@”后面的名称),并且我尝试了一些建议。我目前生成的流程和测试数据都上传到这里。
我正在使用“替换”操作符,但遗憾的是,按照这个过程,结果仍然包含一些提及。这些提及仍然存在,因为a)它们是一行中的第二个提及,或者b)它们提到的不是一行的开头。
你们有人对此有什么意见吗?
总的来说,我想要达到的目标是:
-删除任何以“@”开头的单词(不是整行)。
删除空行
删除重复的
-删除表情符号(现在,在这个过程中,我结束了问号而不是表情符号作为输出,所以我宁愿立即删除表情符号)
感谢任何建议!
安娜可能
0
答案
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
<列出关键= "注释" / >
<列出关键= " data_set_meta_data_information " >
< / >列表
< /操作符>
<参数键=“replace_what”值= " [^ \ x00 - \ x7F] " / >
< /操作符>
< /操作符>
> < /过程
< /操作符>
> < /过程
德国多特蒙德
感谢您的快速回复
你能解释一下为什么会这样吗?
欢呼,
安娜可能
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
<列出关键= "注释" / >
<列出关键= " data_set_meta_data_information " >
< / >列表
< /操作符>
<参数键=“replace_what”值= " [^ \ x00 - \ x7F] " / >
< /操作符>
< /操作符>
> < /过程
< /操作符>
> < /过程
德国多特蒙德
再次感谢您的时间!我不知道为什么,但这仍然不适合我。您介意以另一种形式分享您的流程吗?
欢呼,
安娜可能
德国多特蒙德
德国多特蒙德