CSV文件在导入到RapidMiner时变得非常大

konmadkonmad 成员职位:1新手
2022年8月编辑 帮助
嘿,大家,

我有一个。csv文件的大小为283MB,但是当将文件加载到RapidMiner中时,它变成了大约6.7GB,这对于我的系统来说太大了,无法执行文本挖掘。该文件包含3列和大约220,000行。其中两列是简单的ID,另一列是实际的文本,每列大约有100个单词。也许你们中的一些人遇到了同样的问题,可以帮助我解决它,或者至少了解这里发生了什么。

提前感谢大家!

答案

  • ceaperezceaperez 成员职位:434独角兽
    @konmad

    这个问题可能是由编码和元数据引起的。
    您是否尝试过在CSV导入后使用Store操作符,然后使用Retrieve操作符直接从Rapidminer导入数据?

    最好的
    塞萨尔
登录注册置评。