Rapidminer是正确的工具吗?

ObolongoObolongo 成员职位:1新手
这是我第一次接触数据挖掘领域,所以请耐心等待。
我有一个项目列表(几千)与各种相关领域。这些领域不是标准化的,也不是同质的。另一方面,我有多种分散的信息来源:pdf、网页、数据库等。我的目标是在关联字段的基础上,根据分散的信息为每个项目分配两个值。这些值是“主题”和“地理位置”。RapidMiner能帮我解决这个问题吗,还是我完全迷路了?

答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:926独角兽
    嗨!

    这是一个很大的项目,RapidMiner可以帮助它,使用一些免费的扩展。

    您可以使用Web挖掘扩展来导入网页。您可以访问数据库并从中获取信息。文本处理扩展提供了文本分类的方法,并且可以从PDF文件中读取文本。

    RapidMiner可以轻松地处理数千个属性和混乱的数据。

    问候,
    Balazs

登录注册置评。