词频与句子计算

fatihyldrimfatihyldrim 成员职位:1新手

我刚开始使用RapidMiner。虽然我关注论坛,看视频,但有一个问题我解决不了。如果你能帮忙,我会很高兴的。

首先,我想在一份80-90页的pdf文件中找到一些单词的频率。我想知道“环境、政府、商业、商业”这些词在这个pdf文件中出现了多少次。我发现所有单词的频率,甚至单个单词的频率与过滤器选项。然而,我想找到所有30个关键词的频率。

其次,这个pdf文件中有多少个句子,其中有多少个句子包含“环境、政府、商业、商业”等关键词。

答案

  • ruhailaruhaila 成员职位:48大师
    也许共享您的.rpm和数据文件?
登录注册置评。