“根据预定义的字典计数音节”

markus_dresselmarkus_dressel 成员职位:5贡献我
2019年6月编辑 帮助

嗨,社区,

我想数一下文件里的音节。因此,我有一个预定义的字典(在excel中),其中包含85000个单词及其相应的音节值。

现在我想对文档进行标记,并对文档中的音节进行计数。因此,我将检索文本中的音节数。我需要什么接线员?

我希望你能在那个话题上帮助我。

致以最诚挚的问候和感谢。

马库斯

最佳答案

  • Telcontar120Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽
    解决方案接受

    当然,这实际上很简单。首先使用“Process document”对文档进行标记,然后使用“wordlist to Data”操作符输出单词列表,这将为您提供一个带有计数的单词列表示例集。然后你应该能够使用“join”(你将加入单词/令牌)加入你的音节计数,并使用“Generate Attributes”来计算单词计数和每个单词的音节计数的乘积,然后使用“Aggregate”来获得该乘积的总和。你应该在文件中有完整的音节!

    布莱恩·T。
    Lindon合资企业
    乐鱼平台进入来自认证RapidMiner专家的数据科学咨询
    sgenzer

答案

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    谢谢,@Telcontar120,求出好的解。@markus_dressel-你愿意与社区分享你的excel“音节”表吗?这可能是别人觉得有用的资源。

    斯科特

  • markus_dresselmarkus_dressel 成员职位:5贡献我

    这正是我一直在寻找的解决方案。它工作得很好。非常感谢@Telcontar120

    @sgenzer我用的是劳格汉和麦克唐纳提供的商业词典。

    可以找到清单和全面的解释在这里

    非常感谢你的帮助,

    最好的问候,

    马库斯

    sgenzer Thomas_Ott
  • TFJ95TFJ95 成员职位:1新手
    谢谢你的帮助@Telcontar120
    我昨天才开始使用RapidMiner,所以我是一个新手,现在有点不知所措。你能不能给我解释一下最后的解决方案是什么样子的?


登录注册置评。