“根据预定义的字典计数音节”


嗨,社区,
我想数一下文件里的音节。因此,我有一个预定义的字典(在excel中),其中包含85000个单词及其相应的音节值。
现在我想对文档进行标记,并对文档中的音节进行计数。因此,我将检索文本中的音节数。我需要什么接线员?
我希望你能在那个话题上帮助我。
致以最诚挚的问候和感谢。
马库斯
标记:
0
最佳答案
-
Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年
独角兽
当然,这实际上很简单。首先使用“Process document”对文档进行标记,然后使用“wordlist to Data”操作符输出单词列表,这将为您提供一个带有计数的单词列表示例集。然后你应该能够使用“join”(你将加入单词/令牌)加入你的音节计数,并使用“Generate Attributes”来计算单词计数和每个单词的音节计数的乘积,然后使用“Aggregate”来获得该乘积的总和。你应该在文件中有完整的音节!
1
答案
谢谢,@Telcontar120,求出好的解。@markus_dressel-你愿意与社区分享你的excel“音节”表吗?这可能是别人觉得有用的资源。
斯科特
这正是我一直在寻找的解决方案。它工作得很好。非常感谢@Telcontar120
@sgenzer我用的是劳格汉和麦克唐纳提供的商业词典。
可以找到清单和全面的解释在这里:
非常感谢你的帮助,
最好的问候,
马库斯
我昨天才开始使用RapidMiner,所以我是一个新手,现在有点不知所措。你能不能给我解释一下最后的解决方案是什么样子的?