LDA结果(主题数和每个主题的字数)

ayaRizkayaRizk 成员职位:6因素二世
2022年11月编辑 帮助
嗨,我正在尝试从文件中提取主题,并将要提取的主题数量设置为50,每个主题的热门单词设置为20(默认值分别为10和5)。但是当我运行这个过程时,我得到了大约90个主题(不同的运行方式也会有所不同),每个主题超过50个单词。

我不确定我做错了什么。附上的过程在这里-感谢帮助!

编辑:现在我意识到了问题的根源。父进程“优化参数”可以选择设置每个主题的最大数量和单词作为所选参数。我在LDA操作符中设置了它们的值,而忘记了父操作符中的值,这似乎覆盖了LDA值。

问候,
阿雅

< ?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.10.011”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
<参数键=“filter_by_regex”值=美元”。* \ docx " / >
<过程扩展= " true " >
< /操作符>
> < /过程
< /操作符>
<过程扩展= " true " >
< /操作符>
< /操作符>
< /操作符>
< /操作符>
<列出关键= "注释" / >
<列出关键= " data_set_meta_data_information " / >
< /操作符>
< /操作符>
< /操作符>
< /操作符>
< /操作符>
> < /过程
< /操作符>
“参数”<列表键= >
< / >列表
<过程扩展= " true " >
< /操作符>
> < /过程
< /操作符>
> < /过程
< /操作符>
> < /过程

    登录注册置评。