在文本数据集上应用Word2vec

AC24AC24 成员职位:2新手
你好,我创建了一个用于文本分类的SVM模型,我想和大家分享一下这个过程,希望大家有什么建议来改进它。这个分类器的目的是将评论、评论或句子的数据集分类为正面和负面,我用于训练的数据集由2400条tweet组成(1200条正面和1200条负面)。

我还想问你是否有办法在这个过程中实现word2vec嵌入,或者我如何为此目的创建一个替代过程。如果我尝试在操作符循环和循环集合上应用word2vec,这会返回一些错误,我不知道如何给出一个句子的数据集(我的数据集具有属性“文本”和“情感”),而不是整个文本或长文本的集合。

下面是这个过程的代码:

<?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.10.011”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
< /操作符>
<列出关键= " additional_words " / >
< /操作符>
< /操作符>
<列出关键= " specify_weights " / >
<过程扩展= " true " >
< /操作符>
< /操作符>
< /操作符>
> < /过程
< /操作符>
< /操作符>
< /操作符>
<列出关键= " set_additional_roles " >
< / >列表
< /操作符>
<枚举关键= "分区" >
< /枚举>
< /操作符>
<过程扩展= " true " >
<列出关键= " class_weights " / >
< /操作符>
> < /过程
<过程扩展= " true " >
<列出关键= " application_parameters " / >
< /操作符>
< /操作符>
> < /过程
< /操作符>
< /操作符>
<列出关键= " application_parameters " / >
< /操作符>
< /操作符>
> < /过程
< /操作符>
> < /过程

我也分享了这个过程的图片。


    登录注册置评。