词向量维度可以128或者300维
现在百度用的是300维的,比较好。
如果你有十万个词,然后300维向量,那么就是[100000,300],这里神经网络更新的是词向量。
有些词出现的次数比较多,有些词出现的比较少。当我们进行训练的时候,可以先进行筛选。比如前5万的正常构造,后边的设为unknow