一、什么是gensim
gensim是一个python的科学库,gensim包含了TF-IDF、随机投影、word2vec和document2vec算法的实现,分层Dirchlet过程(HDP),潜在语义分析(LSA)和潜在Dirichlet分配(LDA),包括分布式并行版本。主要是用来主题建模、文档索引以及使用大规模语料数据的相似性检索,被作者称为“根据纯文本进行监督性建模最健壮、最有效的、最让人放心的软件”。
二、gensim安装的注意事项
gensim可以安装在Windows、Linux和Mac OS以及其他的平台,但是它需要依赖python和numpy以及scipy,如下图
至于numpy和scipy的安装我们可以直接安装一个anaconda就可以了,它也是python的一个科学计算库,它包含了python常用的科学计算库。
三、安装步骤
1、在安装anaconda之后,找到anaconda的安装路径,将anaconda下的scripts目录添加到,计算机-->属性-->高级系统设置-->高级-->环境变量-->系统变量-->找到path变量,将C:Users15053Anaconda3Scripts添加到path中,这个目录是我安装anaconda的目录,根据自己电脑的安装目录进行配置。
2、windows+r-->输入cmd-->输入python,如果出现如下图的提示说明配置成功了
3、找到anaconda的安装目录,在箭头指示的栏中输入cmd,然后打开命令提示符界面之后,输入pip install gensim安装gensim
4、输入命令可以安装gensim,发现出现异常,原因为pip版本不正常,按照提示升级
5、重新安装gensim
6、验证gensim是否安装成功,打开cmd输入python之后,然后在输入import gensim,出现下图一样,就表示安装成功了
特别提醒:如果,安装完成之后发现import gensim没有问题,但是使用from gensim import word2vec时报错时,这里有点疑问。安装成功的标志是你可以在代码里做下面的import而不出错:from gensim.models import word2vec