FaceBook开源的词向量计算框架

　　fasttext是个好东西，是由facebook在2016年推出的一个训练词向量的模型。相比于之前Google的word2vec，fasttext可以解决out of vocabulary的问题。fasttext还能够用于有监督的文本分类。更赞的是，facebook提供了200多种语言的预训练模型和词向量。
　　具体操作可以使用pyfasttext模块实现。

　　代码如下：

1 from pyfasttext import FastText
2 # 加载出现的模型
3 model = FastText('./ch_data.bin')
4 #词表示学习
5 model.skipgram(input='data.txt', output='model', epoch=100, lr=0.7)
6 # model.cbow(input='data.txt', output='model', epoch=100, lr=0.7)
7 # 词向量
8 model['dog']

输出：

array('f', [-1.308749794960022, -1.8326224088668823, ...])

之后根据你的需要，将词向量用在什么地方由自己决定。

注意：pyfasttext,运行在linux和mac系统上
　　　fasttext,运行在windows上

查看全文

相关阅读:
201621123060《JAVA程序设计》第九周学习总结
 201621123060《JAVA程序设计》第八周学习总结
 网络1712--c语言第二次作业总结
 Linux笔记
 Python-Flask框架之"图书管理系统"项目，附详解源代码及页面效果截图
 CentOS7防火墙firewall
Linux文件处理三剑客（grep、sed、awk）
OpenStack、虚拟机以及和当前流行的k8s、Docker四者之间的关系
 反向代理与正向代理的区别
 本地虚拟机在NAT网络连接模式下如何设置才可以访问外网以及使用Xshell远程连接

原文地址：https://www.cnblogs.com/demo-deng/p/9882720.html