zoukankan html css js c++ java

NLTK的基本使用

NLTK词频统计（Frequency）

import nltk
tokens=[ 'my','dog','has','flea','problems','help','please',
         'maybe','not','take','him','to','dog','park','stupid',
         'my','dalmation','is','so','cute','I','love','him'  ]
#统计词频
freq = nltk.FreqDist(tokens)
 
#输出词和相应的频率
for key,val in freq.items():
    print (str(key) + ':' + str(val))
 
#可以把最常用的5个单词拿出来
standard_freq=freq.most_common(5)
print(standard_freq)

查看全文

相关阅读:
Celery 分布式任务队列入门
 异步通信----WebSocket
爬虫框架之scrapy
《JavaScript 高级程序设计》第一章：简介
 NodeJS学习：环境变量
 cmd 与 bash 基础命令入门
 H5开发中的故障
 认识 var、let、const
netsh & winsock & 对前端的影响
 scrollify

原文地址：https://www.cnblogs.com/yongyuandishen/p/14908731.html

Copyright © 2011-2022 走看看