Frequent Distribution sorted by frequency

 1 import nltk
 2 
 3 def freq_sorted(text,ranklimit):
 4     fd=nltk.FreqDist(text)
 5     cumulative = 0.0
 6     for rank, (word,freq) in enumerate(sorted(fd.items(), key=lambda x: (-1*x[1], x[0]))[:ranklimit]):
 7         cumulative += fd[word] * 100 / fd.N()
 8         print "%3d %6.2f%% %s" % (rank+1, cumulative, word)
 9 
10 def test_freq_sorted():
11     freq_sorted(nltk.corpus.brown.words(),15)

结果为：

  1   5.00% the
  2  10.00% ,
  3  14.00% .
  4  17.00% of
  5  19.00% and
  6  21.00% to
  7  22.00% a
  8  23.00% in
  9  23.00% that
 10  23.00% is
 11  23.00% was
 12  23.00% for
 13  23.00% ``
 14  23.00% ''
 15  23.00% The

查看全文

相关阅读:
博客园 Open Live Writer 博客编辑工具&代码高亮显示插件安装使用说明
 测试高亮代码
 Linux 查看操作系统版本信息 uname
Linux 查看登录用户信息 who & whoami
Linux crontab 每5秒钟执行一次 shell 脚本的方法
 Linux 查找特定程序 whereis
Java 语言实现 MD5 加密
 Maven 官网查找&下载 jar包& pom引用完美方案
 ArcGIS Engine 10.x许可代码
 IIS 无法显示网页目前访问网站的用户过多

原文地址：https://www.cnblogs.com/gui0901/p/4450285.html