1. 要求
实现一个控制台程序,给定一段英文字符串,统计其中各个英文单词(4字符以上含4字符)的出现频率。 附加要求:读入一段文本文件,统计该文本文件中单词的频率。
2. 定义
- 字母: A-Z, a-z.
- 字母数字: A-Z, a-z, 0-9.
- 分隔符: 非字母数字
- 单词:
- 包含有4个或4个以上的字母
- 单词由分隔符分开
- 如果一个字符串包含_非_字母数字,则不是单词
- 单词大小写不敏感,例如 “file”、“FILE”和“File”可以看作同一个单词
- 单词必须是字母开头,“file123”是单词,“123file”不是单词
3. 目标
开发工具:visual studio 2013
开发语言:c++
源程序
#include<iostream> #include<fstream> #include<cstring> using namespace std; struct Num{ int num = 1; char *s = NULL; }; Num word[99]; int Judge(char b[])//判断单词 { bool j1 = (strlen(b) >= 4); bool j2 = (b[0] >= 'a' && b[0] <= 'z'); if (!(j1&&j2)) return -1; else for (int ns = 1; b[ns] != '