分解题目,决定用C语言编写:
1.打开任意英文文本文件;
2.识别每个单词;
3.计算出现频率最高的十个单词,并打印出来。
首先确定保存单词和它们出现的次数,记录单词种类数和单词总数的结构体:
识别单词时,分为四种情况:读出的字符是
1.单词开始的第一个字符
2.单词结尾
3.单词中间部分
4.非单词符号,如空格,’.‘,’,‘ ······一视同仁,过滤
typedef struct { char letter[SizeWord]; long amount; }Word; typedef struct { Word words[NumWords]; long type; long count; }WordStatistics;
从文件中读出字符并识别每个单词,记录单词数量:
wordlist->count=0; wordlist->type=0; start=0; \标志一个单词的开始 for(i=0;i<SizeWord;i++) w[i]='