统计难题
Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131070/65535 K (Java/Others)
Total Submission(s): 16905 Accepted Submission(s): 7273
Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.
注意:本题只有一组测试数据,处理到文件结束.
注意:本题只有一组测试数据,处理到文件结束.
Output
对于每个提问,给出以该字符串为前缀的单词的数量.
Sample Input
banana
band
bee
absolute
acm
ba
b
band
abc
Sample Output
2
3
1
0
Author
Ignatius.L
Recommend
字典树,经典题。
今早看了看资料,晚上就会做题了,真的不难,不明白自己为什么放了这么久才看。字典树还是很简单的。
我用了2种做法给大家参考,一种是用链表存储,一种是用数组存储。
思路:
字典树的经典应用,给你多个单词,构建字典树,然后给你一个字符串,求以这个字符串为前缀的单词的数量。
注意:
注意如何判断空行,我用了2种方法。
1、用strlen()计算字符串的长度,如果长度为0,说明为空行,退出输入循环。见代码一
2、用gets()读入。读入的回车符会自动转换为NULL。所以循环读入,每次检测读入进来的字符串的第一个字符是否为NULL即可。见代码二。
代码一(链表):
1 #include <iostream>
2 #include <string.h>
3 using namespace std;
4
5 struct Trie{ //字典树定义
6 Trie* next[26];
7 int num; //以当前字符串为前缀的单词的数量
8 Trie() //构造函数
9 {
10 int i;
11 for(i=0;i<26;i++){
12 next[i] = NULL;
13 }
14 num=0;
15 }
16 };
17 Trie root;
18 void Insert(char word[]) //将字符串word插入到字典树中
19 {
20 Trie *p = &root;
21 int i;
22 for(i=0;word[i];i++){ //遍历word的每一个字符
23 if(p->next[word[i]-'a']==NULL) //如果该字符没有对应的节点
24 p->next[word[i]-'a'] = new Trie; //创建一个
25 p = p->next[word[i]-'a'];
26 p->num++;
27 }
28 }
29 int Find(char word[]) //返回以字符串word为前缀的单词的数量
30 {
31 Trie *p = &root;
32 int i;
33 for(i=0;word[i];i++){ //在字典树找到该单词的结尾位置
34 if(p->next[word[i]-'a']==NULL)
35 return 0;
36 p = p->next[word[i]-'a'];
37 }
38 return p->num;
39 }
40
41 int main()
42 {
43 char word[11];
44 while(cin.getline(word,12)){ //输入单词
45 if(strlen(word)==0 || word[0]==' ') //如果读入字符串的长度为0或者是空格,说明读入的是空行
46 break;
47 Insert(word);
48 }
49 while(scanf("%s",word)!=EOF){
50 printf("%d
",Find(word)); //返回word为前缀的单词的数量
51 }
52 return 0;
53 }
代码二(数组):
1 #include <iostream>
2 #include <stdio.h>
3 using namespace std;
4
5 int trie[1000010][26]; //数组形式定义字典树,值存储的是下一个字符的位置
6 int num[1000010]={0}; //附加值,以某一字符串为前缀的单词的数量
7 int pos = 1;
8
9 void Insert(char word[]) //在字典树中插入某个单词
10 {
11 int i;
12 int c = 0;
13 for(i=0;word[i];i++){
14 int n = word[i]-'a';
15 if(trie[c][n]==0) //如果对应字符还没有值
16 trie[c][n] = pos++;
17 c = trie[c][n];
18 num[c]++;
19 }
20 }
21 int Find(char word[]) //返回以某个字符串为前缀的单词的数量
22 {
23 int i;
24 int c = 0;
25 for(i=0;word[i];i++){
26 int n = word[i]-'a';
27 if(trie[c][n]==0)
28 return 0;
29 c = trie[c][n];
30 }
31 return num[c];
32 }
33
34 int main()
35 {
36 char word[11];
37 while(gets(word)){
38 if(word[0]==NULL) //空行。gets读入的回车符会自动转换为NULL。
39 break;
40 Insert(word);
41 }
42 while(gets(word))
43 printf("%d
",Find(word));
44 return 0;
45 }
SUM:
以下是2种做法的效率对比:
第二行的是第一种做法,第一行的是第二种做法,很明显,数组做法不管是在时间,空间,代码量上都要优于链表做法。
但是数组的不太好理解,如何取舍看各位看官的意思吧。
Freecode : www.cnblogs.com/yym2013