统计难题
注意:本题仅仅有一组測试数据,处理到文件结束.
banana band bee absolute acm ba b band abc
2 3 1 0
这是第一次做字典树的题目。字典树百度百科:又称单词查找树,Trie树,是一种树形结构。是一种哈希树的变种。
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以常常被搜索引擎系统用于文本词频统计。它的长处是:利用字符串的公共前缀来降低查询时间,最大限度地降低无谓的字符串比較。查询效率比哈希表高。
学习了字典树之后,认为它非常明显的就是用空间来换时间。空间复杂度特别大,比方字典数单单存26个小写字母,那么每一个节点的孩子节点都有26个孩子节点,字典树中的每一层都保留着不同单词的同样字母。
为了好说明,如果,全部的单词仅仅包含a,b,c,d四个字母,那么树是这样建立的。
题目是要求统计出以某个字符串为前缀的单词数量,字典树入门题。
代码:
#include <iostream> #include <string.h> #include <stdio.h> #include <malloc.h> using namespace std; char str[12]; const int maxn=26;//孩子节点的最大个数,假设是仅仅有26个字母,就用26就能够了。struct Trie//树的结构体 { int cnt;//保存某个字母出现的次数 Trie *next[maxn];//每个节点相应着多少个孩子。假设仅仅有26个字母,就用26就能够了 }; Trie root; /*void init(Trie t) { for(int i=0;i<26;i++) t.next[i]=NULL; }*///不须要单独对根节点初始化 void CreateTrie(char *str) { int len=strlen(str); Trie *p=&root,*q; for(int i=0;i<len;i++) { int id=str[i]-'a'; if(p->next[id]==NULL)//第一次遇到 { q=(Trie*)malloc(sizeof(Trie)); q->cnt=1;//此处一開始写错,写成了q->cnt++; for(int i=0;i<maxn;i++) q->next[i]=NULL;//初始化非空节点的孩子节点 p->next[id]=q;//在树中填上 p=p->next[id];//此时的P是不为空的节点 } else { p->next[id]->cnt++;//不是第一次遇到,个数++ p=p->next[id]; } } } int find(char *str) { int len=strlen(str); Trie *p=&root; for(int i=0;i<len;i++) { int id=str[i]-'a'; p=p->next[id];//一直向下走。
if(p==NULL)//找不到该单词,一開始此处写错了,写成了p->next[id]==NULL return 0; } return p->cnt; } int main() { while(gets(str)&&str[0]!='