HihoCoder-Trie树

zoukankan html css js c++ java

HihoCoder-Trie树
首先关于Trie树的知识在另一篇文章中有介绍

题目描述：

小Hi和小Ho是一对好朋友，出生在信息化社会的他们对编程产生了莫大的兴趣，他们约定好互相帮助，在编程的学习道路上一同前进。

这一天，他们遇到了一本词典，于是小Hi就向小Ho提出了那个经典的问题：“小Ho，你能不能对于每一个我给出的字符串，都在这个词典里面找到以这个字符串开头的所有单词呢?”

身经百战的小Ho答道：“怎么会不能呢!你每给我一个字符串，我就依次遍历词典里的所有单词，检查你给我的字符串是不是这个单词的前缀不就是了?”

小Hi笑道：“你啊，还是太年轻了!~假设这本词典里有10万个单词，我询问你一万次，你得要算到哪年哪月去?”

小Ho低头算了一算，看着那一堆堆的0，顿时感觉自己这辈子都要花在上面了...

小Hi看着小Ho的囧样，也是继续笑道：“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”

小Ho想了想，说道：“知道~它是一种基础的数据结构，就像这里说的一样!”

小Hi满意的点了点头，说道：“那你知道我怎么样用一棵树来表示整个词典么?”

小Ho摇摇头表示自己不清楚。

提示一：Trie树的建立

“你看，我们现在得到了这样一棵树，那么你看，如果我给你一个字符串ap，你要怎么找到所有以ap开头的单词呢?”小Hi又开始考验小Ho。

“唔...一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。

“笨!这棵树难道就白构建了!”小Hi教训完小Ho，继续道：“看好了!”

提示二：如何使用Trie树

提示三：在建立Trie树时同时进行统计!

“那么现在!赶紧去用代码实现吧!”小Hi如是说道

题目输入：

输入的第一行为一个正整数n，表示词典的大小，其后n行，每一行一个单词(不保证是英文单词，也有可能是火星文单词哦)，单词由不超过10个的小写英文字母组成，可能存在相同的单词，此时应将其视作不同的单词。接下来的一行为一个正整数m，表示小Hi询问的次数，其后m行，每一行一个字符串，该字符串由不超过10个的小写英文字母组成，表示小Hi的一个询问。
- 在20%的数据中n, m<=10，词典的字母表大小<=2.
- 在60%的数据中n, m<=1000，词典的字母表大小<=5.
- 在100%的数据中n, m<=100000，词典的字母表大小<=26.
本题按通过的数据量排名哦～

题目输出：

对于小Hi的每一个询问，输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。

样例输入
```
5  
babaab  
babbbaaaa  
abba  
aaaaabaa  
babaababb  
5  
babb  
baabaaa  
bab  
bb  
bbabbaab 
```
样例输出
```
1  0  3  0  0 
```
C++实现代码
```
#include<iostream>    
#include<string.h>    
using namespace std;    
    
struct TrieNode{    
    int num;    
    TrieNode *child[26];//下个字符的26个字母可能性    
    TrieNode()    
    {    
        num=0;    
        memset(child,NULL,sizeof(child));    
    }    
};    
    
TrieNode* root;    
int temp;    
    
//将字符串word添加到字典树中     
void insert(string word)    
{    
    if(word.empty()) return;    
    
    TrieNode* p=root;    
    for(int i=0;i<word.size();++i)    
    {    
        temp=word[i]-'a';    
        if(p->child[temp]==NULL)    
        {    
            p->child[temp]=new TrieNode;//若节点不存在，则建立一个新节点    
        }    
        p=p->child[temp];    
        p->num++;    
    }    
}    
    
//返回所有以字符串pre为前缀的单词数量    
int prefixNumber(string pre)    
{    
    if(pre.empty()) return 0;    
     
    TrieNode* p=root;    
    for(int i=0;i<pre.length();++i)    
    {    
        temp=pre[i]-'a';    
        if(p->child[temp]==NULL)      
            return 0;    
        p=p->child[temp];    
    }    
    return p->num;    
}    
    
int main()    
{    
    int n,m;    
    string words,pre;    
    root=new TrieNode;    
    while(cin>>n)    
    {    
        while(n--)//数据输入
        {    
            cin>>words;    
            insert(words);    
        }    
        cin>>m;//查询数据
        while(m--)    
        {    
            cin>>pre;    
            int res=prefixNumber(pre);    
            cout<<res<<endl;    
        }    
    }    
    return 0;    
}   
```
字典树的典型应用：

1.统计一组字符串中某前缀出现的次数（直接用上面的代码就行）。

2.判断一组字符串中是否有一个字符串是另一个字符串的前缀。

分析：我们只要在结点中添加一个nEndFlag成员变量即可。若nEndFlag == 1，说明该结点字符是某一字符串的结尾(假设为A)，若在插入B字符串的过程中经过这一结点，则说明A是B的前缀；还有一种情况，当要插入最后一个字符c时，却发现p->next[c-'a']为真，则说明该字符串是一个前缀字符串，eg:先插入abcde,再插入abc这种情况。
1. 串排序：给定N个互不相同的仅由一个单词构成的英文名，让你将他们按字典序从小到大输出
　　用字典树进行排序，采用数组的方式创建字典树，这棵树的每个结点的所有儿子很显然地按照其字母大小排序。对这棵树进行先序遍历即可。
查看全文

相关阅读:
python pandas groupby
ORC 资料Mark
python split() 用法
 Hive 中的变量
 特征选择方法
 Introduction to SIFT (Scale-Invariant Feature Transform)
SIFT 、Hog 、LBP 了解
 python None 和 NaN
判断特征中是否含有空值、空值填充
 vue 子组件引用

原文地址：https://www.cnblogs.com/RioTian/p/12686808.html

首先关于Trie树的知识在另一篇文章中有介绍