zoukankan      html  css  js  c++  java
  • HihoCoder-Trie树

    首先关于Trie树的知识在另一篇文章中有介绍

    题目描述:

    小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

    这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?”

    身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?”

    小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”

    小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了...

    小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”

    小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”

    小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”

    小Ho摇摇头表示自己不清楚。

    提示一:Trie树的建立

    “你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考验小Ho。

    “唔...一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。

    “笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”

    提示二:如何使用Trie树

    提示三:在建立Trie树时同时进行统计!

    “那么现在!赶紧去用代码实现吧!”小Hi如是说道

    题目输入:

    输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。

    • 在20%的数据中n, m<=10,词典的字母表大小<=2.

    • 在60%的数据中n, m<=1000,词典的字母表大小<=5.

    • 在100%的数据中n, m<=100000,词典的字母表大小<=26.

    本题按通过的数据量排名哦~

    题目输出:

    对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。

    样例输入

    5  
    babaab  
    babbbaaaa  
    abba  
    aaaaabaa  
    babaababb  
    5  
    babb  
    baabaaa  
    bab  
    bb  
    bbabbaab 
    

    样例输出

    1  0  3  0  0 
    

    C++实现代码

    #include<iostream>    
    #include<string.h>    
    using namespace std;    
        
    struct TrieNode{    
        int num;    
        TrieNode *child[26];//下个字符的26个字母可能性    
        TrieNode()    
        {    
            num=0;    
            memset(child,NULL,sizeof(child));    
        }    
    };    
        
    TrieNode* root;    
    int temp;    
        
    //将字符串word添加到字典树中     
    void insert(string word)    
    {    
        if(word.empty()) return;    
        
        TrieNode* p=root;    
        for(int i=0;i<word.size();++i)    
        {    
            temp=word[i]-'a';    
            if(p->child[temp]==NULL)    
            {    
                p->child[temp]=new TrieNode;//若节点不存在,则建立一个新节点    
            }    
            p=p->child[temp];    
            p->num++;    
        }    
    }    
        
    //返回所有以字符串pre为前缀的单词数量    
    int prefixNumber(string pre)    
    {    
        if(pre.empty()) return 0;    
         
        TrieNode* p=root;    
        for(int i=0;i<pre.length();++i)    
        {    
            temp=pre[i]-'a';    
            if(p->child[temp]==NULL)      
                return 0;    
            p=p->child[temp];    
        }    
        return p->num;    
    }    
        
    int main()    
    {    
        int n,m;    
        string words,pre;    
        root=new TrieNode;    
        while(cin>>n)    
        {    
            while(n--)//数据输入
            {    
                cin>>words;    
                insert(words);    
            }    
            cin>>m;//查询数据
            while(m--)    
            {    
                cin>>pre;    
                int res=prefixNumber(pre);    
                cout<<res<<endl;    
            }    
        }    
        return 0;    
    }   
    

    字典树的典型应用:

    1.统计一组字符串中某前缀出现的次数(直接用上面的代码就行)。

    2.判断一组字符串中是否有一个字符串是另一个字符串的前缀。

    分析:我们只要在结点中添加一个nEndFlag成员变量即可。若nEndFlag == 1,说明该结点字符是某一字符串的结尾(假设为A),若在插入B字符串的过程中经过这一结点,则说明A是B的 前缀;还有一种情况,当要插入最后一个字符c时,却发现p->next[c-'a']为真,则说明该字符串是一个前缀字符串,eg:先插入abcde,再插入abc这种情况。

    1. 串排序:给定N个互不相同的仅由一个单词构成的英文名,让你将他们按字典序从小到大输出

      用字典树进行排序,采用数组的方式创建字典树,这棵树的每个结点的所有儿子很显然地按照其字母大小排序。对这棵树进行先序遍历即可。

  • 相关阅读:
    图的广度优先遍历,运用了数据结构,感觉非常好用,等会把深度优先遍历也用数据结构写一遍
    DFS之素数环问题
    图的深度优先遍历
    八皇后的详细解答,纯手打,求推荐!!!
    c++中priority_queue的用法
    c++中vector的用法
    #ifndef是什么意思????
    筛法求1000000以内素数个数---时间复杂度为o(n)
    C++中1/0和1/0.0的区别
    C++程序生成.exe文件,在文件夹中运行时闪现问题
  • 原文地址:https://www.cnblogs.com/RioTian/p/12686808.html
Copyright © 2011-2022 走看看