zoukankan      html  css  js  c++  java
  • 字典树(前缀树)

    什么是字典树?

    字典树我觉得更应该叫做前缀树,因为用它来求字符串的前缀非常方便。

    通过上面这个图,我们不难发现:

    1、字典树用边表示字母

    2、有相同前缀的单词公用前缀节点(正是因为这个缘故我们去寻找一个字符串的前缀非常的方便)

    3、整棵树的根节点是空的。

    4、每个单词结束的时候用一个特殊字符表示,图中用涂黑个黑圈圈所经过的边的所有字母表示一个单词。

    基本操作:

    一、插入

    假设我们要插入字符串”in”。我们一开始位于根,也就是0号节点,我们用P=0表示。我们先看P是不是有一条标识着i的连向子节点的边。没有这条边,于是我们就新建一个节点,也就是1号节点,然后把1号节点设置为P也就是0号节点的子节点,并且将边标识为i。最后我们移动到1号节点,也就是令P=1。

    这样我们就把”in”的i字符插入到Trie中了。然后我们再插入字符n,也是先找P也就是1号节点有没有标记为n的边。还是没有,于是再新建一个节点2,设置为P也就是1号节点的子节点,并且把边标识为n。最后再移动到P=2。这样我们就把n也插入了。由于n是”in”的最后一个字符,所以我们还需要将P=2这个节点标记为终结点。

    现在我们再插入字符串”inn”。过程也是一样的,从P=0开始找标识为i的边,这次找到1号节点。于是我们就不用创建新节点了,直接移动到1号节点,也就是令P=1。再插入字符n,也是有2号节点存在,所以移动到2号节点,P=2。最后再插入字符n这时P没有标识为n的边了,所以新建3号节点作为2号节点的子节点,边标识为n,同时将3号节点标记为终结点: 

     

    重复上述操作,我们就可以得到最开始的那个图了!

    二、查找

    既然插入已经知道了,那么我们现在就来看看查找吧

    查找其实比较简单。我们只要从根节点开始,沿着标识着S[1] -> S[2] -> S[3] … -> S[S.len]的边移动,如果最后成功到达一个终结点,就说明S在Trie树中;如果最后无路可走,或者到达一个不是终结点的节点,就说明S不在Trie树中。 

     如果是查找”te”,就会从0开始经过5最后到达6。但是6不是终结点,所以te没在Trie树中。如果查找的是”too”,就会从0开始经过5和9,然后发现之后无路可走:9号节点没有标记为o的边连出去。所以too也不在Trie中。

    代码实现:

    数组方式实现
    要写代码实现一个Trie首先就要确定如何存储一个Trie结构。这里用一个二维数组来存储:

    int trie[MAX_NODE][CHARSET];
    int k;
    其中MAX_NODE是trie中最大能存储的节点数目,CHARSET是字符集的大小,k是当前trie中包含有多少个节点。Trie[i][j]的值是0表示trie树中i号节点,并没有一条连出去的边,满足边上的字符标识是字符集中第j个字符(从0开始);trie[i][j]的值是正整数x表示trie树中i号节点,有一条连出去的边,满足边上的字符标识是字符集中第j个字符,并且这条边的终点是x号节点。



    具体代码:

     1 #include <stdio.h>
     2 #include <string.h>
     3 #include <string>
     4 #include <iostream>
     5 #include <stdlib.h>
     6 #include <algorithm>
     7 
     8 using namespace std;
     9 const int MAX_NODE = 300001;
    10 const int CHARSET = 26;
    11 
    12 int trie[MAX_NODE][CHARSET]={0};
    13 int color[MAX_NODE]={0};
    14 int k = 1;
    15 
    16 void insert(char *w)
    17 {
    18     int len = strlen(w);
    19     int p = 0;
    20     for (int i=0;i<len;i++)
    21     {
    22         int c = w[i]-'a';
    23         if (!trie[p][c])
    24         {
    25             trie[p][c] = k;
    26             k++;
    27         }
    28         p = trie[p][c];
    29     }
    30     color[p] = 1;
    31 }
    32 
    33 
    34 int search(char *s)
    35 {
    36     int len = strlen(s);
    37     int p = 0;
    38     for (int i=0;i<len;i++)
    39     {
    40         int c = s[i]-'a';
    41         if (!trie[p][c])
    42             return 0;
    43         p = trie[p][c];
    44     }
    45     return color[p] == 1; //是不是其中的一个
    46 }
    47 
    48 
    49 int main()
    50 {
    51 #ifndef ONLINE_JUDGE
    52     freopen("../in.txt","r",stdin);
    53 #endif
    54     int t,q;
    55     char s[20];
    56     scanf("%d%d", &t,&q);
    57     while(t--){
    58         scanf("%s", s);
    59         insert(s);
    60     }
    61     while(q--){
    62         scanf("%s", s);
    63         if(search(s)) printf("YES
    ");
    64         else printf("NO
    ");
    65     }
    66     return 0;
    67 }

    参考博客:https://blog.csdn.net/weixin_39778570/article/details/81990417

           https://www.cnblogs.com/TheRoadToTheGold/p/6290732.html

  • 相关阅读:
    Java vs Python
    Compiled Language vs Scripting Language
    445. Add Two Numbers II
    213. House Robber II
    198. House Robber
    276. Paint Fence
    77. Combinations
    54. Spiral Matrix
    82. Remove Duplicates from Sorted List II
    80. Remove Duplicates from Sorted Array II
  • 原文地址:https://www.cnblogs.com/-Ackerman/p/11209724.html
Copyright © 2011-2022 走看看