zoukankan      html  css  js  c++  java
  • Trie树的分析与实现

     字典树

           又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。(From baike)

    它有三个基本性质:

    (1)根节点不存储字符
    (2)除根节点外每一个节点都只存储一个字符
    (3)从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串,每个节点的所有子节点包含的字符都不相同。

    Java实现代码(注释详细):

      1 package com.wxisme.trietree;
      2 
      3 /**
      4  *Trie树的实现
      5  *@author wxisme
      6  *@time 2015-10-13 下午9:48:30
      7  */
      8 public class TrieTree {
      9     
     10     private final int SIZE = 26;//字符出现的种类数,以所有的小写字母为例
     11     
     12     private int nodeNumber;//子节点的个数
     13     
     14     private int depth;//树的深度
     15     
     16     private TrieNode root;//树根
     17     
     18     public TrieTree() {
     19         this.nodeNumber = 0;
     20         this.depth = 0;
     21         this.root = new TrieNode();
     22     }
     23     
     24     /**
     25      * 节点结构
     26      * @author wxisme
     27      *
     28      */
     29     private class TrieNode {
     30         private char val;//节点值
     31         
     32         private TrieNode son[];//子节点数组
     33         
     34         private boolean isEnd;//是否有以此节点为结束字符的单词
     35         
     36         private int pearNumber;//节点出现的次数
     37         
     38         public TrieNode() {
     39             this.isEnd = false;
     40             this.pearNumber = 0;
     41             this.son = new TrieNode[SIZE];
     42         }
     43     }
     44     
     45     /**
     46      * 向Trie中插入一个word
     47      * @param word
     48      */
     49     public void insert(String word) {
     50         char[] wordChars = word.toCharArray();
     51         
     52         TrieNode node = this.root;
     53         
     54         for(char ch : wordChars) {
     55             int pos = ch - 'a';
     56             //如果相应位置为空则创建
     57             if(node.son[pos] == null) {
     58                 node.son[pos] = new TrieNode();
     59                 node.son[pos].val = ch;
     60                 node.pearNumber = 1;//第一次出现
     61                 this.nodeNumber ++;
     62             }
     63             else {//已经有该字符
     64                 node.pearNumber ++;
     65             }
     66             node = node.son[pos];
     67         }
     68         node.isEnd = true;
     69         this.depth = Math.max(this.depth, word.length());
     70     }
     71     
     72     /**
     73      * 查找是否存在单词word
     74      * @param word
     75      * @return 结果
     76      */
     77     public boolean search(String word) {
     78         char[] wordChars = word.toCharArray();
     79         
     80         TrieNode node = this.root;
     81         
     82         for(char ch : wordChars) {
     83             int pos = ch - 'a';
     84             if(node.son[pos] != null) {
     85                 node = node.son[pos];//继续向下查找
     86             }
     87             else {
     88                 return false;
     89             }
     90         }
     91         
     92         return node.isEnd;
     93     }
     94     
     95     /**
     96      * 查找是否存在以word为前缀的单词,和search()类似,只是不用判断边界。
     97      * @param word
     98      * @return 结果
     99      */
    100     public boolean searchPrefix(String word) {
    101         char[] wordChars = word.toCharArray();
    102         
    103         TrieNode node = this.root;
    104         
    105         for(char ch : wordChars) {
    106             int pos = ch - 'a';
    107             if(node.son[pos] != null) {
    108                 node = node.son[pos];//继续向下查找
    109             }
    110             else {
    111                 return false;
    112             }
    113         }
    114         
    115         return true;
    116     }
    117     
    118     /**
    119      * 统计单词出现的次数
    120      * @param word
    121      * @return 结果
    122      */
    123     public int wordCount(String word) {
    124         char[] wordChars = word.toCharArray();
    125         
    126         TrieNode node = this.root;
    127         
    128         for(char ch : wordChars) {
    129             int pos = ch - 'a';
    130             if(node.son[pos] == null) {
    131                 return 0;
    132             }
    133             else {
    134                 node = node.son[pos];
    135             }
    136         }
    137         
    138         return node.isEnd?node.pearNumber:0;
    139     }
    140 
    141     
    142     /**
    143      * 统计以word为前缀的单词个数
    144      * @param word
    145      * @return 结果
    146      */
    147     public int wordPrefixCount(String word) {
    148         char[] wordChars = word.toCharArray();
    149         
    150         TrieNode node = this.root;
    151         
    152         for(char ch : wordChars) {
    153             int pos = ch - 'a';
    154             if(node.son[pos] == null) {
    155                 return 0;
    156             }
    157             else {
    158                 node = node.son[pos];
    159             }
    160         }
    161         
    162         return node.pearNumber;
    163     }
    164     
    165     /**
    166      * 深度优先遍历Trie树
    167      * @param root
    168      */
    169     public void traversal(TrieNode root) {
    170         if(root == null) {
    171             return;
    172         }
    173         for(TrieNode node : root.son) {
    174             System.out.println(node.val);
    175             traversal(node);
    176         }
    177     }
    178 
    179     public int getNodeNumber() {
    180         return nodeNumber;
    181     }
    182 
    183     public int getDepth() {
    184         return depth;
    185     }
    186 
    187     public TrieNode getRoot() {
    188         return root;
    189     }
    190     
    191 }

     Leetcode应用:http://www.cnblogs.com/wxisme/p/4875309.html    http://www.cnblogs.com/wxisme/p/4876980.html

  • 相关阅读:
    【性能诊断】十一、性能问题综合分析(案例2,windbg、wireshark)
    SQL Server常用的性能诊断语句
    Oracle常用的性能诊断语句
    【性能诊断】五、并发场景的性能分析(windbg简介及dump抓取)
    数据库管理与开发工具推荐---DBeaver
    DM达梦数据库---执行计划查看
    DM达梦数据库索引失效的处理---强制更新统计信息
    jProfiler、jMAT等工具注意设置启动的Xmx参数
    JVM启动参数建议
    Linux环境jcmd抓取进程信息及内存dump
  • 原文地址:https://www.cnblogs.com/wxisme/p/4876197.html
Copyright © 2011-2022 走看看