字典树(前缀树后缀树) - Cache One

用途

有人说是为了统计字频,可我觉得 HashMap 就可以完成。有人说比 HashMap 占用内存要小,但我感觉小也小不到哪里去。

有人说为了查询字符,还是那句话,HashSet 表示我也可以。

也许在 Hash 没有出来前,它也许在这些领域占有一席之地。目前,从数据结构来看,我认为它的作用也许在以下方面比较突出:

  • 也被称为 前缀树,就是剔除相同的前缀操作,这里看不懂很正常,后面慢慢说
  • 搜索提示,讲了下面结构你就理解了

结构

这就是字典树,我们沿着最左边走一遭,那就是 JOHNNY。

先来说下之前提到的第一个用途,前缀树。比如有两个字符串, JOHNNY 和 JOHN。可以发现两者拥有前缀,JOHN,这有什么作用呢?数据压缩的时候也许会用到,可以看这题。

820. 单词的压缩编码

接下来,说说第二个功能。比如你在搜索框中输入了 JO,那我根据字典树,我猜测你要找的也许是 JOHNNY 或者 JOE,然后我会给你提示。

定义数据结构

讲一个数据结构,主要就讲,如何去定义一个数据结构,然后涉及相关的操作,这里就是添加(搭建)、删除操作。

因为这也是一个树的结构,只不过这里不一定是二叉树,上面的图有点误导,我们如果要表示英文字符的话,那么从根节点出发,应该有26个字符可供选择。

class NodeTree{
    // 用数组编号代替字符,会减小搜索查询时间复杂度
    NodeTree[] charNode;
    // 记录下面子节点被使用个数,为了删除操作
    int count = 0;
    NodeTree(){
        charNode = new NodeTree[26];
    }
}

添加(构建)

添加和构建,本质是一样的,构建是通过一定数目的添加实现的。

    // 直接添加字符串
	public void addString(String s, NodeTree root){
        for(int i = 0; i < s.length(); i++){
            char c = s.charAt(i);
            if(root.charNode[c-'a']==null)
                root.charNode[c-'a'] = new NodeTree();
            root = root.charNode[c-'a'];
            root.count++;
        }
    }
	// 单个添加字符
    public NodeTree addChar(char c, NodeTree root){
        if(root.charNode[c-'a']==null)
            root.charNode[c-'a'] = new NodeTree();
        root.count++;
        return root.charNode[c-'a'];
    }

为了验证是否添加成功,写一个查找字符的函数

    public boolean findString(String s, NodeTree root){
        boolean flag = false;
        for(int i = 0; i < s.length(); i++){
            char c = s.charAt(i);
            if(root.charNode[c-'a']==null)
                return flag;
            root = root.charNode[c-'a'];
        }
        return !flag;
    }

小测试

public class TrimTree {
    public static void main(String[] args) {
        NodeTree root = new NodeTree();
        root.addString("test", root);
        System.out.println(root.findString("tes", root));
        System.out.println(root.findString("test", root));
        System.out.println(root.findString("tests", root));
    }
}
// 输出
true
true
false

上面这个测试,向字典树中写入,test,然后对test的前缀,tes进行查询,可以正常查询到。

为您推荐