java并查集算法带你领略热血江湖

时间：2022-10-20 10:15:58|栏目：JAVA代码|点击：次

你好，我是小黄，一名独角兽企业的Java开发工程师。
校招收获数十个offer，年薪均20W~40W。
感谢茫茫人海中我们能够相遇，
俗话说：当你的才华和能力，不足以支撑你的梦想的时候，请静下心来学习，
希望优秀的你可以和我一起学习，一起努力，实现属于自己的梦想。

一、什么是并查集

并查集被很多OIer认为是最简洁而优雅的数据结构之一，主要用于处理一些不相交集合的合并问题，并支持两种操作：

合并（Union）：把两个不相交的集合合并为一个集合。
查询（Find）：查询两个元素是否在同一个集合中。

当然，这样的定义让人感觉摸不着头脑，我们来一个样例进行分析。

二、深入理解并查集

在遥远的江湖，有一群武侠人，他们各自为战，守护着自己该守护的东西。

1号：擅长刀、武力值98
2号：擅长剑、武力值95
3号：擅长棍、武力值93
4号：擅长枪、武力值90

突然有一天，一个不速之客（小黄）来到了这个江湖，想要称霸江湖，一场腥风血雨的战斗即将拉开序幕。

小黄：擅长机关枪、武力值100、宝物：并查集

江湖的局面被五人分割，如下图所示：

箭头的含义：自己的大哥（比如2号的箭头指向自己，那2号的大哥就是他自己）

在这里插入图片描述

小黄看到其余4人的资料后，使用宝物并查集查询了一下4号和其余几人的关系，发现4号是孤胆一人，决定从4号先入手。

在一个月黑风高的晚上，小黄拿着机关枪，使用宝物并查集的合并，把4号进行收服，成为其小弟。

1号、2号、3号听闻昨夜4号被收服，立刻举行会议商讨合作的事情，1号由于身高气傲，不想要与另外两人合作，2号、3号只好进行合作。

于是，江湖的局面又发生了变化。

在这里插入图片描述

小黄的野心可是称霸江湖，于是使用宝物并查集分别查询了1号、2号、3号的目前状态，得知：1号还是独胆一人，而2、3号已经结盟。

小黄又在一个夜黑风高的晚上与1号大战一夜，最终使用宝物并查集的合并，收服了1号。

至此，江湖只存在两个派系，2号派系、小黄派系。

2号察觉到了目前小黄的势力，主动摆宴，希望江湖不在打打杀杀，能够平安无事。

在宴上，由于2号派系的人数小于小黄派系的人数，于是，2号派系正式被小黄派系吞噬，江湖正式统一。

在这里插入图片描述

三、实现并查集

并查集的初始化：

class UnionAndFind() {
    // 自己的大哥是谁
    private int[] parent;
    // 自己的队伍有多少人
    private int[] size;
    // 江湖还有几个派系
    int sets;

    // 初始化
    // 每个人的大哥都是自己
    // 每个队伍的人数都为1
    public UnionAndFind(int N) {
        parent = new int[N];
        size = new int[N];
        help = new int[N];
        sets = N;
        for (int i = 0; i < N; i++) {
            parent[i] = i;
            size[i] = 1;
        }
    }
}

并查集的查询（Find）方法：这里的时间复杂度可以降低到O(1)级别，不敢相信吧，那就往下看吧。

	// 查询a和b在不在一个阵营中
	public boolean isSameSet(int a, int b) {
        return find(a) == find(b);
    }
	// 看一下你的最终大哥是谁
    public int find(int i){
        while(i != parent[i]){
            i = parent[i];
        }
        return i;
    }

并查集的合并（Union）方法：先去找到两个参数的最终大哥，小弟少的大哥跟着小弟多的大哥混

	public void union(int a, int b) {
        int A = find(a);
        int B = find(b);
        if (A != B) {
            if (size[A] >= size[B]) {
                size[A] += size[B];
                parent[B] = A;
            } else {
                size[B] += size[A];
                parent[A] = B;
            }
            sets--;
        }
    }

四、真题训练

547. 省份数量

初始化数组，拷贝上述并查集即可

public int findCircleNum(int[][] isConnected) {
        int N = isConnected.length;
        UnionAndFind unionFind = new UnionAndFind(N);
        for (int i = 0; i < N; i++) {
            for (int j = 0; j < N; j++) {
                if (isConnected[i][j] == 1 && i != j) {
                    unionFind.union(i, j);
                }
            }
        }
        return unionFind.sets;
    }

在这里插入图片描述

五、路径压缩优化

我们目前的并查集已经可以解决大部分问题，但是，我们能够对目前的并查集版本进行路径压缩优化。

我们可以发现，在我们 find() 方法时，我们会进行一个 while() 循环的查找大哥的操作，这种操作十分的浪费时间，有没有什么办法可以进行下优化呢？

如下所示：

在这里插入图片描述

我们可以看到对于6、5、3之类来说，每次进行 find 查询的时候，都需要经过2~3次的循环才能够找到1。

如果我们在进行查找的时候，保存一下值，然后重新挂到1的上面，比如：

我要查询下6，肯定会查询找5、3，这个时候，我们把6、5、3保存到临时数组中，在查询完毕后，将这些数组直接挂到1的下面，这样的话，下次查询会降低循环的次数。

在这里插入图片描述

当我们查询的次数远远大于我们的数据量时，这个时候 find() 的操作就已经变成了一个O(1)级别的查询时间。

public int find(int i) {
        int h = 0;
        while (i != parent[i]) {
            help[h++] = i;
            i = parent[i];
        }
        for (h--; h >= 0; h--) {
            parent[help[h]] = i;
        }
        return i;
    }