如果我们交换字符串 X
中的两个不同位置的字母,使得它和字符串 Y
相等,那么称 X
和 Y
两个字符串相似。如果这两个字符串本身是相等的,那它们也是相似的。
例如,"tars"
和 "rats"
是相似的 (交换 0
与 2
的位置); "rats"
和 "arts"
也是相似的,但是 "star"
不与 "tars"
,"rats"
,或 "arts"
相似。
总之,它们通过相似性形成了两个关联组:{"tars", "rats", "arts"}
和 {"star"}
。注意,"tars"
和 "arts"
是在同一组中,即使它们并不相似。形式上,对每个组而言,要确定一个单词在组中,只需要这个词和该组中至少一个单词相似。
我们给出了一个不包含重复的字符串列表 A
。列表中的每个字符串都是 A
中其它所有字符串的一个字母异位词。请问 A
中有多少个相似字符串组?
示例:
输入:["tars","rats","arts","star"]
输出:2
提示:
A.length <= 2000
A[i].length <= 1000
A.length * A[i].length <= 20000
A
中的所有单词都只包含小写字母。A
中的所有单词都具有相同的长度,且是彼此的字母异位词。- 此问题的判断限制时间已经延长。
备注:
字母异位词[anagram],一种把某个字符串的字母的位置(顺序)加以改换所形成的新词。
大意:
我们判断是否相似,如果相似的话,就把他放到并查集里面,并查集对于检索分组情况相对比较快
每次放到并查集里面,肯定是有一个相似的,既然有一个相似的,总组数一定-1(初始的总组数为数组的大小)
class Solution { //并查集 private int[] parent; //分的组数 private int groupNum; public int numSimilarGroups(String[] A) { int n = A.length; groupNum=n; parent = new int[n]; //并查集第一步,给每一个数组都附上初始值,到时候只需要对比parent[i]==i即可了解是不是存在一个组 for (int i = 0; i < n; i++) { parent[i] = i; } // 预处理输入 int len = A[0].length(); char[][] chars = new char[n][len]; //这里用char[][]是因为String相对来说会比较慢 for (int i = 0; i < n; i++) { chars[i] = A[i].toCharArray(); } // 枚举每一对单词,检查是否相似,若相似则合并 for (int i = 0; i < n - 1; i++) { for (int j = i + 1; j < n; j++) { if (similar(chars[i], chars[j])) { //其实这里有一个小细节,这里是i永远小于j(并查集的关键) union(i, j); } } } return groupNum; } // 用来判断一对单词是否相似 private boolean similar(char[] w1, char[] w2) { int diff = 0; int n = w1.length; for (int i = 0; i < n; i++) { //只要不相等得数量大于两个就说明不相似 if (w1[i] != w2[i] && ++diff > 2) { return false; } } return true; } //查找子集 private int find(int node) { return parent[node] == node ? node : (parent[node] = find(parent[node])); } //并查集查找 //node1<<node2 private void union(int node1, int node2) { int root1 = find(node1); int root2 = find(node2); if (root1 == root2) { return; } //root1是相对root2来说比较小的(如果不理解,就自己调试看一下) parent[root1] = root2; //每当并查集连接一个组,总组数量-1 this.groupNum--; } }