[算法]相似字符串

这是微软编程之美比赛2013初试的一道题，题目如下：

描述

对于两个长度相等的字符串，我们定义其距离为对应位置不同的字符数量，同时我们认为距离越近的字符串越相似。例如，“0123”和“0000”的距离为 3，“0123”和“0213”的距离则为 2，所以与“0000”相比，“0213”和“0123”最相似。

现在给定两个字符串 S1 和 S2，其中 S2 的长度不大于 S1。请在 S1 中寻找一个与 S2 长度相同的子串，使得距离最小。

输入

输入包括多组数据。第一行是整数 T，表示有多少组测试数据。每组测试数据恰好占两行，第一行为字符串 S1，第二行为 S2。所有字符串都只包括“0”到“9”的字符。

输出

对于每组测试数据，单独输出一行“Case #c: d”。其中，c 表示测试数据的编号（从 1 开始），d 表示找到的子串的最小距离。

数据范围

1 ≤ T ≤ 100

小数据：字符串长度不超过 1000

大数据：字符串长度不超过 50000

样例输入

3
0123456789
321
010203040506070809
404
20121221
211

样例输出

Case #1: 2
Case #2: 1
Case #3: 1

这道题的蛮力法解还是比较容易想到的，蛮力算法是将s2与s1的每个长度与之相等的子字符串进行比较，时间负责度应该是O(len(s1)*len(s2))，但是明显它应该有更好的算法。

import java.util.Scanner;

public class SimStr {
    public static void main(String[] args){
        System.setIn(fis); 
        Scanner S=new Scanner(System.in);
        int T=S.nextInt();
        S.nextLine();
        for(int t=0;t<T;t++){
            System.out.print("Case #"+(t+1)+": ");
            String s1=S.nextLine();
            String s2=S.nextLine();
            int m=s1.length();
            int n=s2.length();
            char[] s1Chars=s1.toCharArray();
            char[] s2Chars=s2.toCharArray();
            int[][] nums=new int[10][1000];
            int[] ans=new int[1000];
            for(int i=0;i<m;i++){
                int dig=Integer.parseInt(String.valueOf(s1Chars[i]));
                nums[dig][0]++;
                nums[dig][nums[dig][0]]=i;
            }
            for(int i=0;i<n;i++){
                int dig=Integer.parseInt(String.valueOf(s2Chars[i]));
                for(int j=1;j<=nums[dig][0];j++){
                    if(nums[dig][j]-i>=0){
                        ans[nums[dig][j]-i]++;
                    }
                }
            }
            int max=0;
            for(int i=0;i<m;i++){
                if (ans[i]>max){
                    max=ans[i];
                }
            }
            System.out.println(n-max);
        }
        S.close();
    }

}

这种算法明显是比蛮力法好些的，应该还存在更快的方法。