zoukankan      html  css  js  c++  java
  • 动态规划之LeetCode第72题(编辑距离)

      首先先学习一个经典的算法吧,就是和本题一模一样的“编辑距离算法”。编辑距离,Minimum Edit Distance,简称MED,是俄罗斯科学家 Vladimir Levenshtein 在1965年提出,也因此而得名 Levenshtein Distance。用来度量两个序列相似程度的指标。通俗地来讲,编辑距离指的是在两个单词<w1,w2>之间,由其中一个单词w1转换为另一个单词w2所需要的最少单字符编辑操作次数。其中,单字符编辑操作有且仅有三种:

      1.插入

      2.删除

      3.替换

      关于这个算法,还有一个比较正规的数学形式定义:

      我们将两个字符串a,b的 Levenshtein Distance 表示为 leva,b(|a|,|b|),其中|a|和 |b|分别对应a,b 的长度。那么,在这里两个字符串 a,b的 Levenshtein Distance,

    即leva,b(|a|,|b|)可用如下的数学语言描述:

      

    • 定义 lev_{a,b}(i, j) 指的是 ai 个字符bj 个字符之间的距离。为了方便理解,这里的i,j可以看作是a,b的长度。这里的字符串的第一个字符 index 从 1 开始(实际因为在表上运算的时候字符串前需要补 0),因此最后的编辑距离便是 i = |a|, j = |b| 时的距离: lev_{a,b}(|a|, |b|)
    • min(i, j) = 0 的时候,对应着字符串ai 个字符和 字符串bj 个字符,此时的 i,j 有一个值为 0 ,表示字符串 a 和 b 中有一个为空串,那么从 a 转换到 b 只需要进行max(i, j)次单字符编辑操作即可,所以它们之间的编辑距离为 max(i, j),即 i, j 中的最大者。
    • 当 min(i, j) 
e 0 的时候,lev_{a,b}(|a|, |b|) 为如下三种情况的最小值:
      1.lev_{a,b}(i-1, j) + 1 表示 删除 a_i
      2.lev_{a,b}(i, j-1) + 1 表示 插入 b_j
      3.lev_{a,b}(i-1, j-1)+1_{(a_i 
e b_j)} 表示 替换 b_j
    • 1_{(a_i 
e b_j)} 为一个指示函数,表示当 a_i = b_j 的时候取 0 ;当 a_i 
e b_j 的时候,其值为 1。

    题目:给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。你可以对一个单词进行如下三种操作:

      1.插入一个字符
      2.删除一个字符
      3.替换一个字符

    分析:根据上面的“编辑距离算法”我们自然而然的就会想到使用动态规划来解决这个题目,

      1.定义一个数组二维dp,dp[i][j]表示字符串word1中前i个字符和word2中前j个字符之间的距离,此处的i、j可以看作word1和word2的这两个字符串的长度;

      2.根据上面的算法,我们可以得出dp的元素之间的关系式,即:

        if min(i,j) ==0, 那么 dp[i][j] = max(i,j);

        if min(i,j) != 0,那么

            if word1[i] == word2[j],那么dp[i][j] = min(dp[i-1][j]+1,dp[i][j-1]+1,dp[i-1][j-1])

            if word1[i] != word2[j],那么dp[i][j] = min(dp[i-1][j]+1,dp[i][j-1]+1,dp[i-1][j-1]+1)

    最终,dp[|word1|][|word|2]即为所求的最小值。

        public int minDistance(String word1, String word2) {
            if (Math.min(word1.length(),word2.length())==0)
                return Math.max(word1.length(),word2.length());
            int m = word1.length();
            int n = word2.length();
            int[][] dp = new int[m+1][n+1];
            for (int i = 1; i <= m; i++) {
                dp[i][0] = i;
            }
            for (int j = 1; j <= n; j++) {
                dp[0][j] = j;
            }
            for (int i = 1; i <= m; i++) {
                for (int j = 1;j <= n;j ++){
                    if (word1.charAt(i-1) == word2.charAt(j-1)){
                        dp[i][j] = Math.min(Math.min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i-1][j-1]);
                    }else {
                        dp[i][j] = Math.min(Math.min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i-1][j-1]+1);
                    }
                }
            }
            return dp[m][n];
        }

    题目来源:力扣(LeetCode)
    链接:https://leetcode-cn.com/problems/edit-distance

    编译距离算法参考自:
    链接:https://www.jianshu.com/p/a617d20162cf

  • 相关阅读:
    在webBrowser中取Cookie的方法
    C#遍历DataSet中数据的几种方法总结
    php数组排序函数
    linux top命令详解
    HTTPSQS(HTTP Simple Queue Service)消息队列
    mysql 触发器(trigger) 总结
    HDU4292 Food —— 最大流 + 拆点
    POJ1459 Power Network —— 最大流
    POJ2516 Minimum Cost —— 最小费用最大流
    HDU4280 Island Transport —— 最大流 ISAP算法
  • 原文地址:https://www.cnblogs.com/yxym2016/p/12622726.html
Copyright © 2011-2022 走看看