72. 编辑距离
题目描述:
给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
插入一个字符
删除一个字符
替换一个字符
示例 1:
输入:word1 = "horse", word2 = "ros" 输出:3 解释: horse -> rorse (将 'h' 替换为 'r') rorse -> rose (删除 'r') rose -> ros (删除 'e')
示例 2:
输入:word1 = "intention", word2 = "execution" 输出:5 解释: intention -> inention (删除 't') inention -> enention (将 'i' 替换为 'e') enention -> exention (将 'n' 替换为 'x') exention -> exection (将 'n' 替换为 'c') exection -> execution (插入 'u')
思路:动态规划
dp[][]数组,dp[i][j]表示word1的前i个字符转换成word2的前j个字符需要的最少操作次数
如果word1[i] == wrod2[j], 那么dp[i][j] = dp[i-1][j-1],即不需要进行任何额外操作
如果word1[i] != word2[j], 那么需要进行替换、插入、删除操作来使得word1的前i个字符转换成word2的前j个字符
- 如果采用替换操作,说明word1的前(i-1)个字符已经完全和word2的前(j-1)个字符匹配,只需把word1[i]替换成word2[j]即可,所以是在原来dp[i-1][j-1]的基础上加一
- 如果采用插入操作,说明word1的前i个字符已经和word2的前j-1个字符匹配,需要在word1中插入一个word2[j]来使得word1的前i个字符转换成word2的前j个字符, 所以是在原来dp[i][j-1]的基础上加一,即加上一个插入操作
- 如果采用删除操作,说明word1的前(i-1)个字符已经和word2的前j个字符匹配,word1[i]是多余的,所以是在dp[i-1][j]的基础上加一,即加上一个删除操作
// word1的前i个字符等于word2的前j个字符,相当于是word1.charAt(i-1) == word2.charAt(j-1) dp[i][j] = dp[i - 1][j - 1]; // word1的前i个字符不等于word2的前j个字符,相当于是word1.charAt(i-1) == word2.charAt(j-1) dp[i][j] = Math.min(Math.min(dp[i - 1][j - 1], dp[i][j - 1]), dp[i - 1][j]) + 1;
边界初始化
dp[0][j] = j; // word1的前0个字符转换成word2的前j个字符,说明需要不断的往word1中插入字符,插入的操作数刚好等于i
dp[i][0] = i; // word1的前i个字符转换成word2的前0个字符,说明需要不断的从word1中删除字符,删除的操作数刚好等于i
1 class Solution { 2 public int minDistance(String word1, String word2) { 3 4 int len1 = word1.length(); 5 int len2 = word2.length(); 6 7 int[][] dp = new int[len1+1][len2+1]; 8 // 初始化边界 dp[i][0] = i, dp[0][j] = j 9 for(int i = 0; i <= len1; i++){ 10 dp[i][0] = i; 11 } 12 for(int j = 0; j <= len2; j++){ 13 dp[0][j] = j; 14 } 15 16 // 使用转态转移方程进行迭代 17 // 注意因为我们转态转移方程中前i个字符其实对应了字符串的第i-1个字符,因为字符串是从0开始计数的 18 for(int i = 1; i <= len1; i++){ 19 for(int j = 1; j <= len2; j++){ 20 if(word1.charAt(i-1) == word2.charAt(j-1)){ 21 dp[i][j] = dp[i - 1][j - 1]; 22 }else{ 23 dp[i][j] = Math.min(Math.min(dp[i - 1][j - 1], dp[i][j - 1]), dp[i - 1][j]) + 1; 24 } 25 } 26 } 27 return dp[len1][len2]; 28 } 29 }
leetcode 执行用时:7 ms > 46.75%, 内存消耗:38.4 MB > 99.32%
复杂度分析:
时间复杂度:两个for循环,循环次数分别为word1 的长度和 word2 的长度,所以时间复杂度为O(len1*len2)
空间复杂度:需要一个大小为len1*len2 的数组,所以空间复杂度也为 O(len1*len2)