[关闭]
@yexiaoqi 2022-05-20T16:39:58.000000Z 字数 1362 阅读 529

HJ52. 计算字符串的编辑距离

刷题


题目:Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家 Levenshtein 提出的,故又叫 Levenshtein Distance 。
例如:
字符串A: abcdefg
字符串B: abcdef
通过增加或是删掉字符 ”g” 的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。

要求:给定任意两个字符串,写出一个算法计算它们的编辑距离。
数据范围:给定的字符串长度满足 1≤len(str)≤1000

输入描述:每组用例一共2行,为输入的两个字符串
输出描述:每组用例输出一行,代表字符串的距离

示例

输入:abcdefg
      abcdef
输出:1

链接https://www.nowcoder.com/practice/3959837097c7413a961a135d7104c314


由题目可知,是要求最少的编辑次数,求最少/最多一般考虑动态规划

  1. public class Main {
  2. /**
  3. * 当两个字符串都为空串,那么编辑距离为0;
  4. * 当其中一个字符串为空串时,编辑距离为另一个非空字符串的长度
  5. * 当两个字符串均非空(长度分别为 i 和 j),取一下三种情况的最小值
  6. * 1.长度分别为 i-1 和 j 的字符串的编辑距离已知,那么加 1 即可;
  7. * 2.长度分别为 i 和 j-1 的字符串的编辑距离已知,那么加 1 即可;
  8. * 3.长度分别为 i-1 和 j-1 的字符串编辑距离已知,需考虑两种情况:
  9. * 如果第 i 个字符和第 j 个字符不同,那么加 1 即可;
  10. * 如果不同,那么不需要加 1;
  11. */
  12. public static void main(String[] args) {
  13. Scanner in = new Scanner(System.in);
  14. while(in.hasNext()){
  15. String s1 = in.next();
  16. String s2 = in.next();
  17. //dp[i][j]:s1 字符串的前 i 个字符编辑成 s2 的前 j 个字符所需要的代价
  18. int[][] dp = new int[s1.length()+1][s2.length()+1];
  19. //当两个字符串都为空串时,编辑距离为0
  20. dp[0][0] = 0;
  21. //当其中一个字符串为空串时,编辑距离为另一个字符串的长度
  22. for (int i = 1; i < s1.length()+1; i++) {
  23. dp[i][0] = i;
  24. }
  25. for (int j = 1; j < s2.length()+1; j++) {
  26. dp[0][j] = j;
  27. }
  28. //当两个字符串都为非空时
  29. for (int i = 1; i < s1.length()+1; i++) {
  30. for (int j = 1; j < s2.length()+1; j++) {
  31. //当i和j对应的位置的字符相同,则不用增加代价
  32. if (s1.charAt(i-1) == s2.charAt(j-1)){
  33. dp[i][j] = dp[i-1][j-1];
  34. } else {
  35. dp[i][j] = Math.min(dp[i-1][j-1]+1, Math.min(dp[i-1][j]+1, dp[i][j-1]+1));
  36. }
  37. }
  38. }
  39. System.out.println(dp[s1.length()][s2.length()]);
  40. }
  41. }
  42. }
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注