Python面试宝典第26题:最长公共子序列

avatar
作者
猴君
阅读量:0

题目

        一个字符串的子序列是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。比如:"ace" 是 "abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。两个字符串的公共子序列是这两个字符串所共同拥有的子序列。

        现给定两个字符串 text1 和 text2,返回这两个字符串的最长公共子序列的长度。如果不存在公共子序列 ,返回0。

          备注:text1 和 text2 仅由小写英文字符组成。

          示例 1:

输入:text1 = "abcde", text2 = "ace"  输出:3   解释:最长公共子序列是"ace" ,它的长度为3。

        示例 2:

输入:text1 = "abc", text2 = "abc" 输出:3 解释:最长公共子序列是"abc",它的长度为3。

        示例 3:

输入:text1 = "abc", text2 = "def" 输出:0 解释:两个字符串没有公共子序列,返回0。

递归法

        最长公共子序列,英文全称为Longest Common Subsequence,一般缩写为LCS。

        递归法求解LCS的基本思想是:将大问题分解为小问题,通过比较两个字符串的末尾字符是否相等,来决定如何递归地解决问题。如果两个字符串的末尾字符相等,那么这个字符必定属于LCS的一部分。如果不相等,就需要分别去掉一个字符串的末尾字符,递归地求解子问题。使用递归法求解本题的主要步骤如下。

        1、如果任意一个字符串为空,那么最长公共子序列的长度为0。

        2、如果 text1 的最后一个字符和 text2 的最后一个字符相同,那么我们递归地求解 text1[:-1] 和 text2[:-1] 的LCS长度,并在结果上加1。

        3、如果 text1 的最后一个字符和 text2 的最后一个字符不同,那么我们递归地求解 text1[:-1] 和 text2 的LCS长度,以及 text1 和 text2[:-1] 的LCS长度,取两者中较大的一个。

        根据上面的算法步骤,我们可以得出下面的示例代码。

def lcs_by_recursion(text1, text2):     def lcs_helper(t1, t2):         if not t1 or not t2:             return 0                  if t1[-1] == t2[-1]:             # 末尾字符相同             return lcs_helper(t1[:-1], t2[:-1]) + 1         else:              # 末尾字符不同             return max(lcs_helper(t1[:-1], t2), lcs_helper(t1, t2[:-1]))      return lcs_helper(text1, text2)  print(lcs_by_recursion("abcde", "ace")) print(lcs_by_recursion("abc", "abc")) print(lcs_by_recursion("abc", "def"))

动态规划法

        动态规划法通过构建一个二维数组来存储子问题的解,以避免重复计算。对于任意两个字符串的前缀,其最长公共子序列的长度取决于前一个字符是否相等:如果相等,则长度加1;如果不等,则取两者可能的最长公共子序列的最大值。使用动态规划法求解本题的主要步骤如下。

        1、初始化。定义一个二维数组 dp,大小为 (len(text1) + 1) x (len(text2) + 1)。初始状态下,dp[0][j] = 0,dp[i][0] = 0。这是因为,空字符串与任何字符串的最长公共子序列长度都为0。

        2、状态转移方程。遍历 text1 和 text2 的每个字符,对于 text1 中的第 i 个字符和 text2 中的第 j 个字符,进行以下操作。

        (1)如果 text1[i-1] 等于 text2[j-1],则 dp[i][j] = dp[i-1][j-1] + 1。

        (2)如果 text1[i-1] 不等于 text2[j-1],则 dp[i][j] = max(dp[i-1][j], dp[i][j-1])。

        3、边界条件。当任一字符串为空时,最长公共子序列长度为0,这已经在初始化时处理。

        4、获取结果。最终答案位于dp数组的右下角,即:dp[len(text1)][len(text2)]。

def lcs_by_dp(text1: str, text2: str) -> int:     m, n = len(text1), len(text2)     # 初始化DP表     dp = [[0] * (n + 1) for _ in range(m + 1)]          # 填充DP表     for i in range(1, m + 1):         for j in range(1, n + 1):             if text1[i - 1] == text2[j - 1]:                 dp[i][j] = dp[i - 1][j - 1] + 1             else:                 dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])          return dp[m][n]  print(lcs_by_dp("abcde", "ace")) print(lcs_by_dp("abc", "abc")) print(lcs_by_dp("abc", "def"))

总结

        虽然递归法直观且易于理解,但它存在严重的重复计算问题,导致时间复杂度为指数级,效率极低。因此,在实际应用中,递归法通常被动态规划法所替代。动态规划法可以避免重复计算,将时间复杂度降低至O(m*n),其中m和n分别是两个字符串的长度。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!