LeetCode每日一题2025-05-16
2901. 最长相邻不相等子序列 II M
给定一个字符串数组 words ,和一个数组 groups ,两个数组长度都是 n 。
两个长度相等字符串的 汉明距离 定义为对应位置字符 不同 的数目。
你需要从下标 [0, 1, ..., n - 1] 中选出一个 最长子序列 ,将这个子序列记作长度为 k 的 [i₀, i₁, ..., iₖ ₋ ₁] ,它需要满足以下条件:
- 相邻 下标对应的
groups值 不同。即,对于所有满足0 < j + 1 < k的j都有groups[iⱼ] != groups[iⱼ ₊ ₁]。 - 对于所有
0 < j + 1 < k的下标j,都满足words[iⱼ]和words[iⱼ ₊ ₁]的长度 相等 ,且两个字符串之间的 汉明距离 为1。
请你返回一个字符串数组,它是下标子序列 依次 对应 words 数组中的字符串连接形成的字符串数组。如果有多个答案,返回任意一个。
子序列 指的是从原数组中删掉一些(也可能一个也不删掉)元素,剩余元素不改变相对位置得到的新的数组。
注意:words 中的字符串长度可能 不相等 。
示例 1:
输入:words = [“bab”,“dab”,“cab”], groups = [1,2,2]
输出:[“bab”,“cab”]
解释:一个可行的子序列是 [0,2] 。
- groups[0] != groups[2]
- words[0].length == words[2].length 且它们之间的汉明距离为 1 。
所以一个可行的答案是 [words[0],words[2]] = [“bab”,“cab”] 。
另一个可行的子序列是 [0,1] 。- groups[0] != groups[1]
- words[0].length = words[1].length 且它们之间的汉明距离为 1 。
所以另一个可行的答案是 [words[0],words[1]] = [“bab”,“dab”] 。
符合题意的最长子序列的长度为 2 。
示例 2:
输入:words = [“a”,“b”,“c”,“d”], groups = [1,2,3,4]
输出:[“a”,“b”,“c”,“d”]
解释:我们选择子序列 [0,1,2,3] 。
它同时满足两个条件。
所以答案为 [words[0],words[1],words[2],words[3]] = [“a”,“b”,“c”,“d”] 。
它是所有下标子序列里最长且满足所有条件的。
所以它是唯一的答案。
提示:
1 <= n == words.length == groups.length <= 10001 <= words[i].length <= 101 <= groups[i] <= nwords中的字符串 互不相同 。words[i]只包含小写英文字母。
问题分析
- 从
words和groups两个数组中,找出一个满足条件的最长子序列,并返回对应的字符串数组。
- groups 值相邻不同:选中的下标对应的
groups值不能连续相同。 - words 相邻字符串的条件:
- 长度相等。
- 汉明距离为1(对应位置不同字符数为1)。
- 返回满足条件的最长子序列对应的字符串数组。如果有多个,返回任意一个。
算法思路
建图+最长路径
-
将每个位置 看作图中的一个节点;
-
如果对于 满足
groups[i] != groups[j]len(words[i]) == len(words[j])且二者汉明距离为 1
则在节点 之间创建一条有向边。
-
原问题即为在这一有向无环图(因为只允许 )中寻找一条最长路径,并返回该路径对应的单词序列。
动态规划实现
-
令
dp[j]表示以节点 结尾的最长可行子序列的长度,prev[j]记录前驱节点。 -
初始时所有
dp[j]=1(单独选它自己)。 -
对于每对 ,若存在一条合法边,则
1
2
3if dp[i] + 1 > dp[j]:
dp[j] = dp[i] + 1
prev[j] = i最终在所有
dp[j]中取最大值所在的 ,根据prev指针回溯即可得到完整子序列。
时间复杂度
-
构建边和状态转移均需遍历所有 对,总共 次判断;每次判断要比较长度并计算汉明距离,字符串长度最多 10,故总体 ,其中 。
-
空间复杂度 。
代码实现 1
1 | from typing import List |
思路与代码实现 2
我们还可以把问题抽象成「Word Ladder 最长路径」中的优化 DP,利用“模式”快速定位所有只差一个字符的候选,并在线性时间内完成状态转移。
模式哈希+双最优值
-
模式生成
对于每个单词
words[j](长度为 ),我们依次把它的第 位用通配符*替换,生成 个「模式」字符串:1
2words[j] = “cab”
patterns = [“*ab”, “c*b”, “ca*”]如果两个单词只在第 位不同,那么它们都会映射到同一个模式。
-
记录每个模式下的「两类最优状态」
- 对于每个模式 ,我们维护两条记录:
best1[p] = (dp值最大的那个 (dp, group))best2[p] = (次大 dp 的那个 (dp, group))
- 这样,当我们处理一个新单词
j时,只需要看它所有的 个模式,对于每个模式:- 如果
best1[p].group != groups[j],就可以用best1[p].dp做转移; - 否则就用
best2[p].dp做转移。
- 如果
- 对于每个模式 ,我们维护两条记录:
-
状态转移
1
2
3
4
5
6
7dp[j] = 1 + max(
for each pattern p of words[j]:
if best1[p].group ≠ groups[j]:
best1[p].dp
else:
best2[p].dp
, default=0)转移完成后,再用
(dp[j], groups[j])去更新best1[p]/best2[p]。 -
时间复杂度
- 每个单词生成和遍历 个模式:
- 每个模式更新和查询常数次操作:
- 整体:,比 在 达到几百时优势非常明显,其中 。
代码实现
1 | from collections import defaultdict |
