字符串 (S) 由小写字母组成。我们要把这个字符串划分为尽可能多的片段,同一个字母只会出现在其中的一个片段。返回一个表示每个字符串片段的长度的列表。
输入:S = "ababcbacadefegdehijhklij"
输出:[9,7,8]
解释:
划分结果为 "ababcbaca", "defegde", "hijhklij"。
每个字母最多出现在一个片段中。
像 "ababcbacadefegde", "hijhklij" 的划分是错误的,因为划分的片段数较少。
思路
这道题目是典型的贪心策略,关于贪心一直做的不是很多,思路也不是特别清晰,但是总觉得很神奇。
具体做法如下:
- 从左到右遍历字符串,遍历的同时维护当前片段的开始下标 (start) 和结束下标 (end),初始时 (start=end=0)
- 对于每个访问到的字母 (c),得到当前字母的最后一次出现的下标位置 (end_c) ,则当前片段的结束下标一定不会小于 (end_c) ,因此令 (end=max(end,end_c))
- 当访问到下标 (end) 时,当前片段访问结束,当前片段的下标范围是 ([start,end]),长度为(end−start+1),将当前片段的长度添加到返回值,然后令 (start=end+1),继续寻找下一个片段。
- 重复上述过程,直到遍历完字符串
上述做法使用贪心的思想寻找每个片段可能的最小结束下标,因此可以保证每个片段的长度一定是符合要求的最短长度,如果取更短的片段,则一定会出现同一个字母出现在多个片段中的情况。由于每次取的片段都是符合要求的最短的片段,因此得到的片段数也是最多的
class Solution {
public:
vector<int> partitionLabels(string S) {
// greedy
int pos[26];
int n = S.size();
for(int i = 0; i < n ; i++){
pos[S[i] - 'a'] = i;
}
int start = 0; int end = 0;
vector<int> partition;
for(int i = 0; i < n ; i++){
end = max(pos[S[i] - 'a'], end);
if (end == i){
partition.push_back(end - start + 1);
start = end + 1;
}
}
return partition;
}
};