字符串 S 由小写字母组成。我们要把这个字符串划分为尽可能多的片段,同一个字母只会出现在其中的一个片段。返回一个表示每个字符串片段的长度的列表。
示例 1:
输入:S = “ababcbacadefegdehijhklij” 输出:[9,7,8] 解释: 划分结果为 “ababcbaca”, “defegde”, “hijhklij”。 每个字母最多出现在一个片段中。 像 “ababcbacadefegde”, “hijhklij” 的划分是错误的,因为划分的片段数较少。
提示:
S的长度在[1, 500]之间。 S只包含小写字母 'a' 到 'z' 。来源:力扣
题目比较绕,不太容易理解。 要求把相同字母放在同一个片段内,以a为例,第一个a在字符串第一个位置,最后一个a在字符串第九个位置,那么1到9一定要为一个片段,否则a会分布在多个片段内,违背题意。 1到9组成的片段内又有其他字母(b和c),那么又要考虑最后一个b和最后一个c的位置。由题目中的示例,可以看出来,最后一个b和最后一个c都在字符串1~9内,因此1到9是一个包含相同字母的最短字符串(每个字符串越短,那么能够分出来的字符串就越多)。 加入字符串为ababcbacabefegdehijhklij,那么在对字符b做讨论的时候,最后一个b出现的位置是10,则需将第10个字符加入进去,接着再去讨论c的情况。 基于这个思路,可以用map来记录每个字母的最后出现位置,用start和end记录字符串片段的起始位置只讨论a的时候start和end分别为0和9,随着其他字符的加入,end应该随之改变,这里用end和新字符串的最大值来对end进行更新(如果新字符的最后出现位置大于end,那么end=新位置;否则,end不变)。 什么时候可以确定一个分段呢?当我们用来遍历的指针指向end的时候,说明所有出现的字符都被包含进去了,后面剩下的分段不再有已经出现的这些字符了(a b c),那么可以说我们找到了当前最短的一个片段,接着对剩下的片段进行讨论(start指向剩下片段的起点)。
