3. 无重复字符的最长子串

题目

无重复字符的最长子串

解题方案

思路 1: 暴力解法, 双重循环遍历

简单粗暴些, 找一个最长子串, 那么我们用两个循环 ** 穷举所有子串 **, 然后再用一个函数判断该子串中有没有重复的字符。

public int lengthOfLongestSubstring(String s) {
    int n = s.length();
    int ans = 0; // 保存当前得到满足条件的子串的最大值
    for (int i = 0; i < n; i++)
        for (int j = i + 1; j <= n; j++) // 之所以 j<= n, 是因为我们子串是 [i, j), 左闭右开
            if (allUnique(s, i, j)) ans = Math.max(ans, j - i);  // 更新 ans
    return ans;
}

public boolean allUnique(String s, int start, int end) {
    Set<Character> set = new HashSet<>(); // 初始化 hash set
    for (int i = start; i < end; i++) { // 遍历每个字符
        Character ch = s.charAt(i);
        if (set.contains(ch)) return false;  // 判断字符在不在 set 中
        set.add(ch); // 不在的话将该字符添加到 set 里边
    }
    return true;
}

时间复杂度：两个循环, 加上判断子串满足不满足条件的函数中的循环, $O(n^3)$ 。

空间复杂度：使用了一个 set, 判断子串中有没有重复的字符。由于 set 中没有重复的字符, 所以最长就是整个字符集, 假设字符集的大小为 m, 那么 set 最长就是 m 。另一方面, 如果字符串的长度小于 m, 是 n 。那么 set 最长也就是 n 了。综上, 空间复杂度为 $O(min(m, n))$ 。

思路二：滑动窗口

遗憾的是上边的算法没有通过 leetCode, 时间复杂度太大, 造成了超时。我们怎么来优化一下呢？

上边的算法中, 我们假设当 i 取 0 的时候,

j 取 1, 判断字符串 str [0, 1) 中有没有重复的字符。

j 取 2, 判断字符串 str [0, 2) 中有没有重复的字符。

j 取 3, 判断字符串 str [0, 3) 中有没有重复的字符。

j 取 4, 判断字符串 str [0, 4) 中有没有重复的字符。

做了很多重复的工作, 因为如果 str [0, 3) 中没有重复的字符, 我们不需要再判断整个字符串 str [0, 4) 中有没有重复的字符, 而只需要判断 str [3] 在不在 str [0, 3) 中, 不在的话, 就表明 str [0, 4) 中没有重复的字符。

如果在的话, 那么 str [0, 5), str [0, 6), str [0, 7) 一定有重复的字符, 所以此时后边的 j 也不需要继续增加了。i++ 进入下次的循环就可以了。

此外, 我们的 j 也不需要取 i + 1, 而只需要从当前的 j 开始就可以了。

综上, 其实整个关于 j 的循环我们完全可以去掉了, 此时可以理解变成了一个「滑动窗口」。

整体就是橘色窗口在依次向右移动

判断一个字符在不在字符串中, 我们需要可以遍历整个字符串, 遍历需要的时间复杂度就是 $O(n)$ , 加上最外层的 i 的循环, 总体复杂度就是 $O(n^2)$ 。我们可以继续优化, 判断字符在不在一个字符串, 我们可以将已有的字符串存到 Hash 里, 这样的时间复杂度是 $O(1)$ , 总的时间复杂度就变成了 $O(n)$ 。

public class Solution {
    public int lengthOfLongestSubstring(String s) {
        int n = s.length();
        Set<Character> set = new HashSet<>();
        int ans = 0, i = 0, j = 0;
        while (i < n && j < n) {
            if (!set.contains(s.charAt(j))) {
                set.add(s.charAt(j++));
                ans = Math.max(ans, j - i);
            } else {
                set.remove(s.charAt(i++));
            }
        }
        return ans;
    }
}

时间复杂度：在最坏的情况下, while 循环中的语句会执行 2n 次, 例如 abcdefgg, 开始的时候 j 一直后移直到到达第二个 g 的时候固定不变, 然后 i 开始一直后移直到 n, 所以总共执行了 2n 次, 时间复杂度为 $O(n)$ 。

空间复杂度：和上边的类似, 需要一个 Hash 保存子串, 所以是 $O(min(m, n))$ 。

思路三：跳跃窗口

继续优化, 我们看上边的算法的一种情况。

特殊情况

当 j 指向的 c 存在于前边的子串 abcd 中, 此时 i 向前移到 b, 此时子串中仍然含有 c, 还得继续移动, 所以这里其实可以优化。我们可以一步到位, 直接移动到子串 c 的位置的下一位！

直接跳到重复字符的下一位

实现这样的话, 我们将 set 改为 map, 将字符存为 key, 将对应的下标存到 value 里就实现了。

public class Solution {
    public int lengthOfLongestSubstring(String s) {
        int n = s.length(), ans = 0;
        Map<Character, Integer> map = new HashMap<>();
        for (int j = 0, i = 0; j < n; j++) {
            if (map.containsKey(s.charAt(j))) {
                i = Math.max(map.get(s.charAt(j)), i);
            }
            ans = Math.max(ans, j - i + 1);
            map.put(s.charAt(j), j + 1); // 下标 + 1 代表 i 要移动的下个位置
        }
        return ans;
    }
}

与解法二相比

由于采取了 i 跳跃的形式, 所以 map 之前存的字符没有进行 remove, 所以 if 语句中进行了 Math.max(map.get(s.charAt(j)), i), 要确认得到的下标不是 i 前边的。

还有个不同之处是 j 每次循环都进行了自加 1, 因为 i 的跳跃已经保证了 str [i, j] 内没有重复的字符串, 所以 j 直接可以加 1 。而解法二中, 要保持 j 的位置不变, 因为不知道和 j 重复的字符在哪个位置。

最后个不同之处是, ans 在每次循环中都进行更新, 因为 ans 更新前 i 都进行了更新, 已经保证了当前的子串符合条件, 所以可以更新 ans 。而解法二中, 只有当当前的子串不包含当前的字符时, 才进行更新。

时间复杂度：我们将 2n 优化到了 n, 但最终还是和之前一样, $O(n)$ 。

空间复杂度：也是一样的, $O(min(m, n))$ 。

思路四：使用数组

和解法三思路一样, 区别的地方在于, 我们不用 Hash, 而是直接用数组, 字符的 ASCII 码值作为数组的下标, 数组存储该字符所在字符串的位置。适用于字符集比较小的情况, 因为我们会直接开辟和字符集等大的数组。

public class Solution {
    public int lengthOfLongestSubstring(String s) {
        int n = s.length(), ans = 0;
        int[] index = new int[128];
        for (int j = 0, i = 0; j < n; j++) {
            i = Math.max(index[s.charAt(j)], i);
            ans = Math.max(ans, j - i + 1);
            index[s.charAt(j)] = j + 1; // (下标 + 1) 代表 i 要移动的下个位置
        }
        return ans;
    }
}

和解法 3 不同的地方在于, 没有了 if 的判断, 因为如果 index [s.charAt(j)] 不存在的话, 它的值会是 0, 对最终结果不会影响。

时间复杂度： $O(n)$ 。

空间复杂度： $O(m)$ , m 代表字符集的大小。这次不论原字符串多小, 都会利用这么大的空间。

总结

综上, 我们一步一步的寻求可优化的地方, 对算法进行了优化。又加深了 Hash 的应用, 以及利用数组巧妙的实现了 Hash 的作用。

最后编辑于：2019.08.22 21:16:22

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,098评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,213评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,960评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,519评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,512评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,533评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,914评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,574评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,804评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,563评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,644评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,350评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,933评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,908评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,146评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,847评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,361评论 2赞 342