【算法一周目】滑动窗口(2)

【算法一周目】滑动窗口(2)

目录

水果成篮

解题思路

代码实现

找到字符串中所有字母异位词

解题思路

代码实现

串联所有单词的子串

解题思路

代码实现

最小覆盖子串

解题思路

代码实现


水果成篮

题目链接904. 水果成篮

题目描述:
你正在探访一家农场,农场从左到右种植了一排果树。这些树用一个整数数组 fruits 表示,其中 fruits[i] 是第 i 棵树上的水果种类。你想要尽可能多地收集水果,但是有一些规则:

  • 你有两个篮子每个篮子只能装一种类型的水果,篮子的容量无限制。
  • 你可以选择任意一棵树开始采摘,但必须从这棵树开始依次向右采摘每棵树上的水果
  • 一旦遇到某棵树上的水果不符合篮子中的水果种类,你必须停止采摘

返回你能采摘的最多的水果数量。

解题思路

解法:滑动窗口+哈希

根据题目要求,所求问题其实就是找一段最多只含两个不同元素的最长子区间,我们使用滑动窗口+哈希解决。

有一点值得注意,fruits[i] 是第 i 棵树上的水果种类,不是种类数。

具体过程如下:

  • 1.初始化哈希表 hash左右指针 left 和 right记录结果的变量 ret
  • 2.right 向右遍历数组将 right 位置的水果加入哈希表,统计频次。
  • 如果哈希表的大小超过2让left++并同时更新哈希表直至哈希表的大小不超过2
  • 3.更新结果 ret。
  • 4重复上述过程,直到 right 遍历完数组。

代码实现

1.使用unordered_map作为hash表

class Solution { public: int totalFruit(vector<int>& fruits) { // 统计滑动窗口内水果的种类和数量 unordered_map<int, int> hash; int n = fruits.size(), ret = 0; for(int left = 0, right = 0; right < n; right++) { //进窗口,将水果加入hash表 hash[fruits[right]]++; //若水果种类超过2,收缩窗口直到种类不超过2 while(hash.size() > 2) { hash[fruits[left]]--; if(hash[fruits[left]] == 0) hash.erase(fruits[left]); left++; } //更新结果 ret = max(ret, right - left + 1); } return ret; } };

 2.使用数组模拟hash表

题目其实有提到 fruits[i] 的范围,所以我们不必真的使用unordered_map作为hash表使用数组模拟即可,这样虽然会浪费空间但是提高了效率

class Solution { public: int totalFruit(vector<int>& fruits) { int hash[100000] = { 0 }; //cnt用于统计hash表的水果的种类个数 int n = fruits.size(), ret = 0, cnt = 0; for(int left = 0, right = 0; right < n; right++) { hash[fruits[right]]++; if(hash[fruits[right]] == 1) cnt++; while(cnt > 2) { hash[fruits[left]]--; if(hash[fruits[left++]] == 0) cnt--; } ret = max(ret, right - left + 1); } return ret; } };

时间复杂度:O(n)

空间复杂度:O(n)


找到字符串中所有字母异位词

题目链接438. 找到字符串中所有字母异位词

题目描述

给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。顺序可以不考虑。

异位词是指由相同字母重排列形成的字符串(包括相同的字符串)。

解题思路

解法:滑动窗口 + 哈希

因为字符串 p 的异位词的长度一定于字符串 p 的长度相等,所以我们可以在字符串 s 中使用与字符串 p 等长度的滑动窗口来求解。

我们可以使用两个大小为26的数组来模拟哈希表,用于统计窗口内的字母频次字符串s的字母频次当比较得到两个哈希表相等时,说明滑动窗口中每种字母的数量字符 p 每种字母的数量相同,窗口内的字符是字符 p 的一个异位词,此时记录窗口起始索引。

具体过程如下:

1.初始化 left 和 right 指针来维护滑动窗口两个大小为26的数组 hash1 和 hash2 来模拟哈希表,记录字符串 p 的字母频次和窗口字母频次。

2.right 向右遍历数组right 位置的字母入窗口,将其加入哈希表。当滑动窗口长度大于字符串 p 的长度时,left++将窗口左侧字母移除同时更新其在哈希表的频次。

3.更新结果,当 hash1 与 hash2 相等时记录窗口起始索引

注意:判断两个 hash 表是否相等的时间复杂度较高效率较低。故我们要优化更新结果的判断条件(两个哈希表相等),我们可以来使用一个变量 cnt 记录窗口内的字母相较于字符串 p 的有效字符的数量,并在入窗口和窗口时维护 cnt,这样更新结果时,只需判断 cnt 是否等于字符串 p 的长度就可以知道窗口字符是否是字符串 p 的异位词

解释下有效字符的数量,其实就是让窗口的组成字母尽可能接近字符 p当有效字符的数量等于字符 p 的长度,就说明了窗口的字母频次与字符 p 的字母频次相等,这也是比较两个统计字母频次的哈希表相等的本质cnt 间接完成了这个任务

代码实现

class Solution { public: vector<int> findAnagrams(string s, string p) { vector<int> ret; int n = s.size(), m = p.size(); //统计p字符串中每个字母出现的个数 int hash1[26] = { 0 }; for(auto ch : p) hash1[ch - 'a']++; //统计窗口中每个字母出现的个数 int hash2[26] = { 0 }; //统计窗口中有效字符的数量 int cnt = 0; for(int left = 0, right = 0; right < n; right++) { //进窗口 + 维护cnt char in = s[right]; hash2[in - 'a']++; if(hash2[in - 'a'] <= hash1[in - 'a']) cnt++; //窗口长度大于字符串p的长度,窗口左端字母出窗口, //并更新cnt和哈希表 if(right - left + 1 > m) { char out = s[left++]; //出窗口 + 维护cnt if(hash2[out - 'a'] <= hash1[out - 'a']) cnt--; hash2[out - 'a']--; } //更新结果 if(cnt == m) ret.push_back(left); } return ret; } };

时间复杂度:O(n)

空间复杂度:O(1)


串联所有单词的子串

题目链接30. 串联所有单词的子串

题目描述:

给定一个字符串 s 和一个字符串数组 words,words 中所有字符串的长度相同s 中的 串联子串 是指包含 words 中所有字符串以任意顺序排列连接起来的子串。

例如,如果words= ["ab","cd","ef"],那么 "abcdef", "abefcd", "cdabef", "cdefab", "efabcd" 和 "efcdab" 都是串联子串,而 "acdbef" 不是串联子串,因为它不是 words 排列的连接。

返回所有串联子串在 s 中的开始索引,顺序可以不考虑。

解题思路

解法:滑动窗口 + 哈希表

这道题就是找到字符串中所有字母异位词的升级版,从原来处理单个字符变成了处理单个单词,我们只需要将 words 的单词看成单个字母就行了,然后用滑动窗口 + 哈希表解决。

具体过程:

1.用哈希表 hash1 记录 words 中每个单词的频次



2.遍历字符串 s ,并用哈希表 hash2 来维护滑动窗口内的单词频次,注意每次增加窗口的大小为单词的长度。



3.当窗口大小大于所有单词的总长度时出窗口和更新 hash2



4.当 hash1 和 hash2 两个哈希表相等时,更新结果。

判断两个哈希表是否相等消耗较大,用 count 来优化count 统计滑动窗口内有效单词的个数。当 count 与 words 的单词个数相等时,说明找到了符合条件的一个窗口。

代码实现

class Solution { public: vector<int> findSubstring(string s, vector<string>& words) { vector<int> ret; unordered_map<string, int> hash1; for(auto& e : words) hash1[e]++; int len = words[0].size(), m = words.size(), n = s.size(); //执行len次滑动窗口 for(int i = 0; i < len; ++i) { unordered_map<string, int> hash2; for(int left = i, right = i, count = 0; right <= n - len; right += len) { //进窗口+维护count string in(s.begin() + right, s.begin() + right + len); hash2[in]++; if(hash1.count(in) && hash2[in] <= hash1[in]) count++; //判断+出窗口+维护count if(right - left + 1 > m * len) { string out(s.begin() + left, s.begin() + left + len); if(hash1.count(out) && hash2[out] <= hash1[out]) count--; hash2[out]--; left += len; } //更新结果 if(count == m) ret.push_back(left); } } return ret; } };

1.执行 len 次滑动窗口(len 是单词长度):由 s 字符串的长度不一定是单词长度的整数倍,需要执行 len 滑动窗口来保证答案的完整性。

2.注意 right 的范围,right 最后一次执行循环的位置应该是在 n - len 处。

时间复杂度O( n * len),其中 n 是字符串 s 的长度,需要 len 次滑动窗口,每次遍历一次 s。

空间复杂度O(m * len),m 是单词个数,每次滑动窗口都需要用一个哈希表来存储单词频次。


最小覆盖子串

题目链接76. 最小覆盖子串

题目描述

给你一个字符串 s 和一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在这样的子串,则返回空字符串 ""

注意:

  • 对于 t 中重复的字符,最小子串中该字符数量必须不少于 t 中的字符数量。
  • 如果存在这样的子串,答案是唯一的。

解题思路

解法:滑动窗口+哈希

根据题目,我们直接根据暴力解法来优化,就得到滑动窗口+哈希的解题方法。

具体过程如下:

1.利哈希表hash1来统计字符串 t中每个字符出现的频次。



2.使用滑动窗口遍历字符串 s ,并用哈希表 hash2 来统计窗口中字符频次。



3.当窗口的字符频次满足要求时,更新结果,然后收缩窗口,直到窗口字符频次不满足要求。

注意:这里判断窗口的字符频次满足要求不是判断两个哈希表是否相等,而是 hash1 的字符频次要完整的出现在 hash2 中,hash1 中可以出现除字符串 t 中的字符以外的字符频次。也就是说,窗口内只要完整出现字符串 t  的所有字符即可(字符种类及其对应的频次)。

我们这里还是利用 count 来完成判断,这里的 count 统计的时有效字符的种类只有 t 中的单个字符在窗口内出现的频次与在 t 中完全一样,count 才自增1,同理,频次不相等时就自减 1,当 count 与 t 中字符种类数相同时,说明找到一个符合条件的覆盖字串更新结果。

代码实现

class Solution { public: string minWindow(string s, string t) { string ret; //hash1统计t字符频次和计算hash1的大小,hash1size统计t的字符种类 int hash1[128] = { 0 }, hash1size = 0; for(auto e : t) if(hash1[e]++ == 0) hash1size++; //hash2统计窗口字符频次 int hash2[128] = { 0 }; int len = INT_MAX, start = 0; //count统计有效字符的种类 for(int left = 0, right = 0, count = 0; right < s.size(); right++) { //进窗口 + 维护count char in = s[right]; if(++hash2[in] == hash1[in]) count++; //判断 while(count == hash1size) { //更新结果 if(right - left + 1 < len) { len = right - left + 1; start = left; } //出窗口+维护count char out = s[left++]; if(hash2[out]-- == hash1[out]) count--; } } ret = len == INT_MAX ? "" : s.substr(start, len); return ret; } };

时间复杂度:O(n)

空间复杂度:O(1)


拜拜,下期再见😏

摸鱼ing😴✨🎞

Read more

假网站排全网第二,真官网翻五页都找不到!NanoClaw创始人破防:SEO之战,我快要输了

假网站排全网第二,真官网翻五页都找不到!NanoClaw创始人破防:SEO之战,我快要输了

整理 | 苏宓 出品 | ZEEKLOG(ID:ZEEKLOGnews) 自从 OpenClaw 爆火之后,各种“Claw”项目接连出现,其中以安全优化版 NanoClaw 最为知名。它的核心代码仅有 4000 行,却获得了 AI 大牛 Andrej Karpathy 的点赞。 可谁也没想到,这款口碑极佳的开源项目,近来竟被一个仿冒网站抢了风头。 投诉无门之下,NanoClaw 创始人 Gavriel Cohen 在 X 社交平台上无奈发文怒斥:谷歌搜索错误地将假网站排在真官网前面,不仅破坏了项目声誉,还埋下了严重的安全隐患,而他费尽心力,却只能哀叹一句——“我正在为自己的开源项目打 SEO 战,但我快要输了。” 那么,NanoClaw 究竟发生了什么?又是怎么走红的?事情还要从 OpenClaw

By Ne0inhk
曝Windows 12将于今年发布?以AI为核心、NPU成「硬件门槛」,网友吐槽:“不想要的全塞进来了”

曝Windows 12将于今年发布?以AI为核心、NPU成「硬件门槛」,网友吐槽:“不想要的全塞进来了”

整理 | 郑丽媛 出品 | ZEEKLOG(ID:ZEEKLOGnews) 当年,微软一句“Windows 10 将是最后一个版本”的表态,让不少用户以为 Windows 进入了“只更新、不换代”的时代。但几年过去,现实却完全不同。 在 Windows 11 发布之后,如今关于 Windows 12 的传闻再次密集出现。从内部代号、代码片段,到硬件厂商的暗示与 OEM 预热标签,种种线索拼在一起,勾勒出一个明显的趋势——这不会只是一次常规升级,而更像是一次围绕 AI 的平台级重构。 更关键的是,这次争议,可能远比当年 TPM 2.0 更大。 精准卡位 Windows 10 退场的时间?

By Ne0inhk
Python热度下滑、AI能取代搜索引擎?TIOBE最新榜单揭晓!

Python热度下滑、AI能取代搜索引擎?TIOBE最新榜单揭晓!

整理 | 屠敏 出品 | ZEEKLOG(ID:ZEEKLOGnews) 日前,TIOBE 发布了最新的 3 月编程语言榜单。整体来看,本月排名变化不算大,但榜单中仍然出现了一些值得关注的小波动。  AI 工具能帮大家秒懂最新编程语言趋势? 由于 2 月天数较少,3 月的榜单整体变化有限。借着这次发布,TIOBE CEO Paul Jansen 也回应了一个最近被频繁讨论的问题:为什么 TIOBE 指数仍然依赖搜索引擎统计结果?在大语言模型流行的今天,直接询问 AI 哪些编程语言最流行,是不是更简单? 对此,Jansen 的回答是否定的。 他解释称,TIOBE 指数本质上统计的是互联网上关于某种编程语言的网页数量。而大语言模型的训练数据同样来自这些网页内容,因此从信息来源来看,两者并没有本质区别。换句话说,LLM 的判断,本质上也是建立在这些网页数据之上的。 Python 活跃度仍在下降

By Ne0inhk
“裸奔龙虾”数量已达27万只,业内人士警告;AI浪潮下,中传“砍掉”翻译等16个专业;薪资谈判破裂,三星电子8.9万人要罢工 | 极客头条

“裸奔龙虾”数量已达27万只,业内人士警告;AI浪潮下,中传“砍掉”翻译等16个专业;薪资谈判破裂,三星电子8.9万人要罢工 | 极客头条

「极客头条」—— 技术人员的新闻圈! ZEEKLOG 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。(投稿或寻求报道:[email protected]) 整理 | 郑丽媛 出品 | ZEEKLOG(ID:ZEEKLOGnews) 一分钟速览新闻点! * “裸奔龙虾”已高达27万只!业内人士警告:一旦黑客入侵,敏感信息一秒搬空 * 阿里云 CTO 周靖人代管千问模型一号位,刘大一恒管理更多团队 * 中国传媒大学砍掉翻译、摄影等 16 个本科专业,直言教育要面向人机分工时代 * 雷军放话:小米将很快推出 L3、L4 的驾驶 * 消息称原理想汽车智驾一号位郎咸朋具身智能赛道创业 * vivo 前产品经理宋紫薇创业,瞄准 AI 时尚Agent,获亿元融资 * MiniMax 发布龙虾新技能,股价暴涨超 23% * 薪资谈判破裂,三星电子

By Ne0inhk