警惕!OpenClaw隐藏的致命Bug:网络超时误报上下文溢出,可导致系统陷入死循环

救命!我的AI助手OpenClaw深夜疯了!前天晚上开始,如果按照推文时间来算,应该是前天晚上了,OpenClaw像着了魔一样,过一会就在聊天窗口刷屏报错,最后竟然把自己给玩死了!

我们前面介绍了两种方式来给OpenClaw提供近乎无限量的token,一种是对接有免费额度的平台(OpenClaw(原ClawdBot)免费AI模型终极配置指南:精选20+精英模型,打造你的低成本AI军团),另一种是直接“强奸”Antigravity(还在为AI API费用发愁?我找到了免费使用Gemini 3和Claude 4.5的方法)。

我本以为有这么高端的模型,再加上多档回退机制,我本该高枕无忧了,结果是万万没想到,我的OpenClaw遭遇了一场由底层Bug引发的鬼打墙式死循环!

昨天晚上七点半开始,间隔一段时间他就开始自己报错,到今天凌晨不报了,我以为恢复了,结果他又开始报上了!

我分析了一下规律,发现OpenClaw机器人刷屏报错的时间间隔大约是固定的75分钟,报错内容是Context overflow(上下文溢出)、prompt too large(提示词太大)或Agent failed(Agent失败)等错误,让我一度以为是模型Token超限。实际上,我用的是gemini-3-flash这个模型,有100万Token的上下文容量,外加超高免费额度,理论上就不会出现这些错误,如果直接在Antigravity进行操作,则没有报错,说明OpenClaw的底层,有BUG!

为了确认问题,我重启了OpenClaw服务,发现错误依然会在短时间内复现,这就有意思了。

既然我搞不定,我们不是还有Antigravity吗?让Antigravity去自证清白!

大概意思是说,对话中的所有内容,都会写入到当前会话的持久化存储中,如果清空聊天记录,就会出现下面的情况。

同时,OpenClaw包含一个名为google tool schema snapshot的后台守护进程,每15分钟自动运行一次,用于刷新工具定义和检查上下文状态。

好,接下来就是问题的关键,因为在调用接口时,Antigravity Gateway出现了一次连接超时或者速率限制(大概率是前者),精准命中OpenClaw的错误处理模块(errors.ts)的逻辑缺陷,简单粗暴地将此类网络层面的timeout或rate_limit错误统一包装为“Context overflow”展示给用户,触发误判。

更要命的是,系统将这次后台任务的失败判定为“严重异常”,触发了自动重试机制,进入死循环。同时,OpenClaw会将有问题的会话数据保存到了硬盘(sessions.json),即使重启服务,程序也会重新加载这段“有毒”的对话历史,一旦后台任务再次扫描到它,就会再次崩溃,再次进入死循环。

可以看到,到这里就基本上跟模型没有关系了。但问题还是要解决,直接让Antigravity恢复环境。

这就完了?还有更恶心的,除了把“有毒”的大文件保存在sessions.json之外,OpenClaw还把“被封禁/冷却中”这个错误状态保存在了另一个文件auth-profiles.json里。也就是说,即使删除文档,但OpenClaw脑子里还记着“我是被Google封杀的状态”,所以它拒绝工作。

解决方案有两个,如果是临时止血,可以修改下游业务代码,将调用的模型从 OpenClaw/Gemini切换为直连SiliconFlow/DeepSeek,避开故障点,确保业务恢复。也就是从最强大的模型回退到最经济的模型。

如果要根治修复,就要先停止服务,再手动删除OpenClaw的本地会话存储目录,彻底移除包含大文档的损坏上下文,清除毒化数据,跳出死循环。

systemctl --user stop openclaw-gateway.servicerm -rf /root/.openclaw/agents/main/sessionsrm -r /root/.openclaw/agents/main/agent/auth-profiles.jsonsystemctl --user start openclaw-gateway.service

重启服务之后,服务启动正常,日志中不再出现循环报错。不过,也得需要你再次配置认证才行。

之后,OpenClaw相当于完全失忆并作为新服务启动,又能再次投入工作了。

这次惊心动魄的排障经历给我们敲响了警钟:再强大的系统也可能因底层一个不起眼的Bug而崩溃。

如果你还没有遇到这个问题,那我得给你提个醒了,在OpenClaw修复此Bug之前,尽量避免在长期活跃的主Session中上传过大的文档。建议使用临时Session处理大文档,处理完后使用/new命令开启新会话。同时,建议配置多模型冗余,保持业务脚本具备多模型切换能力,如DeepSeek/Gemini互备,防止单一通道故障导致业务停摆。

你的系统是否也遇到过类似的灵异事件?欢迎在评论区分享你的排障故事!

***推荐阅读***

无需公网IPv4!手把手教你配置基于IPv6的WireGuard安全隧道

WireGuard配置太麻烦?我的Web管理系统通过HUB/SPOKE组网+SSH代管,效率提升100倍!

我们的WireGuard管理系统支持手机电脑了!全平台终端配置,支持扫码连接,一键搞定

腾讯云隐藏福利:如何通过一键操作白嫖CPU升级?性能飙升

OpenClaw(原ClawdBot)免费AI模型终极配置指南:精选20+精英模型,打造你的低成本AI军团

还在为AI API费用发愁?我找到了免费使用Gemini 3和Claude 4.5的方法

每月40元实现异地组网!用家用路由器+L2TP协议,在腾讯云上搭建企业级VPN枢纽

你的VPN客户端还在共用IP?最新的OpenVPN管理系统已支持每客户端独立公网IP!

成本省下99.7%!用40元的腾讯云服务器自建IPsecVPN,成功对接企业级飞塔防火墙

超越SR-MPLS!SRv6实测:基于纯IPv6数据面承载IPv4 VPN业务,体验协议简化之美

超越BE!实战演示SR-MPLS TE显式路径规划,为VPN业务提供可靠性能保障

2048卡昇腾910C集群算力集群交付工程手册

2048卡昇腾910C集群存储集群交付工程手册

Read more

曝Windows 12将于今年发布?以AI为核心、NPU成「硬件门槛」,网友吐槽:“不想要的全塞进来了”

曝Windows 12将于今年发布?以AI为核心、NPU成「硬件门槛」,网友吐槽:“不想要的全塞进来了”

整理 | 郑丽媛 出品 | ZEEKLOG(ID:ZEEKLOGnews) 当年,微软一句“Windows 10 将是最后一个版本”的表态,让不少用户以为 Windows 进入了“只更新、不换代”的时代。但几年过去,现实却完全不同。 在 Windows 11 发布之后,如今关于 Windows 12 的传闻再次密集出现。从内部代号、代码片段,到硬件厂商的暗示与 OEM 预热标签,种种线索拼在一起,勾勒出一个明显的趋势——这不会只是一次常规升级,而更像是一次围绕 AI 的平台级重构。 更关键的是,这次争议,可能远比当年 TPM 2.0 更大。 精准卡位 Windows 10 退场的时间?

By Ne0inhk
Python热度下滑、AI能取代搜索引擎?TIOBE最新榜单揭晓!

Python热度下滑、AI能取代搜索引擎?TIOBE最新榜单揭晓!

整理 | 屠敏 出品 | ZEEKLOG(ID:ZEEKLOGnews) 日前,TIOBE 发布了最新的 3 月编程语言榜单。整体来看,本月排名变化不算大,但榜单中仍然出现了一些值得关注的小波动。  AI 工具能帮大家秒懂最新编程语言趋势? 由于 2 月天数较少,3 月的榜单整体变化有限。借着这次发布,TIOBE CEO Paul Jansen 也回应了一个最近被频繁讨论的问题:为什么 TIOBE 指数仍然依赖搜索引擎统计结果?在大语言模型流行的今天,直接询问 AI 哪些编程语言最流行,是不是更简单? 对此,Jansen 的回答是否定的。 他解释称,TIOBE 指数本质上统计的是互联网上关于某种编程语言的网页数量。而大语言模型的训练数据同样来自这些网页内容,因此从信息来源来看,两者并没有本质区别。换句话说,LLM 的判断,本质上也是建立在这些网页数据之上的。 Python 活跃度仍在下降

By Ne0inhk
“裸奔龙虾”数量已达27万只,业内人士警告;AI浪潮下,中传“砍掉”翻译等16个专业;薪资谈判破裂,三星电子8.9万人要罢工 | 极客头条

“裸奔龙虾”数量已达27万只,业内人士警告;AI浪潮下,中传“砍掉”翻译等16个专业;薪资谈判破裂,三星电子8.9万人要罢工 | 极客头条

「极客头条」—— 技术人员的新闻圈! ZEEKLOG 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。(投稿或寻求报道:[email protected]) 整理 | 郑丽媛 出品 | ZEEKLOG(ID:ZEEKLOGnews) 一分钟速览新闻点! * “裸奔龙虾”已高达27万只!业内人士警告:一旦黑客入侵,敏感信息一秒搬空 * 阿里云 CTO 周靖人代管千问模型一号位,刘大一恒管理更多团队 * 中国传媒大学砍掉翻译、摄影等 16 个本科专业,直言教育要面向人机分工时代 * 雷军放话:小米将很快推出 L3、L4 的驾驶 * 消息称原理想汽车智驾一号位郎咸朋具身智能赛道创业 * vivo 前产品经理宋紫薇创业,瞄准 AI 时尚Agent,获亿元融资 * MiniMax 发布龙虾新技能,股价暴涨超 23% * 薪资谈判破裂,三星电子

By Ne0inhk
一天开13个会、一个Bug要修200天!前亚马逊L7爆料:这轮大裁员,AI只是“背锅侠”

一天开13个会、一个Bug要修200天!前亚马逊L7爆料:这轮大裁员,AI只是“背锅侠”

整理 | 郑丽媛 出品 | ZEEKLOG(ID:ZEEKLOGnews) 过去一年,大型科技公司的裁员消息几乎从未停过。但当公司对外给出的理由越来越统一,“AI 让组织更高效”,也有越来越多内部员工开始提出另一种质疑:事情或许没那么简单。 最近,一段来自前亚马逊员工 Becky 的 YouTube 视频在开发者社区流传开来。她曾在亚马逊工作 7 年,其中 5 年担任 L7 级别的技术管理者,负责过团队年度规划(OP1)等核心管理工作——可去年,她主动离开了亚马逊。 就在最近,她的三位前同事接连被裁,其中两人还是 H-1B 签证员工,都背着房贷压力。其中一位同事忍不住给 Becky 发消息:“你去年离开的时候,是不是已经预料到会发生这些?” 对此,Becky 的回答很坦诚:她不知道具体什么时候会裁员,但她早就感觉情况不对劲了。 在她看来,这轮裁员被归因为

By Ne0inhk