凌晨GLM-5炸场！世界开源模型第一名！模型训练大幅创新！实测：Agentic能力、前端细节逼近专业人士，可模拟手机OS，游戏秒运行！代际变化

优质文章学习记录

06 Apr 2026 — 7 min read

大模型叙事逻辑已经出现了极为明显的变化。过去三年，大家更会关注：谁更会回答问题，谁回答得更聪明、准确、快速？但随着一系列Agent产品的涌现，大模型也开始向真实世界的复杂任务发起冲锋。现在的问题变成：谁能真正承担任务？

GLM-5 终于来了！

2月12日凌晨，智谱正式发布了GLM-5。

早上，小编就围绕它展开了测评。先说一句话感受，可以说非常跟上一代GLM-4.7，比起来，代际变化非常大。

一句话感受，是一场非常激进的扩张。

模型训练大幅创新

先来看模型和参数，参数规模从 355B（32B 激活）跃升到 744B（40B 激活），预训练数据从 23T tokens 增加到 28.5T tokens，同时引入 DeepSeek Sparse Attention，在维持长上下文能力的同时压缩部署成本。

这样，虽然整体模型大了一倍、但部署成本没有增加多少，同时，模型表现更加稳定了。

真正的变化发生在训练范式上。

强化学习一直是大模型从“能用”走向“好用”的关键，但问题是效率极低，尤其在超大模型上几乎难以规模化。GLM-5 团队为此构建了一套名为“ slime”的异步强化学习基础设施，大幅提升训练吞吐量，让后训练不再是粗颗粒度修补，而是高频、细粒度迭代。这意味着模型不仅在能力上变强，在优化路径上也更系统。

全球开源模型综合排名第一

效果如何？

在推理、代码与智能体任务上，GLM-5 已经成为全球开源模型中的最佳表现者，并开始逼近一线闭源模型。

有一个例子值得注意。

在衡量长期规划能力的 Vending Bench 2 上——一个要求模型经营一年“自动售货机业务”的基准测试——GLM-5 最终账户余额达到 4,432 美元，在开源模型中排名第一，接近 Claude Opus 4.5。这里考验的不是答题，而是资源调度、长期决策与策略稳定性。

从对话转向工作，大模型转向Agentic时代

更值得注意的是定位变化。

GLM-5 不再强调“聊天能力”，而是明确面向复杂系统工程与长周期 Agent 任务。在内部 CC-Bench-V2 评测中，其在前端、后端与长任务执行上显著超越 GLM-4.7，缩小与顶级模型的差距。

这其实透露出一个更重要的趋势变化：基础模型正在从“对话产品”转向“工作基础设施”。（从 Claude Opus4.6 也能看出来这个趋势越来越明显。）

就像 Office 之于知识工作者，IDE 之于工程师，大模型正在成为一套“生产力系统”。

GLM-5 已经支持将文本或原始材料直接转化为 .docx、.pdf、.xlsx 等文件——PRD、财务报表、课程讲义、试卷、执行手册、菜单——从输入到交付，一步完成。

这也说明，生成内容这种能力已经被各大模型厂商卷到足够Cover了，今年以后的大模型的突破重点，将长期聚焦在“完成工作闭环”方面。

与此同时，据官方透露，GLM-5模型已在 Hugging Face 与 ModelScope 开源，权重采用 MIT License；开发者可在 api.z.ai 与 BigModel.cn 调用，

而且，GLM- 5 已经兼容 Claude Code 与 OpenClaw。

这也就意味着，这款顶尖的开源模型现在可以通过 OpenClaw 进行跨应用与跨设备执行操作。

实测：细节逼近真实使用体验，Agent模式工作流拆解如同专业人士、可模拟手机操作系统

前端能力越来越强了！

相比前一代的4.7，GLM-5在前端细节上更加丰富和丝滑，呈现风格也更加贴近现实应用的审美。

这是之前小编在GLM-4.7跑的效果：

更厉害的来了。一位网友甚至让GLM-5造了一款可以运行的手机。

不仅手机做了出来，手机里的各种应用都可以点击运行，比如日历、贪吃蛇、音乐等等，可以说非常逼真、惊艳了！

此外，小编还特意测试了Agent模式。这次的测试题目是：

为一家AI Infra创业公司生成一份融资路演PPT大纲（15页） 要求： 包含市场分析 竞争格局 技术壁垒 商业模式 财务预测 团队介绍 每一页写出标题 + 3个核心要点

可以看出该模式下，GLM-5的工作流已经化身成了一位具备撰写融资路演PPT经验的专业人士，工作流拆解得非常严谨靠谱。另外小编还注意到GLM-5会自主调用pptskills来帮助自己生成PPT大纲。

最后生成的PPT大纲版式如下，当然从效果看，还需要人工进一步在细节上进行调整。

当然小编还注意到，智谱这次还推出了其他新产品 OCR、Image和Audio。

可以看出智谱，正在从代码模型拓展到多模态模型的布局。而这也是转向复杂系统任务的必然之举。

插曲：神秘模型被传就是GLM-5

上周在OpenRouter的一个名为“Pony Alpha ”的神秘模型突然爆红（排名第一），就被网友爆料是智谱的GLM-5，因为风格很像GLM，而且聊天时，模型说自己是z.ai创造的。但官方目前还没有明确回应该消息是否属实。

写在最后：大模型，注定吞噬一切

大模型叙事逻辑已经出现了极为明显的变化。

过去三年，大家更会关注：谁更会回答问题，谁回答得更聪明、准确、快速？

但随着一系列Agent产品的涌现，大模型也开始向真实世界的复杂任务发起冲锋。现在的问题变成：谁能真正承担任务？

如果说 GLM-4.5 是“会推理、会写代码的模型”，那么 GLM-5 的野心更直接——成为复杂系统里的执行者。

顺着这个脉络，当复杂系统的Agentic Engineering 这座堡垒也被大模型攻克之后，恐怕之后的主命题就会变成：让AI自己去运营一家公司，看好未来几个月、甚至几年的现金流了吧。

总之，时代切换的周期已经越来越短了。

【Java Web学习 | 第15篇】jQuery（万字长文警告）

🌈个人主页: Hygge_Code🔥热门专栏:从0开始学习Java | Linux学习| 计算机网络💫个人格言: “既然选择了远方，便不顾风雨兼程” 文章目录 * 从零开始学 jQuery * jQuery 核心知识🥝 * 一、jQuery 简介：为什么选择它？ * 1. 核心用途 * 2. 核心优势 * 3. 下载与引入 * 二、jQuery 语法：基础与选择器 * 1. 常用选择器 * 2. ready 方法：确保文档加载完成 * 三、DOM 元素操作：内容、属性、样式 * 1. 操作元素内容 * 2. 操作元素属性 * 3. 操作元素样式 * （1）操作宽度与高度 * （2）

中文文本分类新选择｜AI万能分类器集成WebUI开箱即用

中文文本分类新选择｜AI万能分类器集成WebUI开箱即用在自然语言处理（NLP）的实际应用中，文本分类是构建智能客服、舆情监控、工单系统、内容推荐等场景的核心能力。传统方法往往依赖大量标注数据进行模型训练，成本高、周期长。而随着预训练语言模型的发展，零样本学习（Zero-Shot Learning）正在改变这一局面。本文将介绍一款基于 StructBERT 零样本分类模型的 AI 万能分类器镜像——无需训练、支持自定义标签、集成可视化 WebUI，真正实现“开箱即用”的中文文本智能打标解决方案。 🌟 为什么需要“零样本”文本分类？在实际业务中，我们常常面临这样的问题： * 新的分类需求不断出现（如新增投诉类型） * 标注数据稀缺或成本过高 * 快速验证分类逻辑是否可行 * 希望快速搭建原型系统进行演示传统的监督学习流程：收集数据 → 清洗标注 → 训练模型 → 部署上线，动辄数周甚至数月。而零样本分类技术让我们可以跳过训练阶段，在推理时直接定义类别标签，由模型根据语义理解自动判断归属。 💡 零样本

DeerFlow基础教程：DeerFlow控制台UI与Web UI双模式使用详解

DeerFlow基础教程：DeerFlow控制台UI与Web UI双模式使用详解 1. DeerFlow是什么：你的个人深度研究助理你有没有过这样的经历？想快速了解一个新领域，比如“量子计算在金融建模中的最新应用”，但搜了一堆资料，发现信息零散、真假难辨、专业门槛高，最后只能放弃？或者需要为一次重要汇报准备一份结构清晰、数据扎实、有深度分析的行业报告，却卡在资料收集和逻辑梳理上，耗时又费力？ DeerFlow就是为解决这类问题而生的。它不是另一个聊天机器人，而是一个能真正帮你“做研究”的AI助手——你的个人深度研究助理。它不满足于简单回答问题，而是主动调用搜索引擎获取最新信息、运行Python代码验证假设、调用专业工具分析数据、整合多源内容生成结构化报告，甚至能把研究成果变成一段自然流畅的播客音频。整个过程就像你请了一支由研究员、数据分析师、文案编辑和播客制作人组成的虚拟团队，在后台协同工作。更关键的是，它把这一切复杂能力，封装成了两种你随时可以打开、上手就用的界面：一个简洁高效的命令行控制台（Console UI），适合喜欢直接、快速、可复现操作的用户；还有一个功能

【前端实战】Axios 错误处理的设计与进阶封装，实现网络层面的数据与状态解耦

目录【前端实战】Axios 错误处理的设计与进阶封装，实现网络层面的数据与状态解耦一、为什么网络错误处理一定要下沉到 Axios 层二、Axios 拦截器 interceptors 1、拦截器的基础应用 2、错误分级和策略映射的设计 3、错误对象标准化三、结语作者：watermelo37 ZEEKLOG优质创作者、华为云云享专家、阿里云专家博主、腾讯云“创作之星”特邀作者、火山KOL、支付宝合作作者，全平台博客昵称watermelo37。一个假装是giser的coder，做不只专注于业务逻辑的前端工程师，Java、Docker、Python、LLM均有涉猎。 --------------------------------------------------------------------- 温柔地对待温柔的人，包容的三观就是最大的温柔。 --------------------------------------------------------------------- 【前