凌晨GLM-5炸场!世界开源模型第一名!模型训练大幅创新!实测:Agentic能力、前端细节逼近专业人士,可模拟手机OS,游戏秒运行!代际变化

凌晨GLM-5炸场!世界开源模型第一名!模型训练大幅创新!实测:Agentic能力、前端细节逼近专业人士,可模拟手机OS,游戏秒运行!代际变化

大模型叙事逻辑已经出现了极为明显的变化。过去三年,大家更会关注:谁更会回答问题,谁回答得更聪明、准确、快速?但随着一系列Agent产品的涌现,大模型也开始向真实世界的复杂任务发起冲锋。现在的问题变成:谁能真正承担任务?

GLM-5 终于来了!

2月12日凌晨,智谱正式发布了GLM-5。

早上,小编就围绕它展开了测评。先说一句话感受,可以说非常跟上一代GLM-4.7,比起来,代际变化非常大。

一句话感受,是一场非常激进的扩张。

模型训练大幅创新

先来看模型和参数,参数规模从 355B(32B 激活)跃升到 744B(40B 激活),预训练数据从 23T tokens 增加到 28.5T tokens,同时引入 DeepSeek Sparse Attention,在维持长上下文能力的同时压缩部署成本。

这样,虽然整体模型大了一倍、但部署成本没有增加多少,同时,模型表现更加稳定了。

真正的变化发生在训练范式上。

强化学习一直是大模型从“能用”走向“好用”的关键,但问题是效率极低,尤其在超大模型上几乎难以规模化。GLM-5 团队为此构建了一套名为“ slime”的异步强化学习基础设施,大幅提升训练吞吐量,让后训练不再是粗颗粒度修补,而是高频、细粒度迭代。这意味着模型不仅在能力上变强,在优化路径上也更系统。

全球开源模型综合排名第一

效果如何?

在推理、代码与智能体任务上,GLM-5 已经成为全球开源模型中的最佳表现者,并开始逼近一线闭源模型。

图片

有一个例子值得注意。

在衡量长期规划能力的 Vending Bench 2 上——一个要求模型经营一年“自动售货机业务”的基准测试——GLM-5 最终账户余额达到 4,432 美元,在开源模型中排名第一,接近 Claude Opus 4.5。这里考验的不是答题,而是资源调度、长期决策与策略稳定性。

图片
从对话转向工作,大模型转向Agentic时代

更值得注意的是定位变化。

GLM-5 不再强调“聊天能力”,而是明确面向复杂系统工程与长周期 Agent 任务。在内部 CC-Bench-V2 评测中,其在前端、后端与长任务执行上显著超越 GLM-4.7,缩小与顶级模型的差距。

这其实透露出一个更重要的趋势变化:基础模型正在从“对话产品”转向“工作基础设施”。(从 Claude Opus4.6 也能看出来这个趋势越来越明显。)

就像 Office 之于知识工作者,IDE 之于工程师,大模型正在成为一套“生产力系统”。

GLM-5 已经支持将文本或原始材料直接转化为 .docx、.pdf、.xlsx 等文件——PRD、财务报表、课程讲义、试卷、执行手册、菜单——从输入到交付,一步完成。

这也说明,生成内容这种能力已经被各大模型厂商卷到足够Cover了,今年以后的大模型的突破重点,将长期聚焦在“完成工作闭环”方面。

图片

与此同时,据官方透露,GLM-5模型已在 Hugging Face 与 ModelScope 开源,权重采用 MIT License;开发者可在 api.z.ai 与 BigModel.cn 调用,

而且,GLM- 5 已经兼容 Claude Code 与 OpenClaw。

这也就意味着,这款顶尖的开源模型现在可以通过 OpenClaw 进行跨应用与跨设备执行操作

实测:细节逼近真实使用体验,Agent模式工作流拆解如同专业人士、可模拟手机操作系统

前端能力越来越强了!

相比前一代的4.7,GLM-5在前端细节上更加丰富和丝滑,呈现风格也更加贴近现实应用的审美。

图片

这是之前小编在GLM-4.7跑的效果:

图片

更厉害的来了。一位网友甚至让GLM-5造了一款可以运行的手机。

不仅手机做了出来,手机里的各种应用都可以点击运行,比如日历、贪吃蛇、音乐等等,可以说非常逼真、惊艳了!

图片

此外,小编还特意测试了Agent模式。这次的测试题目是:

为一家AI Infra创业公司生成一份融资路演PPT大纲(15页) 要求: 包含市场分析 竞争格局 技术壁垒 商业模式 财务预测 团队介绍 每一页写出标题 + 3个核心要点

可以看出该模式下,GLM-5的工作流已经化身成了一位具备撰写融资路演PPT经验的专业人士,工作流拆解得非常严谨靠谱。另外小编还注意到GLM-5会自主调用pptskills来帮助自己生成PPT大纲。

图片

最后生成的PPT大纲版式如下,当然从效果看,还需要人工进一步在细节上进行调整。

图片

当然小编还注意到,智谱这次还推出了其他新产品 OCR、Image和Audio。

可以看出智谱,正在从代码模型拓展到多模态模型的布局。而这也是转向复杂系统任务的必然之举。

图片
插曲:神秘模型被传就是GLM-5

上周在OpenRouter的一个名为“Pony Alpha ”的神秘模型突然爆红(排名第一),就被网友爆料是智谱的GLM-5,因为风格很像GLM,而且聊天时,模型说自己是z.ai创造的。但官方目前还没有明确回应该消息是否属实。

图片
写在最后:大模型,注定吞噬一切

大模型叙事逻辑已经出现了极为明显的变化。

过去三年,大家更会关注:谁更会回答问题,谁回答得更聪明、准确、快速?

但随着一系列Agent产品的涌现,大模型也开始向真实世界的复杂任务发起冲锋。现在的问题变成:谁能真正承担任务?

如果说 GLM-4.5 是“会推理、会写代码的模型”,那么 GLM-5 的野心更直接——成为复杂系统里的执行者。

顺着这个脉络,当复杂系统的Agentic Engineering 这座堡垒也被大模型攻克之后,恐怕之后的主命题就会变成:让AI自己去运营一家公司,看好未来几个月、甚至几年的现金流了吧。

总之,时代切换的周期已经越来越短了。

Read more

夸克网盘免费资源电子书籍安卓软件经典游戏音乐歌曲精品教程AI绘画学习资料合集

夸克网盘免费资源电子书籍安卓软件经典游戏音乐歌曲精品教程AI绘画学习资料合集

一、夸克网盘免费资源说明 夸克网盘免费资源,来自全网整理二次精选,涵盖了几乎所有资源类型,网盘资源目录的分享链接,仅限一级目录和二级目录,一级目录是网盘资源的根目录,包括电子书籍、软件资源、游戏资源、视频资源、音乐音频、美食技术和学习资料等,二级目录是一级目录的子目录,均为资源专题形式,比如,Kindle原版书籍合集、U盘车载音乐歌曲、DeepSeek全套资源、全网专业摄影书籍、TikTok全球解锁版本、IOS巨魔专用资源、TED演讲视频合集、剪映教学全套资源、全网热门漫画精选,等等,相信其中会有你所需要的。 特别说明: 1、夸克网盘与百度网盘不同,不仅支持查看分享链接的资源大小,而且支持在分享链接页面里搜索资源,可以查询其中是否有你所需要的。 2、夸克官方一直都有福利活动,新用户可以免费领取1TB空间,具体操作方法请查看文本文件(在分享链接里)。 3、一级目录《全网精选2000T优质资料》,提供了很有价值的海量夸克资源,分享链接存放在电子表格里,整个目录大小只有9.7M,建议转存收藏。 二、夸克网盘一级目录资源 电子书籍+

GLM-4.7-Flash实战教程:基于GLM-4.7-Flash构建本地Copilot工具

GLM-4.7-Flash实战教程:基于GLM-4.7-Flash构建本地Copilot工具 1. 为什么需要本地Copilot工具 在日常编程和工作中,我们经常需要代码建议、文档生成、问题解答等AI辅助功能。虽然云端AI服务很方便,但存在网络延迟、隐私安全、使用成本等问题。基于GLM-4.7-Flash构建本地Copilot工具,可以让你: * 完全离线运行:不依赖网络,响应速度极快 * 数据隐私安全:所有对话和代码都在本地处理 * 定制化能力强:可以根据自己的需求调整模型行为 * 成本可控:一次部署,长期使用,无按次付费 GLM-4.7-Flash作为最新的开源大模型,在代码理解和生成方面表现出色,特别适合作为本地编程助手。 2. 环境准备与快速部署 2.1 硬件要求 为了流畅运行GLM-4.7-Flash,建议准备以下硬件环境: * GPU:4张RTX 4090 D显卡(或同等算力) * 内存:至少128GB系统内存 * 存储:至少100GB可用空间(模型文件约59GB)

2026权威评测:毕业论文AIGC降重盘点,附免费试用

2026权威评测:毕业论文AIGC降重盘点,附免费试用

ZEEKLOG摘要: 2026年高校全面启用AIGC检测,传统同义词替换的降重方式已彻底失效!毕业论文“AIGC痕迹”究竟怎么破?本文基于真实学术场景,深度盘点5款主流AI学术工具,从原创性、降痕能力、服务保障等维度的实测数据出发,为你提供一份最靠谱的选型避坑指南。 一、 引言:“查重”退潮,“查痕”当道,你的论文还安全吗? 作为在ZEEKLOG深耕“AI效率工具”与“学术科研”板块多年的老博主,最近收到了大量本硕博同学的私信求助。来到2026年,学术圈的游戏规则已经发生巨变。 据最新发布的虚拟数据《2026中国高校学术诚信白皮书》显示:今年因“AIGC生成痕迹过高”被退回重写的毕业论文比例高达37.2%。知网、万方、格子达等主流平台已经完成了第三代AI检测大模型的迭代。 这就导致了一个绝对的核心痛点:过去市面上的传统降重工具,只是在玩“同义词替换”的文字游戏,不仅语法生硬,且在最新的查测系统中AIGC疑似度往往直接飙升至60%以上。学生们花了钱降重,反而因为“AI味太重”面临学术不端的指控,返工率极高。

【AIGC前沿】MiniMax海螺AI视频——图片/文本生成高质量视频

【AIGC前沿】MiniMax海螺AI视频——图片/文本生成高质量视频

目录 1.MiniMax海螺AI视频简介 2.使用教程 1.MiniMax海螺AI视频简介 海螺视频,作为 MiniMax 旗下海螺 AI 平台精心打造的 AI 视频生成工具,致力于助力用户产出高品质视频内容。该工具依托 abab-video-1 模型,具备强大的文生视频功能。用户仅需输入关键词或简短语句,海螺视频就能据此创作出情节丰富的完整视频。此外,海螺视频运用 DiT 架构,能够精准模拟现实世界的物理规律,尤其在生成复杂场景与高动作场景时,展现出卓越的性能。 2.使用教程 点击如下链接,进入蓝耘元生代智算云平台主页 https://cloud.lanyun.net/#/registerPage?promoterCode=11f606c51e 点击主页上方栏的“MaaS平台” 然后点击左侧栏的“视觉模型”  可以看到可以免费体验一次I2V-01图片生成视频  点击如下红框处将图片上传  例如输入如下的图片 例如想让小狗动起来,可以在如下红框处输入相应的指令,然后点击立即生成