AI Harness 工程:Agent 能跑起来的那一层到底是什么?

AI Harness 工程:Agent 能跑起来的那一层到底是什么?

AI Harness 工程的崛起——Agent 真正跑起来的那一层

关于构建 AI Agent,业界通常谈的是三种架构路径:SDK、Frameworks、Scaffolding。这三种方式各自站在灵活性与结构性的不同位置,也各有适用场景。

但 2026 年悄悄冒出了第四种模式,而且直接架在这三种之上——它叫 Harness

OpenAI 和 Anthropic 现在都正式用了这个词。Martin Fowler 写过专门分析它的文章,arXiv 上也有论文给出了形式化定义。这不是什么炒作出来的新词,而是那层一直缺位、却决定 AI Agent 能不能在生产环境里真正跑起来的架构层。

Harness 到底是什么?

先把一件事说清楚:Harness 不是 Agent 本身

它是管理 Agent 如何运行的那套软件系统,负责处理完整的生命周期——工具调用、内存、重试、人工审批、上下文工程、子 Agent……让模型可以专心做推理,其他的一概不用操心。

Philipp Schmid 用了一个很贴切的计算机类比来解释这件事:

模型是原始的处理能力,上下文窗口是有限的工作内存,而 Harness 就是操作系统——管上下文、管初始化序列、管标准工具驱动。Agent 则是跑在这一切之上的应用程序。

这个比喻非常准,一下子就把关系理清楚了。


它跟 SDK、Framework、Scaffolding 是什么关系?

SDK、Scaffolding、Framework 回答的是同一个问题:怎么把 Agent 造出来?

Harness 回答的是一个完全不同的问题:Agent 造出来之后,怎么让它安全、稳定地跑?

这两件事不是替代关系——你完全可以用 Framework 来构建一个 Harness,它们处于不同的层次。四种方式的对比关系如下图:

Harness 有哪些核心组件?

parallel.ai 的团队梳理出了六个核心组件,这也跟 OpenAI 和 Anthropic 官方发布的内容高度一致:

工具集成层,通过定义好的协议把模型接入外部 API、数据库、代码执行环境和各种自定义工具。

内存与状态管理,多层内存体系——工作上下文、会话状态、长期记忆——在单个上下文窗口之外做持久化。Anthropic 的做法是用进度文件和 git 历史来桥接不同的会话,让 Agent 在切换任务后还知道自己在哪、做到哪了。

上下文工程与提示管理,不是一堆写死的提示模板,而是根据当前任务状态动态决定每次模型调用时塞进去什么信息——主动选择,而不是全部照单全收。

规划与任务分解,引导模型一步一步走结构化的任务序列,而不是试图一口气搞定所有事情。

验证与防护,格式验证、安全过滤、自我纠错循环。当 Agent 卡住的时候,Harness 把它当成一个信号——说明有什么东西缺了,而不是直接报错崩掉。

模块化与可扩展性,各个组件可以独立开关、独立替换,插拔式设计,改一个不影响其他的。

真实生产中的 Harness 长什么样?

Claude Code 就是一个典型的 Harness。

它读取整个代码库,管理文件系统访问,调度子 Agent,处理工具编排,跨会话维护内存,还内置了各种防护。开发者只需要专注于任务本身,其他的 Harness 全部兜着。

OpenAI Codex 也是。

他们的团队用这套 Harness 工程方式,搭出了一个超过 100 万行的代码库,全程没有一行手动输入的代码。Harness 是主要接口,当 Agent 遇到问题,反馈会直接流回代码库,推动上下文工程和架构约束的持续迭代。

OpenAI 的 CUA 示例应用(计算机使用场景下的 Harness)中,Runner 管理的是"截图 → 操作 → 验证 → 再循环"这个完整闭环。模型负责决定做什么,Harness 负责安全地把它执行出来。

Framework 层正在被 Harness 吞掉

有一个很值得关注的趋势:传统 Framework 处理的那些事情,正在被模型本身吸收。

Agent 定义、消息路由、任务生命周期、依赖管理、生成工作进程——以前开发者用 Framework 来搞定这些,但现在大约 80% 的这类功能,模型已经原生支持了。

剩下那 20%——持久性、确定性重放、成本控制、可观察性、错误恢复——正好是 Harness 负责的部分。

Framework 层不只是在消失,它在分裂:智能进入模型,基础设施进入 Harness。

Harness 与 Framework 的核心区别也很清晰:Framework 告诉开发者怎么构建应用,Harness 告诉 Agent 怎么安全运行。用 Framework 时,开发者写编排逻辑;用 Harness 时,模型自己制定计划,Harness 保持它不翻车。

现在构建 AI Agent,问题变了

以前大家问的是:用哪个 Framework?

现在更关键的问题是:Harness 应该长什么样?

Harness 决定了 Agent 是成功还是失败。好的 Harness 能管住人工审批、文件系统访问、工具编排、子 Agent、提示和完整的生命周期,干预最少,但能挡住灾难性失败。

落地建议也很实在:从简单的地方开始,先把原子工具做扎实,让模型来制定计划,再逐步加上防护、重试和验证机制。这就是 Harness 工程的基本思路。

最后说一种特殊形态

值得单独提一下的是 Markdown/Prompt Harness,比如 Anthropic 的 CLAUDE.md 技能文件,它把编排指令直接嵌进系统提示或结构化的 Markdown 文件里。

这种方式下,LLM 本身就成了循环控制器——它读取 Harness 规则,然后照着执行。当模型足够强、能做到自我引导,而且你需要快速迭代、不想每次都改代码的时候,这是个相当好用的选择。

原文:The Rise of AI Harness Engineering

Read more

Windows纯本地部署OpenClaude:从零搭建你的7×24小时AI助理,打通微信/飞书

无需云服务器,一台Windows电脑就能让AI助手24小时在线,还能通过手机随时指挥它干活 前言 之前写过一篇用云服务器部署OpenClaude的教程,不少读者反馈:“一定要买服务器吗?我只有一台Windows电脑行不行?” 答案是:当然可以! OpenClaude本来就是完全支持本地部署的开源AI助手框架。你只需要一台Windows电脑,就能跑起一个完整的AI服务,而且可以通过微信、飞书随时随地指挥它——查文件、开软件、管理电脑,甚至让它在你睡觉的时候帮你处理任务。 这篇文章将手把手教你在Windows环境纯本地部署OpenClaude,并打通飞书和企业微信,全程不需要买云服务器。 一、先搞懂:三种部署方式,你选哪个? OpenClaude支持三种部署模式,先看这张图快速理解区别: 部署方式架构优点缺点本地部署全在本地电脑无需服务器、免费、隐私安全电脑关机AI就下线云端部署全在云服务器7×24小时在线、稳定需要付费买服务器混合部署云端大脑+本地手脚24小时在线+能操作本地电脑架构复杂、需要两台机器 本文选择第一种:纯本地部署。虽然电脑关机时AI会下线,但

宏智树AI:ChatGPT学术版驱动,重塑学术写作新生态

宏智树AI:ChatGPT学术版驱动,重塑学术写作新生态

在学术研究的赛道上,低效的文献梳理、繁琐的数据处理、严苛的学术规范,常让科研工作者与高校师生陷入创作困境。宏智树AI(官网:www.hzsxueshu.com),一款由ChatGPT学术版模型深度驱动、搭载AI5.0技术架构的专业学术智能解决方案平台,专为论文写作场景量身打造,以“全流程覆盖、高精准赋能、强合规保障”为核心,构建从大纲生成到定稿答辩的一站式学术服务体系,让学术创作告别低效内耗,回归研究本质。 一、顶尖技术底座:AI5.0+ChatGPT学术版,定义智能学术新高度 宏智树AI的核心竞争力,源于业内领先的双重技术赋能,打破传统学术工具的性能边界,实现从“文字生成”到“学术赋能”的跨越式升级。 ChatGPT学术版模型赋予平台精准的语义理解与逻辑推理能力,深度契合文、理、工、医等全学科学术写作范式,杜绝口语化、散文化表达,让文本兼具严谨性与可读性;AI5.0技术架构则实现多模态数据原生一体化处理,将文本、数据、图表、公式等学术元素深度融合,

Fooocus:重新定义AI绘画的极简主义革命

Fooocus:重新定义AI绘画的极简主义革命 【免费下载链接】FooocusFocus on prompting and generating 项目地址: https://gitcode.com/GitHub_Trending/fo/Fooocus Fooocus是一款专注于提示词创作与图像生成的AI绘画工具,它以极简主义设计理念重新定义了AI绘画的创作流程。无论是新手还是专业创作者,都能通过Fooocus快速生成高质量的艺术作品,无需复杂的参数配置,让创意灵感自由流动。 ✨ 极简设计,极致体验 Fooocus的核心优势在于其简洁直观的操作界面。与传统AI绘画工具相比,Fooocus大幅简化了参数设置,用户只需专注于提示词的构思,即可获得令人惊艳的生成效果。这种"专注创作"的设计理念,让AI绘画变得前所未有的轻松愉快。 项目的核心代码集中在modules/core.py和modules/default_pipeline.py,通过优化的生成流程和智能参数调整,确保用户在享受极简操作的同时,获得专业级的图像质量。 🎨 丰富风格,随心切换 Fooocus内置了多种艺术

MS-SWIFT多模态实战:10分钟云端出图,小白也能玩转AI绘画

MS-SWIFT多模态实战:10分钟云端出图,小白也能玩转AI绘画 你是不是也和我一样,是个热爱设计但被硬件卡住的创作者?最近我在做视觉项目时,特别想试试最新的AI绘画模型,结果一查才发现——RTX 4070显卡要六千多,而我的MacBook连NVIDIA显卡都没有,根本跑不动这些大模型。正当我准备放弃的时候,朋友推荐了一个“神器”:MS-SWIFT + 云端GPU,说只要10分钟就能在云上部署一个支持200+多模态模型的AI绘图环境,而且按小时计费,成本低到一杯奶茶钱就能画一天。 抱着试试看的心态,我真的一键启动了属于自己的AI绘画工作站。从部署到生成第一张图,全程不到10分钟,效果还出乎意料地惊艳!更让我惊喜的是,MS-SWIFT不仅支持Stable Diffusion系列,还能轻松调用像Qwen-VL、InternVL、FLUX等前沿多模态模型,真正实现了“一个平台,百种风格”。 这篇文章就是为你写的——如果你是设计师、插画师、内容创作者,或者只是对AI绘画感兴趣的小白,但苦于没有高性能电脑,那这篇指南一定能帮你零门槛上手AI绘画。我会手把手带你完成整个流程:如何选择镜像、