AI Harness 工程：Agent 能跑起来的那一层到底是什么？

优质文章学习记录

10 Apr 2026 — 7 min read

AI Harness 工程的崛起——Agent 真正跑起来的那一层

关于构建 AI Agent，业界通常谈的是三种架构路径：SDK、Frameworks、Scaffolding。这三种方式各自站在灵活性与结构性的不同位置，也各有适用场景。

但 2026 年悄悄冒出了第四种模式，而且直接架在这三种之上——它叫 Harness。

OpenAI 和 Anthropic 现在都正式用了这个词。Martin Fowler 写过专门分析它的文章，arXiv 上也有论文给出了形式化定义。这不是什么炒作出来的新词，而是那层一直缺位、却决定 AI Agent 能不能在生产环境里真正跑起来的架构层。

Harness 到底是什么？

先把一件事说清楚：Harness 不是 Agent 本身。

它是管理 Agent 如何运行的那套软件系统，负责处理完整的生命周期——工具调用、内存、重试、人工审批、上下文工程、子 Agent……让模型可以专心做推理，其他的一概不用操心。

Philipp Schmid 用了一个很贴切的计算机类比来解释这件事：

模型是原始的处理能力，上下文窗口是有限的工作内存，而 Harness 就是操作系统——管上下文、管初始化序列、管标准工具驱动。Agent 则是跑在这一切之上的应用程序。

这个比喻非常准，一下子就把关系理清楚了。

它跟 SDK、Framework、Scaffolding 是什么关系？

SDK、Scaffolding、Framework 回答的是同一个问题：怎么把 Agent 造出来？

Harness 回答的是一个完全不同的问题：Agent 造出来之后，怎么让它安全、稳定地跑？

这两件事不是替代关系——你完全可以用 Framework 来构建一个 Harness，它们处于不同的层次。四种方式的对比关系如下图：

Harness 有哪些核心组件？

parallel.ai 的团队梳理出了六个核心组件，这也跟 OpenAI 和 Anthropic 官方发布的内容高度一致：

工具集成层，通过定义好的协议把模型接入外部 API、数据库、代码执行环境和各种自定义工具。

内存与状态管理，多层内存体系——工作上下文、会话状态、长期记忆——在单个上下文窗口之外做持久化。Anthropic 的做法是用进度文件和 git 历史来桥接不同的会话，让 Agent 在切换任务后还知道自己在哪、做到哪了。

上下文工程与提示管理，不是一堆写死的提示模板，而是根据当前任务状态动态决定每次模型调用时塞进去什么信息——主动选择，而不是全部照单全收。

规划与任务分解，引导模型一步一步走结构化的任务序列，而不是试图一口气搞定所有事情。

验证与防护，格式验证、安全过滤、自我纠错循环。当 Agent 卡住的时候，Harness 把它当成一个信号——说明有什么东西缺了，而不是直接报错崩掉。

模块化与可扩展性，各个组件可以独立开关、独立替换，插拔式设计，改一个不影响其他的。

真实生产中的 Harness 长什么样？

Claude Code 就是一个典型的 Harness。

它读取整个代码库，管理文件系统访问，调度子 Agent，处理工具编排，跨会话维护内存，还内置了各种防护。开发者只需要专注于任务本身，其他的 Harness 全部兜着。

OpenAI Codex 也是。

他们的团队用这套 Harness 工程方式，搭出了一个超过 100 万行的代码库，全程没有一行手动输入的代码。Harness 是主要接口，当 Agent 遇到问题，反馈会直接流回代码库，推动上下文工程和架构约束的持续迭代。

OpenAI 的 CUA 示例应用（计算机使用场景下的 Harness）中，Runner 管理的是"截图 → 操作 → 验证 → 再循环"这个完整闭环。模型负责决定做什么，Harness 负责安全地把它执行出来。

Framework 层正在被 Harness 吞掉

有一个很值得关注的趋势：传统 Framework 处理的那些事情，正在被模型本身吸收。

Agent 定义、消息路由、任务生命周期、依赖管理、生成工作进程——以前开发者用 Framework 来搞定这些，但现在大约 80% 的这类功能，模型已经原生支持了。

剩下那 20%——持久性、确定性重放、成本控制、可观察性、错误恢复——正好是 Harness 负责的部分。

Framework 层不只是在消失，它在分裂：智能进入模型，基础设施进入 Harness。

Harness 与 Framework 的核心区别也很清晰：Framework 告诉开发者怎么构建应用，Harness 告诉 Agent 怎么安全运行。用 Framework 时，开发者写编排逻辑；用 Harness 时，模型自己制定计划，Harness 保持它不翻车。

现在构建 AI Agent，问题变了

以前大家问的是：用哪个 Framework？

现在更关键的问题是：Harness 应该长什么样？

Harness 决定了 Agent 是成功还是失败。好的 Harness 能管住人工审批、文件系统访问、工具编排、子 Agent、提示和完整的生命周期，干预最少，但能挡住灾难性失败。

落地建议也很实在：从简单的地方开始，先把原子工具做扎实，让模型来制定计划，再逐步加上防护、重试和验证机制。这就是 Harness 工程的基本思路。

最后说一种特殊形态

值得单独提一下的是 Markdown/Prompt Harness，比如 Anthropic 的 CLAUDE.md 技能文件，它把编排指令直接嵌进系统提示或结构化的 Markdown 文件里。

这种方式下，LLM 本身就成了循环控制器——它读取 Harness 规则，然后照着执行。当模型足够强、能做到自我引导，而且你需要快速迭代、不想每次都改代码的时候，这是个相当好用的选择。

原文：The Rise of AI Harness Engineering

Windows纯本地部署OpenClaude：从零搭建你的7×24小时AI助理，打通微信/飞书

无需云服务器，一台Windows电脑就能让AI助手24小时在线，还能通过手机随时指挥它干活前言之前写过一篇用云服务器部署OpenClaude的教程，不少读者反馈：“一定要买服务器吗？我只有一台Windows电脑行不行？” 答案是：当然可以！ OpenClaude本来就是完全支持本地部署的开源AI助手框架。你只需要一台Windows电脑，就能跑起一个完整的AI服务，而且可以通过微信、飞书随时随地指挥它——查文件、开软件、管理电脑，甚至让它在你睡觉的时候帮你处理任务。这篇文章将手把手教你在Windows环境纯本地部署OpenClaude，并打通飞书和企业微信，全程不需要买云服务器。一、先搞懂：三种部署方式，你选哪个？ OpenClaude支持三种部署模式，先看这张图快速理解区别：部署方式架构优点缺点本地部署全在本地电脑无需服务器、免费、隐私安全电脑关机AI就下线云端部署全在云服务器7×24小时在线、稳定需要付费买服务器混合部署云端大脑+本地手脚24小时在线+能操作本地电脑架构复杂、需要两台机器本文选择第一种：纯本地部署。虽然电脑关机时AI会下线，但

宏智树AI：ChatGPT学术版驱动，重塑学术写作新生态

在学术研究的赛道上，低效的文献梳理、繁琐的数据处理、严苛的学术规范，常让科研工作者与高校师生陷入创作困境。宏智树AI（官网：www.hzsxueshu.com），一款由ChatGPT学术版模型深度驱动、搭载AI5.0技术架构的专业学术智能解决方案平台，专为论文写作场景量身打造，以“全流程覆盖、高精准赋能、强合规保障”为核心，构建从大纲生成到定稿答辩的一站式学术服务体系，让学术创作告别低效内耗，回归研究本质。一、顶尖技术底座：AI5.0+ChatGPT学术版，定义智能学术新高度宏智树AI的核心竞争力，源于业内领先的双重技术赋能，打破传统学术工具的性能边界，实现从“文字生成”到“学术赋能”的跨越式升级。 ChatGPT学术版模型赋予平台精准的语义理解与逻辑推理能力，深度契合文、理、工、医等全学科学术写作范式，杜绝口语化、散文化表达，让文本兼具严谨性与可读性；AI5.0技术架构则实现多模态数据原生一体化处理，将文本、数据、图表、公式等学术元素深度融合，

Fooocus：重新定义AI绘画的极简主义革命

Fooocus：重新定义AI绘画的极简主义革命【免费下载链接】FooocusFocus on prompting and generating 项目地址: https://gitcode.com/GitHub_Trending/fo/Fooocus Fooocus是一款专注于提示词创作与图像生成的AI绘画工具，它以极简主义设计理念重新定义了AI绘画的创作流程。无论是新手还是专业创作者，都能通过Fooocus快速生成高质量的艺术作品，无需复杂的参数配置，让创意灵感自由流动。 ✨ 极简设计，极致体验 Fooocus的核心优势在于其简洁直观的操作界面。与传统AI绘画工具相比，Fooocus大幅简化了参数设置，用户只需专注于提示词的构思，即可获得令人惊艳的生成效果。这种"专注创作"的设计理念，让AI绘画变得前所未有的轻松愉快。项目的核心代码集中在modules/core.py和modules/default_pipeline.py，通过优化的生成流程和智能参数调整，确保用户在享受极简操作的同时，获得专业级的图像质量。 🎨 丰富风格，随心切换 Fooocus内置了多种艺术

MS-SWIFT多模态实战：10分钟云端出图，小白也能玩转AI绘画

MS-SWIFT多模态实战：10分钟云端出图，小白也能玩转AI绘画你是不是也和我一样，是个热爱设计但被硬件卡住的创作者？最近我在做视觉项目时，特别想试试最新的AI绘画模型，结果一查才发现——RTX 4070显卡要六千多，而我的MacBook连NVIDIA显卡都没有，根本跑不动这些大模型。正当我准备放弃的时候，朋友推荐了一个“神器”：MS-SWIFT + 云端GPU，说只要10分钟就能在云上部署一个支持200+多模态模型的AI绘图环境，而且按小时计费，成本低到一杯奶茶钱就能画一天。抱着试试看的心态，我真的一键启动了属于自己的AI绘画工作站。从部署到生成第一张图，全程不到10分钟，效果还出乎意料地惊艳！更让我惊喜的是，MS-SWIFT不仅支持Stable Diffusion系列，还能轻松调用像Qwen-VL、InternVL、FLUX等前沿多模态模型，真正实现了“一个平台，百种风格”。这篇文章就是为你写的——如果你是设计师、插画师、内容创作者，或者只是对AI绘画感兴趣的小白，但苦于没有高性能电脑，那这篇指南一定能帮你零门槛上手AI绘画。我会手把手带你完成整个流程：如何选择镜像、