AI: 介绍 OpenHarness ,与 Claude Code 比较
OpenHarness 是香港大学数据科学研究院(HKUDS)于 2026年4月初 开源的 轻量级AI智能体驾驭框架(Agent Harness),旨在为大语言模型(LLM)提供工具调用、记忆管理、安全控制等能力,将纯文本模型转变为可执行复杂任务的自主智能体。
一、核心理念
The model is the agent. The code is the harness.(模型即智能体,代码即驾驭框架)
- 模型层 (Agent):负责核心的推理、规划、决策(大脑)。
- 框架层 (Harness):负责工具执行、权限控制、记忆存储、多智能体协同(手脚与管家)。
二、核心优势(对比 Claude Code)
- 极致轻量化:仅 1.17万行Python代码(vs Claude Code 51.2万行TS),体积缩小 44倍。
- 高兼容性:工具覆盖率 98%(43/44),命令覆盖率 61%(54/88),兼容官方插件。
- 完全开源:采用 MIT 许可,代码简洁、易于理解和二次开发。
- 模型无关:不绑定特定API,可接入 Claude、GPT、Kimi 等主流模型。
三、核心功能与架构
OpenHarness 包含 10大子系统,提供完整的智能体运行时环境:
- Agent Loop(核心循环)
实现思考 → 调用工具 → 执行 → 观察结果 → 再思考的标准智能体闭环,支持流式工具调用(边思考边执行)。 - 工具系统 (43种内置工具)
覆盖文件IO、Shell执行、Web搜索、数据爬取、图表生成、MCP协议等。 - 记忆系统
- 工作记忆:管理对话上下文。
- 持久记忆:跨会话存储信息,突破Token限制。
- 安全与治理
- 多级权限控制:精细管控文件路径、命令执行范围。
- 沙箱隔离:防止恶意操作,保障环境安全。
- 可观测性
全链路日志、Token计数、成本追踪、实时状态监控。 - 多智能体协同
支持多个智能体分工合作、信息共享与任务调度。
四、技术栈
- 后端:Python(核心逻辑)
- 前端:React / Ink(提供交互式终端UI)
- 协议:兼容 MCP(Model Control Protocol)、Anthropic Skills 生态
五、适用场景
- AI 研究:快速实验智能体架构、安全机制、工具调用策略。
- 开发者工具:构建下一代 AI 编辑器、代码助手、自动化运维机器人。
- 企业应用:开发数据分析、客户服务、内容创作等领域的自主AI助理。
六、总结
OpenHarness 是当前最简洁、最完整的 Agent Harness 开源实现。它用极小的代码量,提供了媲美商业产品(如 Claude Code)的强大能力,让开发者能轻松为大模型装上“手、眼、记忆和安全边界”,是研究与构建AI智能体的首选基础设施。
项目地址:https://github.com/HKUDS/OpenHarness
OpenHarness 与 Claude Code 比较
OpenHarness 与 Claude Code 核心定位一致(AI Agent 驾驭框架),但在体量、开放性、技术栈、适用场景上差异巨大。简单说:Claude Code 是成熟商业产品,OpenHarness 是轻量开源研究版。
一、核心定位与背景
- Claude Code
- 开发者:Anthropic(商业公司)
- 定位:终端级 AI 编程助手,开箱即用的商业产品
- 目标:服务专业开发者,最大化生产力、稳定性、生态完整
- 本质:闭源服务,深度绑定 Claude 模型生态
- OpenHarness
- 开发者:香港大学 HKUDS(学术团队)
- 定位:轻量级开源 Agent Harness,Claude Code 核心功能的极简实现
- 目标:提供可理解、可修改、可研究的智能体基础设施
- 本质:MIT 开源项目,模型无关、高度可定制
二、技术体量对比(最直观差异)
| 维度 | Claude Code | OpenHarness | 差距 |
|---|---|---|---|
| 代码量 | 51.2 万行 TypeScript | 1.17 万行 Python | 轻 44 倍 |
| 文件数 | 1,884 个 | 163 个 | 精简 11 倍 |
| 工具覆盖 | 44 种内置工具 | 43 种内置工具 | 98% 兼容 |
| 命令覆盖 | 88 条命令 | 54 条命令 | 61% 兼容 |
| 插件生态 | 官方完整生态 | 兼容 12+ 官方插件 | 核心兼容 |
三、核心架构与能力对比
1. 模型兼容性(决定性差异)
- Claude Code:强绑定 Claude 系列模型(Opus/Sonnet/Haiku),无法接入其他模型。
- OpenHarness:完全模型无关,标准 API 接入。支持 Claude、GPT、Kimi、Gemini 及本地开源模型。
2. 核心功能(能力接近)
两者共享 Agent Harness 核心理念:Model (大脑) + Harness (手脚/记忆/安全)。
- 共同能力:
- ✅ 标准
思考 → 调用工具 → 执行 → 观察智能体循环 - ✅ 文件 IO、Shell 执行、Web 搜索、MCP 协议
- ✅ 上下文记忆、持久化、Token 追踪
- ✅ 权限控制、安全沙箱
- ✅ 兼容 Skills 与插件系统
- ✅ 标准
- Claude Code 独有(企业级):
- 复杂多模态、长上下文(200k+)深度优化
- 完整 IDE 插件(VS Code/JetBrains)
- 企业级 SSO、OAuth、精细权限、审计日志
- 官方技术支持、7x24 稳定性保障
- OpenHarness 独有(研究级):
- 流式工具调用(边思考边执行)
- 并行工具执行
- 极简架构,极易二次开发
- 完全透明的权限与 Hook 系统
四、技术栈与部署
- Claude Code
- 语言:TypeScript(后端)+ 原生客户端
- 部署:闭源服务,需订阅、联网使用
- 环境:终端 + IDE 插件,跨平台(macOS/Linux/Windows)
- OpenHarness
- 语言:Python(核心)+ React/Ink(CLI UI)
- 部署:完全开源,本地一键部署
- 环境:纯 Python 环境,依赖极少,轻量快速
五、适用人群与场景
选择 Claude Code 如果你:
- 是专业开发者,需要开箱即用、稳定可靠的 AI 编程助手
- 深度使用 Claude 模型,追求最佳协同体验
- 需要企业级功能、安全合规、官方支持
- 不想折腾,专注开发而非研究框架
选择 OpenHarness 如果你:
- 是研究者/学生,想学习、读懂、修改 Agent 底层原理
- 是极客/开发者,需要高度定制、多模型自由切换
- 希望本地部署、完全掌控数据,无隐私顾虑
- 用于轻量自动化、CI/CD、研究实验,追求极简高效
六、总结
- Claude Code:功能最全、生态最成熟、体验最佳的商业级 AI 编程代理,但封闭、昂贵、绑定模型、代码黑盒。
- OpenHarness:开源、轻量、模型无关、高度可定制的研究级框架,用 1/44 的代码量实现了 98% 的核心能力,是学习与定制的首选。
一句话选择:干活用 Claude Code,研究/定制用 OpenHarness。
OpenHarness 的快速安装与配置指南
下面给你一份最精简、能直接跑起来的 OpenHarness 快速上手指南,照着复制粘贴即可。
环境:Python 3.9+,Windows / macOS / Linux 通用。
1. 克隆项目
git clone https://github.com/HKUDS/OpenHarness.git cd OpenHarness 2. 创建虚拟环境(推荐)
python -m venv harness 激活环境:
- Windows
harness\Scripts\activate - macOS / Linux
source harness/bin/activate 3. 安装依赖
pip install-r requirements.txt 4. 配置模型 API Key
复制配置模板:
cp config.example.yaml config.yaml 打开 config.yaml,填入你想用的模型 key,例如:
llm:provider: openai # 可选 openai / anthropic / deepseek / ollamaapi_key: sk-xxxxxxxxxxxxxxxxxxxxxxxx model: gpt-3.5-turbo base_url: https://api.openai.com/v1 # 国内可填代理地址支持:
- OpenAI
- Anthropic Claude
- 本地 Ollama
- 通义千问、DeepSeek 等
5. 一键启动
python main.py 启动成功后,你会进入一个交互式 AI Agent 终端,可以直接让它:
- 读写文件
- 执行 shell 命令
- 搜索网页
- 写代码、运行代码
- 规划复杂任务
6. 简单测试指令
你可以直接输入:
列出当前目录文件 或
创建一个 hello.py 并运行它 Agent 会自动调用工具完成。
7. 与 Claude Code 对比体验(最直观)
| 功能 | Claude Code | OpenHarness |
|---|---|---|
| 模型绑定 | 只能 Claude | 任意模型 |
| 代码量 | 51 万行 TS | 1.1 万行 Python |
| 本地部署 | 不支持 | 完全支持 |
| 工具覆盖 | 100% | 约 98% |
| 权限沙箱 | 强 | 中等 |
| 二次开发 | 不可能 | 非常简单 |
| 适合人群 | 日常开发 | 研究、魔改、本地隐私场景 |
OpenHarness 完整技术架构
OpenHarness 是一个极简、分层、模块化的 Agent 驾驭框架,核心设计思想是:
模型只负责思考决策,框架负责执行、安全、记忆、工具。
整体采用经典分层架构 + 事件驱动,代码只有 1 万多行,非常容易读懂。
一、整体架构分层
从上到下共 5 层:
- 交互层(Interface Layer)
- Agent 核心循环层(Agent Core Layer)
- 能力扩展层(Capability Layer)
- 执行引擎层(Execution Engine)
- 基础支撑层(Infrastructure Layer)
二、每层详细结构
1)交互层 Interface Layer
负责与用户交互,不参与核心逻辑。
- 终端 CLI(基于 Ink/React)
- 流式输出
- 命令解析
- 历史记录与回显
入口:
main.pycli/
2)Agent 核心循环层(大脑)
整个框架的心脏,实现标准 ReAct 流程:
Think → Act → Observe → Reflect → Repeat
核心组件
- AgentLoop:主循环调度器
- Planner:任务规划器(复杂任务拆分)
- PromptEngine:提示词模板与结构化输出
- StateMachine:状态管理(idle / thinking / acting / error)
数据流:
用户输入 → 意图理解 → 规划 → 调用工具 → 执行结果 → 总结回复
3)能力扩展层(手脚)
OpenHarness 最核心的一层,对标 Claude Code 的工具系统。
3.1 工具系统 Tool System
内置 43+ 工具,统一接口:
- 文件系统(read/write/mkdir/rm)
- Shell 命令执行
- Web 搜索 & 爬虫
- 代码运行(Python/JS/Shell)
- 数据处理(CSV/JSON/图表)
- MCP 协议兼容
所有工具统一抽象为:
def run(parameters) → Result[success, output, error] 3.2 记忆系统 Memory
- WorkingMemory:短期上下文(对话历史)
- PersistentMemory:长期存储(文件/DB)
- VectorMemory(可选):向量检索
3.3 安全与权限
- Path 白名单
- 命令黑名单
- 沙箱隔离
- 操作确认机制
4)执行引擎层 Execution Engine
负责真正执行危险/系统操作,与核心逻辑解耦。
- CommandExecutor:命令执行器
- FileIOEngine:文件操作
- Sandbox:沙箱环境
- ToolInvoker:工具调用分发器
特点:
- 所有系统操作收口在此
- 方便替换、监控、审计
5)基础支撑层 Infrastructure
- 配置系统(config.yaml)
- 日志系统
- Token 计算与计费
- 异常捕获
- LLM 适配器(适配不同模型)
三、核心模块依赖图(极简版)
User → CLI → AgentLoop → Planner → ToolSystem → ExecutionEngine ↓ LLMAdapter ← PromptEngine ← Memory ← Security 四、与 Claude Code 架构的关键区别
| 模块 | OpenHarness | Claude Code |
|---|---|---|
| 语言 | Python | TypeScript |
| 架构 | 分层模块化 | 高度封装服务化 |
| 模型绑定 | 无,支持任意 LLM | 强绑定 Claude |
| 工具系统 | 轻量统一接口 | 复杂内置生态 |
| 安全 | 基础沙箱 | 企业级权限治理 |
| 扩展性 | 极高,易改 | 极低,闭源 |