DeerFlow 2.0：字节开源的超级 Agent 框架，让 AI 真正干活

优质文章学习记录

07 Apr 2026 — 6 min read

DeerFlow 2.0：字节开源的超级 Agent 框架，让 AI 真正干活

作者：madprinter
日期：2026-03-24
项目地址：https://github.com/bytedance/deer-flow

项目介绍

DeerFlow（Deep Exploration and Efficient Research Flow）是字节跳动开源的一款超级 Agent 框架。2026 年 2 月 28 日，DeerFlow 2.0 正式发布后迅速登顶 GitHub Trending 榜首，目前已有近 40,000 颗星。

与传统的 AI 框架不同，DeerFlow 不仅仅是一个"聊天机器人"，它是一个真正能干活的 Agent 运行环境。它拥有自己的文件系统、沙箱执行环境、长期记忆系统，可以自主规划任务并调度多个子 Agent 协同工作。

为什么 DeerFlow 值得关注？

大厂背书：字节跳动出品，经过真实业务场景验证
架构先进：基于 LangGraph 和 LangChain 构建，设计优雅
功能完整：开箱即用的文件系统、记忆系统、沙箱执行
高度可扩展：支持自定义技能、工具、MCP 服务器
多模型支持：兼容 OpenAI API 格式的所有大模型

核心功能

1. 技能系统（Skills）

DeerFlow 的核心是技能系统。每个技能是一个结构化的能力模块，包含工作流程、最佳实践和相关资源引用。

内置技能包括：

🔍 深度研究（Research）
📝 报告生成（Report Generation）
📊 PPT 制作（Slide Creation）
🌐 网页生成（Web Page）
🎨 图片/视频生成（Image/Video Generation）

技能按需加载，不会一次性占用大量上下文，这对 Token 敏感的模型非常友好。

/mnt/skills/public ├── research/SKILL.md ├── report-generation/SKILL.md ├── slide-creation/SKILL.md ├── web-page/SKILL.md └── image-generation/SKILL.md

2. 子 Agent 系统（Sub-Agents）

复杂任务很少能一次完成。DeerFlow 可以将任务分解，动态生成多个子 Agent 并行执行。

每个子 Agent 有独立的作用域上下文
子 Agent 可以并行执行，提高效率
主 Agent 负责汇总所有结果，生成最终输出

例如：一个研究任务可以分解为十多个子 Agent，每个探索不同角度，最终汇聚成一份完整报告。

3. 沙箱执行环境（Sandbox）

DeerFlow 不只是"说说而已"，它有自己的"电脑"——每个任务在独立的 Docker 容器中运行：

✅ 完整的文件系统
✅ Bash 命令执行
✅ 代码运行能力
✅ 图片查看能力
✅ 会话隔离，零污染

/mnt/user-data/ ├── uploads/ # 用户上传的文件 ├── workspace/ # Agent 工作目录 └── outputs/ # 最终交付物

4. 长期记忆（Long-Term Memory）

大多数 Agent 在对话结束后就忘记一切。DeerFlow 会记住：

用户画像和偏好
技术栈信息
重复的工作流程
历史交互经验

记忆本地存储，完全由用户控制。系统会自动去重，避免重复信息无限累积。

5. 多通道集成（IM Channels）

DeerFlow 支持多种即时通讯工具接入：

通道	传输方式	难度
Telegram	Bot API (长轮询)	简单
Slack	Socket Mode	中等
飞书/Lark	WebSocket	中等

无需公网 IP，所有通道配置后即可自动启动。

6. Claude Code 集成

通过 claude-to-deerflow 技能，可以直接在 Claude Code 中与 DeerFlow 交互：

npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

支持的功能：

发送任务并获取流式响应
选择执行模式：flash/fast/standard/pro/ultra
查看健康状态、模型、技能列表
管理对话线程和历史
上传文件进行分析

使用方法

快速开始

1. 克隆项目

git clone https://github.com/bytedance/deer-flow.git cd deer-flow

2. 生成配置文件

make config

这会基于模板创建本地配置文件。

3. 配置模型

编辑 config.yaml，配置至少一个模型：

models:-name: gpt-4display_name: GPT-4use: langchain_openai:ChatOpenAI model: gpt-4api_key: $OPENAI_API_KEY max_tokens:4096temperature:0.7-name: openrouter-gemini-2.5-flash display_name: Gemini 2.5 Flash (OpenRouter) use: langchain_openai:ChatOpenAI model: google/gemini-2.5-flash-preview api_key: $OPENAI_API_KEY base_url: https://openrouter.ai/api/v1

4. 设置 API Key

推荐方式：编辑项目根目录的 .env 文件

TAVILY_API_KEY=your-tavily-api-key OPENAI_API_KEY=your-openai-api-key INFOQUEST_API_KEY=your-infoquest-api-key

5. 启动服务

Docker 方式（推荐）：

make docker-init # 拉取沙箱镜像（只需一次）make docker-start # 启动服务

本地开发方式：

make check # 检查依赖makeinstall# 安装依赖make dev # 启动服务

访问：http://localhost:2026

飞书/钉钉集成示例

在 config.yaml 中配置：

channels:feishu:enabled:trueapp_id: $FEISHU_APP_ID app_secret: $FEISHU_APP_SECRET slack:enabled:truebot_token: $SLACK_BOT_TOKEN app_token: $SLACK_APP_TOKEN

在 .env 中设置对应的密钥即可。

技术架构

DeerFlow 2.0 是完全重写的版本，与 1.x 没有任何代码共享。核心架构：

┌─────────────────────────────────────────┐ │ Gateway (API Gateway) │ ├─────────────────────────────────────────┤ │ LangGraph Agent Server │ ├──────────────┬──────────────┬───────────┤ │ Skills │ Tools │ Memory │ ├──────────────┴──────────────┴───────────┤ │ Sandbox (Docker/K8s) │ └─────────────────────────────────────────┘

Gateway：统一 API 入口，处理认证、路由、会话管理
LangGraph Server：Agent 编排引擎
Skills/Tools：可扩展的能力模块
Memory：长期记忆存储
Sandbox：隔离执行环境

实际应用场景

DeerFlow 已经超越最初的研究工具定位，社区开发者用它实现了：

📊 数据管道自动化
📽️ PPT/幻灯片自动生成
📈 数据看板搭建
📝 内容工作流自动化
🔍 深度市场调研
💻 代码生成和审查

总结

DeerFlow 2.0 代表了一个重要趋势：AI Agent 正在从"聊天"走向"干活"。

它不是又一个聊天机器人包装器，而是一个真正能让 AI 执行复杂任务的运行环境。通过沙箱隔离、多 Agent 协作、长期记忆等设计，DeerFlow 解决了传统 Agent 框架的几个关键痛点：

上下文限制：通过子 Agent 分解和上下文摘要
执行能力：通过沙箱提供真实的执行环境
记忆缺失：通过长期记忆系统跨会话学习
扩展困难：通过技能和 MCP 服务器轻松扩展

如果你正在构建 AI 应用，或者想让 AI 帮你完成实际工作，DeerFlow 绝对值得关注。

相关资源：

项目地址：https://github.com/bytedance/deer-flow
官方网站：https://deerflow.tech
中文文档：https://github.com/bytedance/deer-flow/blob/main/README_zh.md
InfoQuest 搜索工具：https://docs.byteplus.com/en/docs/InfoQuest/What_is_Info_Quest

JavaScript前端对接OCR服务：Ajax异步请求处理识别结果

JavaScript前端对接OCR服务：Ajax异步请求处理识别结果 📖 项目简介与技术背景随着数字化办公和智能文档处理需求的快速增长，OCR（Optical Character Recognition，光学字符识别）技术已成为前端智能化的重要一环。无论是发票识别、证件扫描还是路牌文字提取，用户期望通过简单的图片上传即可快速获取结构化文本信息。传统的OCR方案多依赖本地重型软件或云端闭源服务，存在部署复杂、成本高、响应慢等问题。为此，本项目推出一款轻量级、高精度、支持中英文识别的通用OCR服务，基于 CRNN（Convolutional Recurrent Neural Network）模型构建，专为无GPU环境优化，适用于资源受限但对识别质量有要求的场景。该服务不仅提供直观的 WebUI 操作界面，更开放了标准化的 RESTful API 接口，便于前端开发者通过 JavaScript 发起 Ajax 请求，实现无缝集成。本文将重点讲解如何使用原生 fetch 或 jQuery 的 $.ajax

Docker 部署 OpenClaw 踩坑实录：Web UI 访问、飞书配对及自定义模型配置

最近在使用 Docker 部署 OpenClaw 时遇到了一些典型的环境与配置问题。为了方便大家排查，我将这几个核心问题的表现、解决思路以及如何接入公司自己配置的大模型节点进行了梳理。一、问题一：安装成功但 Web UI 无法访问 1. 现象描述 * 终端提示安装成功，但在浏览器中访问http://127.0.0.1:18789 时，页面提示连接被重置。 * 使用具体的局域网 IP（如192.168.5.30:18789）访问时，同样提示无法连接或无法访问此网站。 2. 原因分析 * 在排除了代理服务器和系统防火墙的干扰后，根本原因在于 OpenClaw 核心网关的跨域访问（CORS）安全机制。 * 系统默认包含白名单配置，它的作用是告诉 OpenClaw 的核心网关：“只有从这些特定的网址（域名或IP）打开的控制台网页，才被允许连接我并下发控制指令”

【前端】使用Vue3过程中遇到加载无效设置点击方法提示不存在的情况，原来是少加了一个属性

🌹欢迎来到《小5讲堂》🌹 🌹这是《前端》系列文章，每篇文章将以博主理解的角度展开讲解。🌹 🌹温馨提示：博主能力有限，理解水平有限，若有不对之处望指正！🌹 目录 * 前言 * 提示报错 * 问题分析 * 1. **Options API vs Composition API 风格差异** * ✅ **Options API 写法（方法直接放在外面）** * ✅ **Composition API 写法（方法必须在 setup 中定义）** * ✅ **`<script setup>` 语法糖（最简洁的 Composition API）** * 2. **为什么你的代码会报错？** * 3. **解决方案** * 方案 1：改用 **Options API**（适合从 Vue

MC.JS WEBMC1.8实战：构建在线多人沙盒游戏

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 输入框内输入如下内容：开发一个基于MC.JS WEBMC1.8的多人在线沙盒游戏。使用WebSocket实现实时通信，允许多个玩家在同一地图上建造和互动。游戏需要包含用户注册登录系统，玩家可以创建或加入房间，实时看到其他玩家的操作。地图数据需要存储在服务器端，并支持基本的方块类型（如泥土、石头、木材）。前端界面要简洁直观，包含聊天功能。 1. 点击'项目生成'按钮，等待项目生成完整后预览效果最近尝试用MC.JS WEBMC1.8开发了一个多人在线沙盒游戏，整个过程既有趣又充满挑战。下面分享下我的实战经验，希望能给想尝试类似项目的朋友一些参考。 1. 项目架构设计这个游戏的核心是让多个玩家能实时互动，所以采用了前后端分离的架构。前端用HTML5+CSS3搭建界面，后端用Node.js处理逻辑，

DeerFlow 2.0：字节开源的超级 Agent 框架，让 AI 真正干活

优质文章学习记录