DeerFlow 2.0:字节开源的超级 Agent 框架,让 AI 真正干活

DeerFlow 2.0:字节开源的超级 Agent 框架,让 AI 真正干活

作者:madprinter
日期:2026-03-24
项目地址:https://github.com/bytedance/deer-flow

项目介绍

DeerFlow(Deep Exploration and Efficient Research Flow)是字节跳动开源的一款超级 Agent 框架。2026 年 2 月 28 日,DeerFlow 2.0 正式发布后迅速登顶 GitHub Trending 榜首,目前已有近 40,000 颗星。

与传统的 AI 框架不同,DeerFlow 不仅仅是一个"聊天机器人",它是一个真正能干活的 Agent 运行环境。它拥有自己的文件系统、沙箱执行环境、长期记忆系统,可以自主规划任务并调度多个子 Agent 协同工作。

为什么 DeerFlow 值得关注?

  1. 大厂背书:字节跳动出品,经过真实业务场景验证
  2. 架构先进:基于 LangGraph 和 LangChain 构建,设计优雅
  3. 功能完整:开箱即用的文件系统、记忆系统、沙箱执行
  4. 高度可扩展:支持自定义技能、工具、MCP 服务器
  5. 多模型支持:兼容 OpenAI API 格式的所有大模型

核心功能

1. 技能系统(Skills)

DeerFlow 的核心是技能系统。每个技能是一个结构化的能力模块,包含工作流程、最佳实践和相关资源引用。

内置技能包括:

  • 🔍 深度研究(Research)
  • 📝 报告生成(Report Generation)
  • 📊 PPT 制作(Slide Creation)
  • 🌐 网页生成(Web Page)
  • 🎨 图片/视频生成(Image/Video Generation)

技能按需加载,不会一次性占用大量上下文,这对 Token 敏感的模型非常友好。

/mnt/skills/public ├── research/SKILL.md ├── report-generation/SKILL.md ├── slide-creation/SKILL.md ├── web-page/SKILL.md └── image-generation/SKILL.md 

2. 子 Agent 系统(Sub-Agents)

复杂任务很少能一次完成。DeerFlow 可以将任务分解,动态生成多个子 Agent 并行执行。

  • 每个子 Agent 有独立的作用域上下文
  • 子 Agent 可以并行执行,提高效率
  • 主 Agent 负责汇总所有结果,生成最终输出

例如:一个研究任务可以分解为十多个子 Agent,每个探索不同角度,最终汇聚成一份完整报告。

3. 沙箱执行环境(Sandbox)

DeerFlow 不只是"说说而已",它有自己的"电脑"——每个任务在独立的 Docker 容器中运行:

  • ✅ 完整的文件系统
  • ✅ Bash 命令执行
  • ✅ 代码运行能力
  • ✅ 图片查看能力
  • ✅ 会话隔离,零污染
/mnt/user-data/ ├── uploads/ # 用户上传的文件 ├── workspace/ # Agent 工作目录 └── outputs/ # 最终交付物 

4. 长期记忆(Long-Term Memory)

大多数 Agent 在对话结束后就忘记一切。DeerFlow 会记住:

  • 用户画像和偏好
  • 技术栈信息
  • 重复的工作流程
  • 历史交互经验

记忆本地存储,完全由用户控制。系统会自动去重,避免重复信息无限累积。

5. 多通道集成(IM Channels)

DeerFlow 支持多种即时通讯工具接入:

通道传输方式难度
TelegramBot API (长轮询)简单
SlackSocket Mode中等
飞书/LarkWebSocket中等

无需公网 IP,所有通道配置后即可自动启动。

6. Claude Code 集成

通过 claude-to-deerflow 技能,可以直接在 Claude Code 中与 DeerFlow 交互:

npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow 

支持的功能:

  • 发送任务并获取流式响应
  • 选择执行模式:flash/fast/standard/pro/ultra
  • 查看健康状态、模型、技能列表
  • 管理对话线程和历史
  • 上传文件进行分析

使用方法

快速开始

1. 克隆项目
git clone https://github.com/bytedance/deer-flow.git cd deer-flow 
2. 生成配置文件
make config 

这会基于模板创建本地配置文件。

3. 配置模型

编辑 config.yaml,配置至少一个模型:

models:-name: gpt-4display_name: GPT-4use: langchain_openai:ChatOpenAI model: gpt-4api_key: $OPENAI_API_KEY max_tokens:4096temperature:0.7-name: openrouter-gemini-2.5-flash display_name: Gemini 2.5 Flash (OpenRouter) use: langchain_openai:ChatOpenAI model: google/gemini-2.5-flash-preview api_key: $OPENAI_API_KEY base_url: https://openrouter.ai/api/v1 
4. 设置 API Key

推荐方式:编辑项目根目录的 .env 文件

TAVILY_API_KEY=your-tavily-api-key OPENAI_API_KEY=your-openai-api-key INFOQUEST_API_KEY=your-infoquest-api-key 
5. 启动服务

Docker 方式(推荐)

make docker-init # 拉取沙箱镜像(只需一次)make docker-start # 启动服务

本地开发方式

make check # 检查依赖makeinstall# 安装依赖make dev # 启动服务

访问:http://localhost:2026

推荐模型

DeerFlow 官方推荐使用以下模型以获得最佳体验:

  • Doubao-Seed-2.0-Code
  • DeepSeek v3.2
  • Kimi 2.5

这些模型支持:

  • 长上下文(100k+ tokens)
  • 强大的推理能力
  • 多模态输入
  • 可靠的工具调用

飞书/钉钉集成示例

config.yaml 中配置:

channels:feishu:enabled:trueapp_id: $FEISHU_APP_ID app_secret: $FEISHU_APP_SECRET slack:enabled:truebot_token: $SLACK_BOT_TOKEN app_token: $SLACK_APP_TOKEN 

.env 中设置对应的密钥即可。

技术架构

DeerFlow 2.0 是完全重写的版本,与 1.x 没有任何代码共享。核心架构:

┌─────────────────────────────────────────┐ │ Gateway (API Gateway) │ ├─────────────────────────────────────────┤ │ LangGraph Agent Server │ ├──────────────┬──────────────┬───────────┤ │ Skills │ Tools │ Memory │ ├──────────────┴──────────────┴───────────┤ │ Sandbox (Docker/K8s) │ └─────────────────────────────────────────┘ 
  • Gateway:统一 API 入口,处理认证、路由、会话管理
  • LangGraph Server:Agent 编排引擎
  • Skills/Tools:可扩展的能力模块
  • Memory:长期记忆存储
  • Sandbox:隔离执行环境

实际应用场景

DeerFlow 已经超越最初的研究工具定位,社区开发者用它实现了:

  • 📊 数据管道自动化
  • 📽️ PPT/幻灯片自动生成
  • 📈 数据看板搭建
  • 📝 内容工作流自动化
  • 🔍 深度市场调研
  • 💻 代码生成和审查

总结

DeerFlow 2.0 代表了一个重要趋势:AI Agent 正在从"聊天"走向"干活"

它不是又一个聊天机器人包装器,而是一个真正能让 AI 执行复杂任务的运行环境。通过沙箱隔离、多 Agent 协作、长期记忆等设计,DeerFlow 解决了传统 Agent 框架的几个关键痛点:

  1. 上下文限制:通过子 Agent 分解和上下文摘要
  2. 执行能力:通过沙箱提供真实的执行环境
  3. 记忆缺失:通过长期记忆系统跨会话学习
  4. 扩展困难:通过技能和 MCP 服务器轻松扩展

如果你正在构建 AI 应用,或者想让 AI 帮你完成实际工作,DeerFlow 绝对值得关注。


相关资源

  • 项目地址:https://github.com/bytedance/deer-flow
  • 官方网站:https://deerflow.tech
  • 中文文档:https://github.com/bytedance/deer-flow/blob/main/README_zh.md
  • InfoQuest 搜索工具:https://docs.byteplus.com/en/docs/InfoQuest/What_is_Info_Quest

Read more

2026年 , 最新的机器人系统架构介绍 (1)

文章目录 * 第一部分:机器人的完整系统架构(由底向上) * 第二部分:最有前景、最具迁移性的核心是什么? * 第三部分:学习与技术路线图 * 标题数据驱动的机器人操作与决策算法 * 工业级机器人系统架构 * 第一部分:生动形象的工业级机器人系统架构 * 第二部分:热门公司技术路线全解析与优劣势对比 * **1. 宇树科技 (Unitree) —— 运动性能的极致派** * **2. 智平方 (AI² Robotics) —— 全栈VLA的实战派** * **3. 银河通用 (Galbot) —— 仿真数据驱动的垂直深耕派** * **4. 逐际动力 (LimX Dynamics) —— OS系统整合派** * **5. 优必选 (UBTECH) —— 全栈技术的老牌劲旅** * 第三部分:总结与你的切入路线图 第一部分:机器人的完整系统架构(由底向上) 我们可以把一个智能机器人系统想象成一个“人体”,从物理接触世界的大脑,分为以下几个层次: 1. 最底层:硬件平台与执行机构

深入解析OpenClaw Skills:从原理到实战,打造专属机器人技能

深入解析OpenClaw Skills:从原理到实战,打造专属机器人技能

一、OpenClaw Skills:机器人行为的“最小执行单元” 1.1 什么是OpenClaw Skills? OpenClaw是面向开源机械爪/小型机器人的控制框架(核心仓库:openclaw/openclaw),旨在降低机器人行为开发的门槛。而Skills(技能) 是OpenClaw框架中对机器人“单一可执行行为”的封装模块——它将机器人完成某一特定动作的逻辑(如“夹取物体”“释放物体”“移动到指定坐标”)抽象为独立、可复用、可组合的代码单元。 简单来说: * 粒度:一个Skill对应一个“原子行为”(如“单指闭合”)或“组合行为”(如“夹取→移动→释放”); * 特性:跨硬件兼容(适配不同型号机械爪)、可插拔(直接集成到OpenClaw主框架)、可扩展(支持自定义参数); * 核心价值:避免重复开发,让开发者聚焦“

把 Vivado 项目放心交给 Git:一篇 FPGA 工程师必读的实战指南

之前分享过一篇文章《FPGA 版本管理三种方式:你会选哪一种?》,评论区很多人都推荐使用Git进行版本管理,今天这篇文章主题就是使用Git进行备份指南。 在 FPGA 开发中,掌握 Git 等源码管理工具已经是必备技能。 当然,在使用 Vivado 时,我们不仅需要处理源代码控制,还需要处理以 IP 为中心的设计产品。 Vivado 的工程通常是 IP 为中心 的设计,包含: * IP Integrator Block Diagram * 各类 IP 实例(独立 IP 或 BD 内 IP) * 自动生成的包装文件与工程产物 这让很多 FPGA 工程师一开始会觉得: “Vivado 项目到底该怎么和 Git 一起用?” 好消息是,从 Vivado

简单通信落地:FPGA 实现 CAN 总线接口与数据帧解析

https://pan.baidu.com/s/1rDsLAXGj8WbX82teSkhuIw?pwd=1234 这份FPGA 系统学习详细资料包是个人花大量时间精心整理的,超多干货全覆盖,从基础到实战一站式搞定,不用再到处薅资料!网盘链接随时可能失效,提取码 1234,先保存再学习,别等失效拍大腿!🔗链接:https://pan.baidu.com/s/1rDsLAXGj8WbX82teSkhuIw?pwd=1234 ———————————————— 简单通信落地:FPGA 实现 CAN 总线接口与数据帧解析 CAN 总线在工业现场和汽车电子中应用极其广泛,它的可靠性、实时性和多主特性是 UART、SPI、I2C 无法比拟的。从零实现一个完整的 CAN 控制器确实有一定复杂度,但掌握核心的数据帧收发和解析能力,就能应对大多数 FPGA 与 CAN 总线交互的场景。下面我带你一步步落地。