字节开源 DeerFlow 2.0——登顶 GitHub Trending 1，让 AI 可做任何事情

优质文章学习记录

05 Apr 2026 — 9 min read

打开 deerflow 的官网，瞬间被首页的这段文字震撼到了，do anything with deerflow。让 agent 做任何事情，这让我同时想到了 openclaw 刚上线时场景。

字节跳动将 DeerFlow 彻底重写，发布 2.0 版本，并在发布当天登上 GitHub Trending 第一名。这不是一次功能迭代，而是一次从"深度研究框架"到"Super Agent 运行时基础设施"的彻底蜕变。

背景：从 v1 到 v2，发生了什么？

DeerFlow（Deep Exploration and Efficient Research Flow）最初是一个专注于深度研究的 AI 框架——给它一个问题，它会搜索、整理、输出报告。

但社区的玩法远超出了设计者的想象。开发者们拿它搭数据流水线、生成演示文稿、自动化内容生产、快速起 dashboard……这让团队意识到，DeerFlow 从一开始就不只是"研究工具"，它更像一个让 Agent 真正把事情做完的运行环境。

核心变化

DeerFlow 2.0 与 v1 没有共用任何代码，是一次彻底重写。旧版（Deep Research 框架）依然保留在 1.x 分支；主开发线已全面转向 2.0。

它到底是什么？

官方给出的定位是 Super Agent Harness（超级 Agent 调度框架）。这个词听起来抽象，拆开来理解其实很清晰。

现在的 DeerFlow 2.0 不再仅仅是一个跑研究报告的工具，它进化成了一个 Harness（挂架/系统平台）。

什么是 Harness？ 想象一下，大模型（如 DeepSeek, Kimi, Doubao）是发动机，而 DeerFlow 就是那台复杂的 F1 赛车底盘。它把 Sub-agents（子智能体）、Memory（记忆）、Sandbox（沙箱） 和 Skills（技能） 完美地挂载在一起。

开发者视角： 以往我们要写一个 Agent，需要处理繁琐的上下文管理、文件读写权限、多任务并行。DeerFlow 2.0 直接把这些基础设施“标准化”了。

五大核心特性深度解析

① Skills — Agent 能力的"乐高积木"

Skills 是 DeerFlow 能完成几乎任何事情的秘密武器。一个标准 Skill 通常就是一个 Markdown 文件，定义了工作流、最佳实践和参考资源。DeerFlow 内置了研究、报告生成、演示文稿制作、网页生成、图像/视频生成等场景的 Skill。

关键设计是按需渐进加载：不会一次性把所有 Skill 塞进上下文，只有任务确实需要时才加载，有效控制 Token 消耗。

Claude Code 深度集成：通过 claude-to-deerflow skill， 你可以直接在 Claude Code 终端里和运行中的 DeerFlow  实例交互——发送研究任务、查看状态、管理 threads，全程不用离开终端。 安装 CLAUDE CODE 集成 SKILL npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

② Sub-Agents — 并行执行复杂任务

传统 Agent 对于复杂任务的处理方式是"一条线走到底"，DeerFlow 不同：Lead Agent 会先拆解任务，然后动态拉起多个 Sub-Agent，条件允许时并行运行，最后汇总成完整输出。

一个典型的研究任务可以被拆成十几个 Sub-Agent，分别探索不同方向，最终合并成报告、网站或带生成视觉内容的演示文稿。这也是 DeerFlow 能处理"从几分钟到几小时"任务的原因。

③ Sandbox 文件系统 — Agent 有了自己的"电脑"

这是 DeerFlow 和"带工具的聊天机器人"之间最根本的差别：Agent 有一台真正的"电脑"。

每个任务运行在隔离的 Docker 容器里，内有完整文件系统：

/mnt/user-data/

Agent 可以读写编辑文件、执行 Bash 命令和代码、查看图片，全程在 Sandbox 内完成，可审计、隔离，不同 session 之间互不污染。

④ Context Engineering — 长任务不"忘事"

DeerFlow 在上下文管理上做了两件事：

01：Sub-Agent 上下文隔离：每个 Sub-Agent 只看到自己的上下文，不会被主 Agent 或其他 Sub-Agent 的信息干扰，保持专注。

02：摘要压缩：在单个 session 内，主动总结已完成的子任务、把中间结果转存到文件系统、压缩暂时不重要的信息，在长链路任务里也能保持聚焦，不会轻易打爆上下文窗口。

⑤ 长期记忆 — 越用越了解你

大多数 Agent 结束对话后一切归零，DeerFlow 2.0 跨 session 会逐步积累关于你的持久记忆：个人偏好、知识背景、写作风格、技术栈、重复出现的工作流。记忆保存在本地，控制权始终在你手里。

多端接入：不只是终端工具

DeerFlow 2.0 支持通过 IM 应用直接下发任务，无需公网 IP：

渠道      传输方式                上手难度 Telegram Bot API（Long-polling） 简单 Slack Socket Mode               中等 飞书 / Lark WebSocket            中等

连接后，你可以直接在聊天窗口里使用 /new、/models、/memory 等命令和 DeerFlow 交互，普通消息则作为自然语言任务处理。

快速上手：10 分钟跑起来

推荐使用 Docker 方式，最省心：

克隆并初始化 git clone https://github.com/bytedance/deer-flow.git cd deer-flow make config # 生成本地配置文件 编辑 CONFIG.YAML 配置模型 models: - name: gpt-4 display_name: GPT-4 use: langchain_openai:ChatOpenAI model: gpt-4 api_key: $OPENAI_API_KEY max_tokens: 4096 temperature: 0.7 DOCKER 启动（推荐） make docker-init # 首次拉取 sandbox 镜像 make docker-start # 启动服务 # 访问 http://localhost:2026

一句话交给 CODING AGENT

如果你在用 Claude Code、Cursor 或 Codex，可以直接把这句话发给它，让 Agent 帮你完成安装：

"如果还没 clone DeerFlow，就先 clone， 然后按照 https://raw.githubusercontent.com/bytedance/deer-flow/main/Install.md 把它的本地开发环境初始化好"

Python SDK 内嵌使用

不想启动完整 HTTP 服务？DeerFlow 也可以作为 Python 库直接使用：

from deerflow.client import DeerFlowClient client = DeerFlowClient() # 普通对话 response = client.chat("帮我分析这篇论文", thread_id="my-thread") # 流式输出 for event in client.stream("最新的 AI Agent 趋势"): if event.type == "messages-tuple" and event.data.get("type") == "ai": print(event.data["content"]) # 管理能力 models = client.list_models() skills = client.list_skills() client.upload_files("thread-1", ["./report.pdf"])

DeerFlow 具备系统指令执行、文件读写等高权限能力，默认仅建议在本地可信环境（127.0.0.1）部署。若需跨设备访问，务必配置 IP 白名单、前置身份验证（Nginx 反向代理）或网络隔离（VLAN）等安全措施。

总结：Super Agent 时代的基础设施

DeerFlow 2.0 真正有趣的地方，不在于它能做什么——而在于它如何把"做事"这件事本身系统化了。

大多数 Agent 项目解决的是"用 LLM 完成任务"的问题，而 DeerFlow 解决的是更底层的问题：如何给 Agent 一个真实可靠的运行环境，让它有文件系统、有记忆、有工具、有并行执行能力，最终真正把复杂的、需要小时级才能完成的任务落地。

这是从 ChatBot 到 Agent 的本质跃迁，而 DeerFlow 2.0，是目前开源社区里走得最彻底的那个。

更多transformer，VIT，swin tranformer 参考头条号：人工智能研究所 v号：人工智能研究Suo, 启示AI科技

动画详解transformer 在线视频教程

AI 编程新王 Codex 全面上手指南

AI 编程新王 Codex 全面上手指南一篇文章带你精通 Codex 四大环境 + 免费使用方法 💡 前言：AI 编程的新时代 AI 编程的竞争正进入“第二轮洗牌期”。过去几个月，Claude Code 一度成为开发者的宠儿，但频繁的限速、封号、降智问题让不少人头疼。如今，OpenAI 推出的 Codex 迅速崛起，凭借强大的编程能力和超高性价比，成为“AI 编程新王”。 Codex 是什么？它是基于 GPT-5 模型打造的专用编程环境，支持命令行、VS Code 插件、SDK 集成、云端操作等多种运行模式。不论你是写脚本、做项目、还是维护仓库，Codex 都能像“AI 结对程序员”一样协助你高效开发。

降重降 AIGC 双 buff 叠满！虎贲等考 AI 让论文原创力狂飙

当查重系统的标红和 AIGC 检测的预警同时亮起红灯，多少毕业生和科研人陷入 “改了又改，错了又错” 的循环？传统降重工具的同义词替换，改出的论文逻辑断裂；普通去 AI 痕迹软件，优化后依旧 “机器味” 十足。而虎贲等考 AI 智能写作平台（官网：https://www.aihbdk.com/）的降重降 AIGC 功能，凭借第五代智能改写模型的硬核技术，实现 “深度改写 + 痕迹清零” 的双重突破，让论文既合规达标，又兼具学术深度与人工质感。一、学术人的双重噩梦：查重标红 + AI 痕迹预警在学术规范日益严格的今天，论文创作面临两大 “生死关”： * 查重率居高不下：东拼西凑的初稿，查重率轻松突破 40%，用普通工具降重后，要么语句不通顺，要么核心观点被改得面目全非，陷入 “改了白改”

Qwen3-4B新手指南：5分钟部署，1块钱体验AI写作

Qwen3-4B新手指南：5分钟部署，1块钱体验AI写作你是不是也是一位自媒体作者，听说AI能帮你写文章、起标题、改文案，效率翻倍？你也下载了Qwen3模型，结果打开命令行一脸懵，各种报错折腾一晚上还是跑不起来？别急，你不是一个人。很多刚接触AI写作的朋友都卡在“怎么用”这一步。今天这篇文章就是为你量身打造的——不需要懂代码，不用装环境，不用配CUDA，更不用熬夜查错误日志。我们用一个开箱即用的预置镜像，带你5分钟完成部署，花不到1块钱就能亲自体验Qwen3-4B的强大写作能力。 Qwen3-4B是阿里通义千问团队推出的40亿参数级别大模型，虽然是“小尺寸”，但性能却非常惊艳。它在逻辑推理、指令遵循和中文写作方面表现突出，甚至被网友评价为“在同规模中几乎没有对手”。更重要的是，它是完全开源且支持商用（Apache 2.0协议），非常适合个人创作者、内容工作室用来辅助生产。通过本文，你将学会： * 如何一键部署Qwen3-4B，彻底告别命令行配置 * 怎么用网页界面和它对话，像用微信一样自然 * 让它帮你写公众号推文、短视频脚本、爆款标题 * 调整关键参数，让输出

AI绘画新体验：雯雯的后宫瑜伽女孩模型一键生成美图

AI绘画新体验：雯雯的后宫瑜伽女孩模型一键生成美图 1. 为什么这款瑜伽女孩模型值得你花5分钟试试？你有没有过这样的时刻：想为瑜伽课程设计一张清新自然的宣传图，却苦于找不到既专业又富有生活气息的参考素材？或者想为健康生活方式类内容配图，但商用图库里的图片总显得太模板化、缺乏真实温度？这次我们测试的「雯雯的后宫-造相Z-Image-瑜伽女孩」镜像，不是又一个泛泛而谈的文生图模型，而是一个经过垂直优化、专注呈现“真实感瑜伽状态”的轻量级AI绘画工具。它基于Z-Image-Turbo架构，叠加了专为瑜伽人物姿态、服饰材质与环境光影训练的LoRA微调模块——这意味着它不追求夸张的幻想风格，而是把力气花在更难的地方：让女孩的呼吸节奏可感、肌肉线条自然、布料垂坠有重量、阳光洒落有层次。更重要的是，它没有复杂配置、不需显卡折腾、不搞命令行黑盒。打开即用，输入一段像说话一样的描述，30秒内就能生成一张可用于小红书封面、公众号头图或私教课海报的高质量图片。本文将带你跳过所有技术弯路，直接上手体验——从启动服务到生成第一张满意作品，全程无需安装任何软件，也不用理解“LoRA”“CFG Sc