字节开源 DeerFlow 2.0——登顶 GitHub Trending 1,让 AI 可做任何事情

字节开源 DeerFlow 2.0——登顶 GitHub Trending 1,让 AI 可做任何事情

打开 deerflow 的官网,瞬间被首页的这段文字震撼到了,do anything with deerflow。让 agent 做任何事情,这让我同时想到了 openclaw 刚上线时场景。

图片

字节跳动将 DeerFlow 彻底重写,发布 2.0 版本,并在发布当天登上 GitHub Trending 第一名。这不是一次功能迭代,而是一次从"深度研究框架"到"Super Agent 运行时基础设施"的彻底蜕变。

背景:从 v1 到 v2,发生了什么?

DeerFlow(Deep Exploration and Efficient Research Flow)最初是一个专注于深度研究的 AI 框架——给它一个问题,它会搜索、整理、输出报告。

但社区的玩法远超出了设计者的想象。开发者们拿它搭数据流水线、生成演示文稿、自动化内容生产、快速起 dashboard……这让团队意识到,DeerFlow 从一开始就不只是"研究工具",它更像一个让 Agent 真正把事情做完的运行环境。

图片

核心变化

DeerFlow 2.0 与 v1 没有共用任何代码,是一次彻底重写。旧版(Deep Research 框架)依然保留在 1.x 分支;主开发线已全面转向 2.0。

它到底是什么?

官方给出的定位是 Super Agent Harness(超级 Agent 调度框架)。这个词听起来抽象,拆开来理解其实很清晰。

图片

现在的 DeerFlow 2.0 不再仅仅是一个跑研究报告的工具,它进化成了一个 Harness(挂架/系统平台)

  • 什么是 Harness? 想象一下,大模型(如 DeepSeek, Kimi, Doubao)是发动机,而 DeerFlow 就是那台复杂的 F1 赛车底盘。它把 Sub-agents(子智能体)Memory(记忆)Sandbox(沙箱) 和 Skills(技能) 完美地挂载在一起。

开发者视角: 以往我们要写一个 Agent,需要处理繁琐的上下文管理、文件读写权限、多任务并行。DeerFlow 2.0 直接把这些基础设施“标准化”了。

图片

五大核心特性深度解析

① Skills — Agent 能力的"乐高积木"

Skills 是 DeerFlow 能完成几乎任何事情的秘密武器。一个标准 Skill 通常就是一个 Markdown 文件,定义了工作流、最佳实践和参考资源。DeerFlow 内置了研究、报告生成、演示文稿制作、网页生成、图像/视频生成等场景的 Skill。

关键设计是按需渐进加载:不会一次性把所有 Skill 塞进上下文,只有任务确实需要时才加载,有效控制 Token 消耗。

Claude Code 深度集成:通过 claude-to-deerflow skill, 你可以直接在 Claude Code 终端里和运行中的 DeerFlow  实例交互——发送研究任务、查看状态、管理 threads,全程不用离开终端。 安装 CLAUDE CODE 集成 SKILL npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow 

    图片

    ② Sub-Agents — 并行执行复杂任务

    传统 Agent 对于复杂任务的处理方式是"一条线走到底",DeerFlow 不同:Lead Agent 会先拆解任务,然后动态拉起多个 Sub-Agent,条件允许时并行运行,最后汇总成完整输出。

    一个典型的研究任务可以被拆成十几个 Sub-Agent,分别探索不同方向,最终合并成报告、网站或带生成视觉内容的演示文稿。这也是 DeerFlow 能处理"从几分钟到几小时"任务的原因。

    ③ Sandbox 文件系统 — Agent 有了自己的"电脑"

    这是 DeerFlow 和"带工具的聊天机器人"之间最根本的差别:Agent 有一台真正的"电脑"。

    每个任务运行在隔离的 Docker 容器里,内有完整文件系统:

    /mnt/user-data/

    Agent 可以读写编辑文件、执行 Bash 命令和代码、查看图片,全程在 Sandbox 内完成,可审计、隔离,不同 session 之间互不污染。

    图片

    ④ Context Engineering — 长任务不"忘事"

    DeerFlow 在上下文管理上做了两件事:

    01:Sub-Agent 上下文隔离:每个 Sub-Agent 只看到自己的上下文,不会被主 Agent 或其他 Sub-Agent 的信息干扰,保持专注。

    02:摘要压缩:在单个 session 内,主动总结已完成的子任务、把中间结果转存到文件系统、压缩暂时不重要的信息,在长链路任务里也能保持聚焦,不会轻易打爆上下文窗口。

    ⑤ 长期记忆 — 越用越了解你

    大多数 Agent 结束对话后一切归零,DeerFlow 2.0 跨 session 会逐步积累关于你的持久记忆:个人偏好、知识背景、写作风格、技术栈、重复出现的工作流。记忆保存在本地,控制权始终在你手里。

    图片

    多端接入:不只是终端工具

    DeerFlow 2.0 支持通过 IM 应用直接下发任务,无需公网 IP:

    渠道      传输方式                上手难度 Telegram Bot API(Long-polling) 简单 Slack Socket Mode               中等 飞书 / Lark WebSocket            中等 

    连接后,你可以直接在聊天窗口里使用 /new、/models、/memory 等命令和 DeerFlow 交互,普通消息则作为自然语言任务处理。

    快速上手:10 分钟跑起来

    推荐使用 Docker 方式,最省心:

    克隆并初始化 git clone https://github.com/bytedance/deer-flow.git cd deer-flow make config # 生成本地配置文件 编辑 CONFIG.YAML 配置模型 models: - name: gpt-4 display_name: GPT-4 use: langchain_openai:ChatOpenAI model: gpt-4 api_key: $OPENAI_API_KEY max_tokens: 4096 temperature: 0.7 DOCKER 启动(推荐) make docker-init # 首次拉取 sandbox 镜像 make docker-start # 启动服务 # 访问 http://localhost:2026

    图片

    一句话交给 CODING AGENT

    如果你在用 Claude Code、Cursor 或 Codex,可以直接把这句话发给它,让 Agent 帮你完成安装:

    "如果还没 clone DeerFlow,就先 clone, 然后按照 https://raw.githubusercontent.com/bytedance/deer-flow/main/Install.md 把它的本地开发环境初始化好"  

    推荐使用的模型

    DeerFlow 不绑定特定模型,只要实现了 OpenAI 兼容 API 即可接入。官方推荐以下几款表现较好的模型:

    模型                特点                适用场景 Doubao-Seed-2.0-Code 字节自研,代码能力强 编程类任务 DeepSeek v3.2 推理能力强,长上下文        深度研究、复杂拆解 Kimi 2.5 长上下文、多模态                文档分析、多模态任务 

    优先考虑具备以下能力的模型:100k+ tokens 长上下文窗口、强推理能力、稳定的 Tool Use 支持,以及多模态输入理解。

    Python SDK 内嵌使用

    不想启动完整 HTTP 服务?DeerFlow 也可以作为 Python 库直接使用:

    from deerflow.client import DeerFlowClient client = DeerFlowClient() # 普通对话 response = client.chat("帮我分析这篇论文", thread_id="my-thread") # 流式输出 for event in client.stream("最新的 AI Agent 趋势"): if event.type == "messages-tuple" and event.data.get("type") == "ai": print(event.data["content"]) # 管理能力 models = client.list_models() skills = client.list_skills() client.upload_files("thread-1", ["./report.pdf"])

    DeerFlow 具备系统指令执行、文件读写等高权限能力,默认仅建议在本地可信环境(127.0.0.1)部署。若需跨设备访问,务必配置 IP 白名单、前置身份验证(Nginx 反向代理)或网络隔离(VLAN)等安全措施。

    图片

    总结:Super Agent 时代的基础设施

    DeerFlow 2.0 真正有趣的地方,不在于它能做什么——而在于它如何把"做事"这件事本身系统化了。

    大多数 Agent 项目解决的是"用 LLM 完成任务"的问题,而 DeerFlow 解决的是更底层的问题:如何给 Agent 一个真实可靠的运行环境,让它有文件系统、有记忆、有工具、有并行执行能力,最终真正把复杂的、需要小时级才能完成的任务落地。

    这是从 ChatBot 到 Agent 的本质跃迁,而 DeerFlow 2.0,是目前开源社区里走得最彻底的那个。

    更多transformer,VIT,swin tranformer 参考头条号:人工智能研究所 v号:人工智能研究Suo, 启示AI科技

     动画详解transformer  在线视频教程 

    Read more

    AI 编程新王 Codex 全面上手指南

    AI 编程新王 Codex 全面上手指南 一篇文章带你精通 Codex 四大环境 + 免费使用方法 💡 前言:AI 编程的新时代 AI 编程的竞争正进入“第二轮洗牌期”。 过去几个月,Claude Code 一度成为开发者的宠儿,但频繁的限速、封号、降智问题让不少人头疼。 如今,OpenAI 推出的 Codex 迅速崛起,凭借强大的编程能力和超高性价比,成为“AI 编程新王”。 Codex 是什么? 它是基于 GPT-5 模型打造的专用编程环境,支持命令行、VS Code 插件、SDK 集成、云端操作等多种运行模式。 不论你是写脚本、做项目、还是维护仓库,Codex 都能像“AI 结对程序员”一样协助你高效开发。

    降重降 AIGC 双 buff 叠满!虎贲等考 AI 让论文原创力狂飙

    降重降 AIGC 双 buff 叠满!虎贲等考 AI 让论文原创力狂飙

    当查重系统的标红和 AIGC 检测的预警同时亮起红灯,多少毕业生和科研人陷入 “改了又改,错了又错” 的循环?传统降重工具的同义词替换,改出的论文逻辑断裂;普通去 AI 痕迹软件,优化后依旧 “机器味” 十足。而虎贲等考 AI 智能写作平台(官网:https://www.aihbdk.com/)的降重降 AIGC 功能,凭借第五代智能改写模型的硬核技术,实现 “深度改写 + 痕迹清零” 的双重突破,让论文既合规达标,又兼具学术深度与人工质感。 一、 学术人的双重噩梦:查重标红 + AI 痕迹预警 在学术规范日益严格的今天,论文创作面临两大 “生死关”: * 查重率居高不下:东拼西凑的初稿,查重率轻松突破 40%,用普通工具降重后,要么语句不通顺,要么核心观点被改得面目全非,陷入 “改了白改”

    Qwen3-4B新手指南:5分钟部署,1块钱体验AI写作

    Qwen3-4B新手指南:5分钟部署,1块钱体验AI写作 你是不是也是一位自媒体作者,听说AI能帮你写文章、起标题、改文案,效率翻倍?你也下载了Qwen3模型,结果打开命令行一脸懵,各种报错折腾一晚上还是跑不起来?别急,你不是一个人。很多刚接触AI写作的朋友都卡在“怎么用”这一步。 今天这篇文章就是为你量身打造的——不需要懂代码,不用装环境,不用配CUDA,更不用熬夜查错误日志。我们用一个开箱即用的预置镜像,带你5分钟完成部署,花不到1块钱就能亲自体验Qwen3-4B的强大写作能力。 Qwen3-4B是阿里通义千问团队推出的40亿参数级别大模型,虽然是“小尺寸”,但性能却非常惊艳。它在逻辑推理、指令遵循和中文写作方面表现突出,甚至被网友评价为“在同规模中几乎没有对手”。更重要的是,它是完全开源且支持商用(Apache 2.0协议),非常适合个人创作者、内容工作室用来辅助生产。 通过本文,你将学会: * 如何一键部署Qwen3-4B,彻底告别命令行配置 * 怎么用网页界面和它对话,像用微信一样自然 * 让它帮你写公众号推文、短视频脚本、爆款标题 * 调整关键参数,让输出

    AI绘画新体验:雯雯的后宫瑜伽女孩模型一键生成美图

    AI绘画新体验:雯雯的后宫瑜伽女孩模型一键生成美图 1. 为什么这款瑜伽女孩模型值得你花5分钟试试? 你有没有过这样的时刻:想为瑜伽课程设计一张清新自然的宣传图,却苦于找不到既专业又富有生活气息的参考素材?或者想为健康生活方式类内容配图,但商用图库里的图片总显得太模板化、缺乏真实温度? 这次我们测试的「雯雯的后宫-造相Z-Image-瑜伽女孩」镜像,不是又一个泛泛而谈的文生图模型,而是一个经过垂直优化、专注呈现“真实感瑜伽状态”的轻量级AI绘画工具。它基于Z-Image-Turbo架构,叠加了专为瑜伽人物姿态、服饰材质与环境光影训练的LoRA微调模块——这意味着它不追求夸张的幻想风格,而是把力气花在更难的地方:让女孩的呼吸节奏可感、肌肉线条自然、布料垂坠有重量、阳光洒落有层次。 更重要的是,它没有复杂配置、不需显卡折腾、不搞命令行黑盒。打开即用,输入一段像说话一样的描述,30秒内就能生成一张可用于小红书封面、公众号头图或私教课海报的高质量图片。本文将带你跳过所有技术弯路,直接上手体验——从启动服务到生成第一张满意作品,全程无需安装任何软件,也不用理解“LoRA”“CFG Sc