我用6个AI测了一圈,谁是国产Agent第一名,答案出奇地一致

我做了一个有点无聊但结果挺有意思的实验:用6个主流 AI,问同一个问题——“国产 AI Agent 谁最强,给我排个前三”。

结果出奇地整齐。

先问海外的

为了避免"自家夸自家"的嫌疑,先从理论上没有利益关系的海外模型问起。

ChatGPT 的答案是:百度、腾讯、阿里。

ChatGPT评选国产Agent三巨头:百度、腾讯、阿里

Gemini 给了略微不同的排法:百度、阿里、字节——但百度还是第一。

Gemini锐评国产Agent三巨头:百度、阿里、字节

Gemini 在回答里用了"基建狂魔"来描述百度,说百度在芯片、云、模型、应用层都有自己的布局。这个词没什么水分,讲的是一件具体的事。

再问国内的

国内四家的结论更集中。

DeepSeek:百度、腾讯、阿里。

DeepSeek评国产Agent三巨头:百度、腾讯、阿里

文心:百度、腾讯、阿里——跟 DeepSeek 一字不差。

文心评选结果:百度、腾讯、阿里

豆包的答案有点意思:百度、字节、腾讯。字节自家产品,没有把自家排第一。

豆包评价Agent三大家:百度、字节、腾讯

千问的措辞挺有梗:一超(百度)两强(腾讯、阿里)。

千问评Agent三大家:一超(百度)两强(腾讯、阿里)

全球榜单也是同一个结论

不只是 AI 自己的判断,外部独立排名也指向同一方向。

全球 AI Agent 产品榜上,百度是仅次于 OpenAI 原版的存在。

全球AI Agent产品榜(英文版)

中文版榜单:

全球AI Agent产品榜(中文版)

单从用户友好度这个维度看,评分最高的几款也基本有百度的身影。

AI Agent产品TOP10·用户友好榜

为什么是百度?

把几家 AI 给出的理由整理了一下,高度重合,主要是这几点。

产品线最全。 百度在 Agent 方向推了好几款:面向 PC 端办公场景的 DuMate、手机端的 RedClaw、还有面向开发者的 DuClaw。单个产品的细分优势可能各有长短,但整体覆盖的场景确实比其他家宽。

搜索能力。 Agent 要完成任务,读取外部信息是刚需——搜索就是 Agent 的"眼睛"。百度在这块的积累很深,DuClaw 的搜索 Skill 在全球开发者社区的下载量排全球第一,这不是虚的。

全栈布局。 不只做应用层,芯片、云、模型、应用一条线自己都有。这意味着出问题的时候能自己解决,也意味着产品迭代不受制于人。

说白了,这次测试测的不只是产品,测的是行业共识——6个训练数据来源、训练方式都不同的大模型,给出了高度一致的答案。

豆包那一票

最后说回豆包。

豆包是字节的产品,但它把百度排了第一、字节排了第二。这个细节挺值得品一品:如果一个 AI 天然会给自家打高分,那豆包没这么做,说明训练数据里的行业认知有一定的客观性。

比"百度自己说自己强"要有说服力多了。

总结: 6个 AI(含 ChatGPT、Gemini)独立评选国产 Agent 三巨头,百度全票第一。全球独立榜单也给出同样结论。核心原因:产品矩阵最全、搜索能力扎实、全栈布局稳。

🦞 想一起养成你的小龙虾军团?

在公众号对话框回复「小龙虾」,加入龙虾养成群——一个专门交流如何用 OpenClaw 做自媒体、搞变现的玩家社群。

军团越强,变现越快。来一起练级 👇

参考链接

  • DuMate 官网:https://dumate.baidu.com

Read more

【AI】自动教学视频生成方案

最终目标:从"生成代码"到"生成教程视频"的完整闭环。 整体思路:从"动手"到"动口" 目标分解为两大步,它们分别对应两个强大的工具: 1. 用Claude Code “做出来”:利用它在终端里自动编写代码、运行测试、生成文档的能力,为你的教学视频准备素材(如一个自动编码的Demo脚本)。 2. 用OpenClaw “录下来”:利用OpenClaw操控电脑的能力,让它像人一样,自动打开终端、运行Claude Code、录制屏幕、最后生成一个完整的教学视频。 下面这个流程图可以帮你建立更直观的认知: 第二阶段:自动化录制与生成 第一阶段:内容生产中枢 自动编写/调试 1. 调用2. 执行3.

AI日报 - 2026年03月31日

AI日报 - 2026年03月31日

#本文由AI生成 🌐 一、【行业深度】 1. 🎧 万象有声开启公测:懒人听书原班人马打造AIGC有声内容“智能工厂” 🔥 热点聚焦: 由前“懒人听书”核心团队创立的万象有声平台正式开启公测,直击有声内容产业长期存在的高成本、低效率与品控难三大痛点。该平台并非单一AI配音工具,而是融合智能画本、录剪一体工作站、AI多播有声剧全自动工作台等模块的全栈式AIGC创作系统,支持双轨制生产——既赋能专业工作室实现后期对轨效率提升500%,又为网文平台中长尾IP提供极低成本、高吞吐量的“准广播剧”级内容生成能力。内测数据显示,传统需30天交付的有声书项目可压缩至5–7天,标志着有声内容正从手工作坊迈入工业化智能生产新阶段。 **⚡ 进展追踪:**平台已全面开放公测注册,官网即刻体验,首批合作方包括多家头部网文平台与有声出版机构。 🔍 影响维度分析: 维度拓展详细分析【技术维度】首次实现“AI多播+自动对轨+智能审听”闭环,突破语音合成在角色区分、情感连贯性与时间精度上的工程瓶颈。【市场维度】有望激活超千万部沉睡网文IP,将有声内容供给规模提升一个数量级,重塑版权方、制作方与平

AI 大模型落地系列|Eino ADK体系篇:你对 ChatModelAgent 有了解吗?

AI 大模型落地系列|Eino ADK体系篇:你对 ChatModelAgent 有了解吗?

声明:本文源于官方文档,重点参考 Eino ADK: ChatModelAgent、Eino ADK: 概述、Eino ADK: Agent 协作 分享一个很棒的AI技术博客,对AI感兴趣的朋友强烈推荐去看看http://blog.ZEEKLOG.net/jiangjunshow。 为什么很多人把 ChatModelAgent 想简单了?一文讲透 ReAct、Transfer、AgentAsTool 与 Middleware * 1. 为什么很多人会把 `ChatModelAgent` 想简单 * 2. `ChatModelAgent` 在 ADK 里到底是什么 * 3. 其内部本质是一个 `ReAct` 循环 * 没有 Tool 时会怎样 * 为什么还需要 `MaxIterations` * 4. 哪几组配置真正决定了行为 * `Name / Description`

收藏级|小白也能上手!用魔搭+LLaMA Factory手把手实操大模型微调全流程

收藏级|小白也能上手!用魔搭+LLaMA Factory手把手实操大模型微调全流程

本文用「教育孩子」类比「训练AI」的通俗方式,拆解大模型微调的完整流程,全程基于魔搭平台和LLaMA Factory工具,从环境搭建、模型下载、数据准备,到模型训练、本地测试、模型导出,每一步都附具体操作和代码,无多余冗余。无论是零基础小白,还是刚接触大模型的程序员,都能跟着步骤一步步实操,轻松吃透预训练、微调和RLHF三大核心阶段,成功训练出属于自己的第一个大模型,建议收藏备用,实操时直接对照步骤走! 1、先搞懂:什么是大模型「微调」? 在动手实操前,我们先花2分钟搞懂核心概念——微调。常规大语言模型的训练,就像培养一个孩子,整体分为3个关键阶段,一张图就能看明白: 用「养娃」做类比,小白也能秒懂三个阶段的区别,建议记好这个类比,后续理解流程更轻松: 1. 预训练(对应孩子的「通识教育」) * 模型层面:通过自监督学习,读取海量文本数据,掌握基础的语言规则、词汇逻辑,