【跟我学YOLO】YOLO26:YOLO Vision 2025 最新发布的端到端视觉 AI 新突破

【跟我学YOLO】YOLO26:YOLO Vision 2025 最新发布的端到端视觉 AI 新突破
欢迎关注『跟我学 YOLO』系列
【跟我学YOLO】YOLO5 环境配置与检测
【跟我学YOLO】YOLO8 环境配置与推理检测
【跟我学YOLO】YOLO11 环境配置与基本应用
【跟我学YOLO】YOLO12 模型下载、环境配置与基本应用
【跟我学YOLO】YOLO13 模型下载、环境配置与检测

【跟我学YOLO】YOLO26:Ultralytics 在 YOLO Vision 2025 最新发布

0. YOLO26:Ultralytics 在 YV25 发布的端到端视觉 AI 新突破

YOLO26 来了!

9 月 25 日,在伦敦举行的年度盛会 YOLO Vision 2025(YV25)上,Ultralytics 创始人兼 CEO Glenn Jocher 正式宣布了 Ultralytics YOLO 模型系列的最新突破——Ultralytics YOLO26!

YOLO26 是一款 更快、更轻、更准、易部署 的 Vision AI 产品,它不仅延续了 YOLO 系列一贯的速度与易用性,还在端到端架构、训练优化和多任务支持上带来了革命性突破。

YOLO26简化了模型设计的各个方面,并增加了新的增强功能,同时还继续提供用户熟悉的Ultralytics YOLO模型功能。例如,Ultralytics YOLO26 易于使用,支持一系列计算机视觉任务,并提供灵活的集成和部署选项。

简而言之,Ultralytics YOLO26 是一款更好、更快、更小的 Vision AI 模型。在正式发售(10 月底开放)之前,让我们来全面解析 YOLO26 的功能与优势。

1. 设计理念:让视觉 AI 更简单、更普惠

Ultralytics 从成立起就有两大使命:

  • 普及 AI 技术 ——让所有人都能无障碍使用。
  • 保持尖端性能 ——不断突破视觉模型的速度与精度极限。

随着 边缘计算 的兴起,用户越来越希望在智能相机、无人机或移动设备上实现实时视觉推理。这对模型提出了新的要求:更轻、更快,同时保证精度。YOLO26 正是在这一背景下诞生的。

Glenn Jocher 在发布会上表示:
“最大的挑战之一,就是在保持卓越性能的同时,让用户最大化利用 YOLO26 的简单性与高效性。”

在这里插入图片描述

2. YOLO26概览:从检测到分割的全能模型

YOLO26 是YOLO 系列实时物体检测器的最新产品,专为边缘和低功耗设备而设计。它采用精简设计,消除了不必要的复杂性,同时集成了有针对性的创新技术,以提供更快、更轻和更方便的部署。

2.1 核心原则

YOLO26 的架构遵循三个核心原则:

  • 简单:YOLO26 是一个原生的端到端模型,无需非最大抑制(NMS)即可直接生成预测结果。由于省去了这一后处理步骤,推理变得更快、更轻便,也更容易部署到现实世界的系统中。这一突破性方法由清华大学的王敖在YOLOv10中首创,并在 YOLO26 中得到进一步发展。
  • 部署效率:端到端设计省去了管道的整个阶段,大大简化了集成、减少了延迟,并使不同环境下的部署更加稳健。
  • 训练优化:YOLO26 引入了MuSGD 优化器,它是SGD和Muon的混合体,灵感来自 Moonshot AI 在 LLM 训练中取得的Kimi K2突破。该优化器具有更高的稳定性和更快的收敛速度,将语言模型中的优化技术应用到了计算机视觉领域。

这些创新结合在一起,使模型系列在小型物体上实现了更高的精度,提供了无缝部署,在 CPU 上的运行速度提高了 43%,从而使 YOLO26 成为迄今为止在资源有限的环境中最实用、最易部署的YOLO 模型之一。

在这里插入图片描述

2.2 支持的视觉任务

YOLO26 提供 五种不同的型号,用户可根据任务规模自由选择。

YOLO26 支持的计算机视觉任务概览:

  • 目标检测:比检测更进一步,YOLO26 可以在识别的每个对象周围生成像素完美的边界。
  • 实例分割:生成像素级边界,更好地理解物体形状。
  • 图像分类:该模型可分析整幅图像,并将其归入特定类别或标签。
  • 姿态估计:YOLO26 可以检测关键点,并估算人类和其他物体的姿态。
  • 定向边界框 (OBB):可以检测任何角度的物体,尤其适用于航拍、无人机和卫星图像。
  • 目标跟踪:YOLO26 可用于跟踪视频帧或实时流中的物体。

无论是轻量级边缘设备,还是企业级 AI 系统,YOLO26 都能无缝适配。

在这里插入图片描述

2.3 支持的部署平台

无论是移动应用程序、智能相机还是企业系统,部署 YOLO26 都非常简单灵活。Ultralytics Python软件包支持不断增加的导出格式,这使得YOLO26很容易集成到现有的工作流程中,并与几乎所有平台兼容。

YOLO26 的另一大亮点是部署友好性。通过 Ultralytics Python 软件包,用户可以轻松导出多种格式:

  • TensorRT(GPU 加速最大化)
  • ONNX(跨平台兼容性强)
  • CoreML(适配 iOS)
  • TFLite(适配 Android 与边缘设备)
  • OpenVINO(优化英特尔硬件性能)

部署的另一个关键是确保模型在资源有限的设备上高效运行。这就是量化的作用所在。得益于其简化的架构,YOLO26 完美支持 INT8 量化 与 FP16 半精度推理,在保证精度的前提下进一步减小模型体积、提升速度。这意味着 YOLO26 不仅能在服务器集群中高速运行,也能在手持设备、智能相机等边缘环境中稳定工作。

在这里插入图片描述

3. YOLOL26 架构创新:端到端推理与轻量化升级

3.1 YOLOL26 架构的创新设计

YOLO26 的架构进行了创新设计:

  • DFL 移除:通过移除分布焦点损失(DFL)模块,简化了模型的设计,该模块以前会减慢推理速度并限制边界框回归。。
  • 端到端(E2E)/无 NMS:跳过了传统的非最大值抑制(NMS)步骤,直接输出最终预测结果,无需非最大抑制(NMS)后处理,使部署更轻便。
  • ProgLoss & STAL:渐进损失平衡(ProgLoss)提升训练稳定性并提高准确性,小目标感知标签分配(STAL)增强小目标检测能力。
  • MuSGD 优化器:结合 SGD 与 Muon 优势,灵感来自 Moonshot AI 在 LLM 训练中的 Kimi K2 突破,提高了训练收敛性并提升了整体性能。

这些改进让 YOLO26 的 nano 版本在标准 CPU 上的速度提升 43%,特别适合移动应用程序、智能相机和其他对速度和效率要求极高的边缘设备。。

3.2 YOLOL26 的性能指标

在这里插入图片描述

3.3 YOLOL26 的边缘性能

YOLO26 具有最先进的边缘性能:

  • CPU 推理速度最多可提高 43
  • 缩小模型尺寸,减少内存占用
  • 简化架构以实现兼容性(无 DFL、无 NMS)
  • 灵活的导出格式,包括TensorRT、ONNX、CoreML、TFLite 和OpenVINO

4. 应用场景:从机器人到制造业

YOLO26 的轻量化和高精度,使其在多个行业展现潜力:

  • 机器人:YOLO26 可以帮助机器人实时解读周围环境。这使得导航更加顺畅,物体处理更加精确。它还能使机器人与人的协作更加安全。
  • 制造业:自动化缺陷检测,与人工检测相比,它可以更快、更准确地自动识别生产线上的缺陷。
  • 智能交通:在低功耗硬件上实现实时监控与预警。
  • 无人机与遥感:通过 OBB 检测复杂角度的地面物体。

简而言之,YOLO26 的普适性让它成为 边缘 AI 与企业级系统的桥梁。

在这里插入图片描述

5. 主要收获

YOLO26 并不是简单的“版本升级”,而是一次理念革新:
它通过 端到端简化、架构优化 和 训练创新,为计算机视觉带来了全新的速度与灵活性。

在 YV25 发布会上,Ultralytics 向我们展示了一个清晰的愿景:视觉 AI 的未来属于更轻量化、更智能、更普惠的模型。

YOLO26 正是这一愿景的重要里程碑。

👉 想第一时间体验 YOLO26?关注 Ultralytics GitHub 仓库,加入全球开发者社区,共同推动计算机视觉的发展。

【本节完】

如果您在研究中使用了 YOLO26,请引用原作:

@software{yolo26_ultralytics, author ={Glenn Jocher and Jing Qiu}, title ={Ultralytics YOLO26}, version ={26.0.0}, year ={2025}, url ={https://github.com/ultralytics/ultralytics}, orcid ={0000-0001-5950-6979, 0000-0003-3783-7069}, license ={AGPL-3.0}}
版权声明:
欢迎关注『跟我学YOLO』系列
转发必须注明原文链接:
【跟我学YOLO】YOLO26:YOLO Vision 2025 最新发布的端到端视觉 AI 新突破
Copyright 2025 by youcans@Xidian
Crated:2025-09

Read more

【笔记】Trae+Andrioid Studio+Kotlin开发安卓WebView应用

【笔记】Trae+Andrioid Studio+Kotlin开发安卓WebView应用

文章目录 * 简介 * 依赖 * 步骤 * AS(Andriod Studio)创建项目 * AS创建虚拟机 * TRAE CN 修改项目 * 新增按键捕获功能 * 新增WebView * WebView加载本地资源 * 在按键回调中向WebView注入JS代码 * 最终关键代码 * 吐槽 简介 使用Trae配合Andriod Studio开发一个内嵌WebView的安卓应用, 在WebView中加载本地资源, 在APP中捕获按键事件对WebView中的内容进行操作; 依赖 * Trae CN (https://www.trae.com.cn/) * Andriod Studio (https://developer.android.google.cn/studio?hl=zh-cn), 以下简称AS * 吃内存, 占用了我大约6GB内存 * 下载项目依赖和安卓虚拟机(约2GB)依赖网络 * 基础的编程知识 步骤 AS(

WebStorm对个人免费开放

WebStorm对个人免费开放

前端开发的普惠革命:JetBrains WebStorm 非商业免费政策深度解析 2024 年 10 月 24 日,正值程序员节来临之际,JetBrains 抛出重磅消息:旗下旗舰级前端开发 IDE WebStorm 正式对非商业用途用户全面免费开放。这一举措不仅延续了 RustRover 的免费许可模式,更标志着专业级 Web 开发工具向大众化普及迈出了关键一步,为全球千万前端开发者带来了实质性利好。 一、政策内核:清晰界定的免费边界与权益 1. 非商业用途的精准定义 JetBrains 在 Toolbox 订阅协议中明确划分了免费使用的适用场景,覆盖群体远超传统教育优惠范畴: * 核心免费场景:包括前端技术学习与技能提升、无商业收益的开源项目贡献、技术博客 / 视频教程等内容创作、个人兴趣导向的 Web 开发(如自制工具、创意 demo)。值得注意的是,即使内容创作通过广告产生间接收益,仍属于非商业范畴。 * 商业付费边界:任何直接或间接获取经济收益的开发活动均需付费,

ClawdBot入门指南:Web控制台Config→Models→Providers模型切换实操

ClawdBot入门指南:Web控制台Config→Models→Providers模型切换实操 1. 什么是ClawdBot?一个真正属于你的本地AI助手 ClawdBot不是另一个云端API调用工具,也不是需要反复注册、绑定手机号的SaaS服务。它是一个能完整运行在你自己的设备上的个人AI助手——从模型推理、对话管理到多渠道接入,全部离线可控。 它的后端核心由vLLM驱动,这意味着你能享受到接近商用级的推理速度和显存利用率,同时完全掌握数据主权。不需要上传任何聊天记录,不依赖外部服务器稳定性,也不用担心某天服务突然下线。你装好,它就在;你关机,它就停;你改配置,它立刻响应。 更关键的是,ClawdBot的设计哲学是「可理解、可调试、可演进」。它的配置不是藏在层层GUI背后的黑盒,而是以清晰结构化的JSON文件呈现;它的模型切换不靠神秘按钮,而是一次明确的路径导航:Config → Models → Providers;它的扩展不依赖插件市场,而是通过标准OpenAI兼容接口,轻松对接你本地部署的任意vLLM、Ollama或FastChat服务。 换句话说,ClawdBo

和智慧生活商城系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

和智慧生活商城系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

💡实话实说: C有自己的项目库存,不需要找别人拿货再加价。 摘要 随着信息技术的飞速发展和电子商务的普及,智慧生活商城系统逐渐成为现代商业运营的重要组成部分。传统的商城管理模式面临着效率低下、数据冗余、用户体验差等诸多问题,亟需通过信息化手段进行优化升级。智慧生活商城系统旨在整合线上线下资源,为用户提供便捷、高效的购物体验,同时为商家提供智能化的管理工具。该系统通过先进的信息管理系统,实现商品管理、订单处理、用户交互等核心功能的自动化与智能化,从而提升整体运营效率和服务质量。关键词:智慧生活商城、信息管理系统、电子商务、智能化、SpringBoot。 智慧生活商城系统采用SpringBoot作为后端框架,结合Vue.js前端技术和MySQL数据库,构建了一套高效、稳定、可扩展的全栈解决方案。SpringBoot提供了强大的后端支持,简化了开发流程,提高了系统的可维护性;Vue.js则以其响应式特性和组件化开发模式,为用户提供了流畅的交互体验;MySQL作为关系型数据库,确保了数据的安全性和一致性。系统功能涵盖用户管理、商品分类与展示、购物车与订单管理、支付集成以及数据分析等模