Three.js + WebGL 粒子动画实测:10 万粒子,流畅无压力

Three.js + WebGL 粒子动画实测:10 万粒子,流畅无压力

 ​​​​​

测试环境

Windows 桌面,WinForms + OpenTK (OpenGL 3.3)。

处理器    Intel(R) Core(TM) i9-14900HX (2.20 GHz)
机带 RAM    32.0 GB (31.7 GB 可用)
系统类型    64 位操作系统, 基于 x64 的处理器
操作系统版本    Windows 11 家庭中文版


实现原理

核心思路是:用 C# 承载页面,用 Three.js 组织 3D 场景,用 WebGL 做底层 GPU 绘制。

整体如下:

1. `WPF` 窗口中嵌入 `WebView2`。

2. 在 C# 中动态拼接 HTML,并通过 `NavigateToString` 注入页面。

3. 页面侧加载 `three.min.js`,创建 `Scene / Camera / WebGLRenderer`。

4. 粒子通过 `THREE.BufferGeometry` 与多个 `BufferAttribute` 存储。

5. 每帧在 JS 中更新粒子位置与生命周期,提交属性更新后由 GPU 渲染。

6. 页面每秒统计一次 FPS,通过 `window.chrome.webview.postMessage(...)` 回传给 C#,在 UI 上实时显示。

总结为:这是一个“CPU 负责粒子状态更新,GPU 负责大规模点精灵绘制”的混合型架构。


关键技术点

1. 跨技术栈集成:WPF 与 Web 3D 的桥接

- C# 端调用 `EnsureCoreWebView2Async()` 初始化浏览器内核。

- 使用 `WebMessageReceived` 接收前端消息,把 FPS 同步回桌面 UI。

- 这样可以让原生桌面应用拥有 WebGL 渲染能力,同时保留 WPF 的业务壳层。

2. 大规模粒子数据结构:BufferGeometry

- 粒子位置、颜色、尺寸、生命周期都以 `Float32Array` 组织。

- 通过 `geometry.setAttribute(...)` 绑定到 GPU 可消费的缓冲属性。

- 相比逐对象管理,**结构化数组 + 批量绘制**是海量粒子的基础。

3. 自定义 Shader:粒子视觉在 GPU 完成

- 顶点着色器负责点大小透视缩放、生命周期透明度系数计算。

- 片段着色器利用 `gl_PointCoord` 裁剪圆形粒子并做柔和边缘。

- 材质配置启用 `AdditiveBlending`,形成更亮的粒子叠加效果。

仿真更新模型:每帧 CPU 循环

当前粒子运动(重力、阻力、边界反弹、重生)都在 JS `for` 循环中执行。  

这使逻辑直观易控,但也带来一个关键瓶颈:**粒子数线性增长时,CPU 计算和属性回写成本同步上升。


核心代码

1. **粒子总量入口**

   - `private const int ParticleCount = 100000;`

   - 这是压测的直接控制阀,影响所有数组长度和每帧循环规模。

2. **GPU 友好数据准备**

   - `positions / colors / sizes / lifetimes / maxLifetimes` 都是 `Float32Array`。

   - `BufferAttribute` 绑定后由 `THREE.Points` 进行一次性批量绘制。

3. **渲染材质与 Shader**

   - `THREE.ShaderMaterial({...})` 挂载 `vertexShader` 与 `fragmentShader`。

   - 开启 `transparent + AdditiveBlending + depthWrite:false`,确保粒子叠加效果。

4. **每帧更新与提交**

   - `updateParticles(deltaTime)` 内遍历全部粒子更新状态。

   - 更新后设置:

     - `particles.geometry.attributes.position.needsUpdate = true`

     - `particles.geometry.attributes.lifetime.needsUpdate = true`

   - 这一步会触发 GPU 侧缓冲同步,粒子越多,带宽与提交压力越大。

5. **桌面侧 FPS 可观测性**

   - 页面端每秒 `postMessage('FPS: ' + fps)`。

   - C# 侧 `WebMessageReceived` 更新 `txtFPS.Text`。

   - 这让测试过程具备了稳定的在线观测能力。


实测结果

1 万粒子: FPS 145 , 非常流畅 ;

10 万粒子: FPS 53 ,流畅 ;

50 万粒子: FPS 14 ,明显卡顿 ;

100 万粒子: FPS 7,严重卡顿,接近不可用 ;


性能分析

1. 为什么 1 万到 10 万仍能跑得动?

- WebGL 批量绘制能力较强,点精灵渲染天然适合并行。

- 数据结构使用 `BufferGeometry`,减少了对象级 draw call。

- Shader 逻辑相对轻量,没有复杂纹理采样或后处理。

2. 为什么到 50 万、100 万会急剧下滑?

核心原因不是“GPU 不能画点”,而是**CPU + 数据传输 + GPU 渲染**三者叠加后的总成本爆炸:

- **CPU O(N) 更新成本**:每帧遍历所有粒子,计算速度、位置、碰撞、重生。

- **缓冲更新成本**:`position/lifetime` 每帧都标记 `needsUpdate`,意味着大体量数据频繁上传。

- **像素填充压力**:粒子数量增大后,叠加混合(Additive)会显著增加片段处理负担。

- **浏览器容器开销**:WebView2 本质是嵌入式浏览器,不是纯原生图形管线,存在额外调度成本。

3. 从数据看当前实现的可用区间

- **推荐实时区间**:1 万 ~ 10 万(视业务目标而定)。

- **风险区间**:>10 万 后帧率明显衰减,尤其在复杂效果叠加时。

- **极限演示区间**:几十万到百万可以“展示数量级”,但不适合交互型实时动画。


总结

1. 它验证了 `WebView2 + Three.js + WebGL` 路线在桌面应用中的**可行性**。  

2. 它给出了当前实现的**性能基线**:10 万以内可用,数十万后显著下降,百万级不可实时。  

3. 它说明了后续优化的重点不只是“继续堆 GPU”,而是要系统处理**CPU 更新模型与数据上传路径**。  

从这个演示效果,我们看到three.js的性能仅仅是opentk(opengl)的1/10 (https://blog.ZEEKLOG.net/LateFrames/article/details/158291013?spm=1001.2014.3001.5501), 可以看出来明显的区别:

Read more

C++ 类与对象:封装特性的实现与实战应用

C++ 类与对象:封装特性的实现与实战应用

C++ 类与对象:封装特性的实现与实战应用 💡 学习目标:掌握类与对象的核心概念,理解封装的本质与价值,能够独立设计并实现具有封装特性的 C++ 类。 💡 学习重点:类的定义与对象实例化、访问权限控制、构造函数与析构函数的使用、封装的实战场景应用。 一、类与对象的核心概念 ✅ 结论:类是 C++ 面向对象编程的核心载体,是对一类事物属性和行为的抽象描述;对象是类的具体实例,是内存中实际存在的实体。 1.1 类的组成 一个完整的 C++ 类通常包含两部分: * 成员变量:描述类的属性,如人的姓名、年龄,圆的半径等。 * 成员函数:描述类的行为,如人的吃饭、跑步,圆的面积计算等。 1.2 类的定义格式 #include<iostream>#include<string>

By Ne0inhk
【C++】深入浅出“图”——最短路径算法

【C++】深入浅出“图”——最短路径算法

文章目录 * 一、Dijkstra算法 * 二、Bellman_Ford算法 * 三、Floyd_Warshall算法 一、Dijkstra算法 最短路径问题是指,从在带权的有向图中从某一顶点出发,找到通往另一顶点的最短路径,“最短”指的是沿路径各边的权值总和最小。 Dijkstra算法是单源最短路径的经典贪心算法,只能用于没有负权的图。它从起点出发,每次选当前距离最小且未确定最短路径的节点,用它去松弛(更新)所有邻接点的最短路径估计值,标记该节点为 “已确定”,重复此过程直到所有节点处理完毕,最终得到起点到图中所有节点的最短路径。 // src是选定的起点,dist记录起点到各点的最短路径,pPath记录到每个点的最短路径的前驱顶点下标voidDijkstra(const V& src, vector<W>& dist, vector<int>& pPath){ size_t srci =GetVertexIndex(

By Ne0inhk
Java SpringBoot+Vue3+MyBatis 医疗挂号管理系统系统源码|前后端分离+MySQL数据库

Java SpringBoot+Vue3+MyBatis 医疗挂号管理系统系统源码|前后端分离+MySQL数据库

摘要 随着信息技术的快速发展,医疗行业的信息化管理需求日益增长。传统的医疗挂号方式存在效率低下、资源分配不均等问题,患者排队时间长、医生工作压力大,严重影响了医疗服务的质量。为了提高医疗资源的利用率,优化患者就医体验,开发一套高效、便捷的医疗挂号管理系统成为迫切需求。该系统通过信息化手段整合医院资源,实现挂号、就诊、管理的全流程数字化,为患者和医务人员提供更加高效的服务。关键词:医疗挂号、信息化管理、资源优化、就医体验、数字化。 本系统采用前后端分离的架构设计,前端使用Vue3框架实现用户界面,后端基于Java SpringBoot框架搭建服务,数据持久化通过MyBatis实现,数据库采用MySQL存储系统数据。系统功能包括患者挂号、医生排班、科室管理、病历查询等模块,支持多角色登录(患者、医生、管理员),并提供数据统计与分析功能,帮助医院优化资源配置。系统设计注重安全性和可扩展性,采用JWT进行身份认证,RESTful API规范接口设计,确保系统稳定高效运行。关键词:前后端分离、SpringBoot、Vue3、MyBatis、多角色登录。

By Ne0inhk

RabbitMQ 创建队列的 5 种方式全解析:从手动到自动,小白也能选对方案(Spring Boot + Java 实战)

视频看了几百小时还迷糊?关注我,几分钟让你秒懂! 在使用 RabbitMQ 开发消息系统时,“队列怎么创建” 是每个开发者都会遇到的问题。有人用管理后台点点点,有人写代码自动建,还有人靠运维提前配好……到底哪种方式更好? 本文将全面对比 RabbitMQ 创建队列的 5 种主流方式,结合 真实场景 + Spring Boot 代码 + 正反案例 + 注意事项,帮你避开“上线就崩”的大坑! 一、为什么“怎么创建队列”这么重要? 🎯 真实需求场景 你正在开发一个订单服务: * 用户下单后,发送消息到 order.queue; * 消费者监听该队列处理业务。 问题来了: 这个 order.queue 谁来创建?什么时候创建?如果没创建会怎样? 后果很严重: * 如果队列不存在,消息会被 直接丢弃(除非

By Ne0inhk