JFM | 空军工程大学宗豪华、吴云等:基于FPGA的深度强化学习框架实现超音速闭环智能流动控制实验

JFM | 空军工程大学宗豪华、吴云等:基于FPGA的深度强化学习框架实现超音速闭环智能流动控制实验

基于高速实验深度强化学习框架的超音速闭环流动控制

Closed-loop supersonic flow control with a high-speed experimental deep reinforcement learning framework

宗豪华¹,吴云¹,李金平²,苏志²,梁华²

引用格式:H. Zong, Y. Wu, J. Li, Z. Su, and H. Liang. Closed-loop supersonic flow control with a high-speed experimental deep reinforcement learning framework[J], Journal of Fluid Mechanics, 2025, 1009: A3.

编者按

复杂流动控制研究受限于缺乏低阶显示表达的流体动力学模型,所以长期以来多采用试探、观察和分析三步走“马后炮”式研究模式。无模型自适应控制、强化学习和流场预解分析技术的发展,为打破这类研究模式提供了强有力的方法基础。此文就是一篇深度强化学习解决复杂高速流动闭环控制的杰作。相比低速、低Re流动,高速流动的频谱更宽、流动结构尺度更丰富、系统复杂性更强,这对硬件响应和算法实时性提出了更大的挑战。该文以Ma=2的后台阶流动为例(Re和速度在公开文献中,皆创纪录),采用提出的FeDRL框架,通过仅需10s的风洞运行,就能设计出性能碾压传统遍历试凑法(最佳定频控制,数小时/数天)获得的控制律。

摘要:

虽然基于深度强化学习(DRL)的主动流动控制已经在低雷诺数仿真环境中得到了广泛的验证,但在真实实验条件下进行DRL控制仍存在很大挑战,其中之一便是数据采集和神经网络推理的强实时性(亚ms量级)。本研究提出了一种基于FPGA的高速实验深度强化学习框架(缩写:FeDRL),控制频率最高可10 kHz,比传统基于CPU的框架(100 Hz以下)高出两个数量级。以Mach 2的超音速后台阶流动为例,对FeDRL增强流动掺混的有效性进行测试。结果表明,仅需10秒的风洞运行时间,就能训练出比最佳定频控制还要优越的闭环控制律,将剪切层速度脉动增加21.2%。如此高的控制律优化效率在以前的闭环流动控制实验中还从未报道过(典型风洞测试时间:数小时至数天)。

正文:

图1 现有DRL流动控制研究所对应的速度和雷诺数

主动流动控制(AFC)通过在流场中引入局部可控扰动来改善绕流物体的宏观特性,有望大幅改善飞行器的气动性能,其核心是控制律。深度强化学习作为一种解决博弈和决策问题的最佳机器学习方法,为主动流动控制提供了一个全新思路。图1总结了目前基于DRL的流动控制研究。总体来看,大部分的研究都在低雷诺数条件下开展,对象包括圆柱、翼型等。相比之下,实验研究较少,尤其是高速高雷诺数航空流动的深度强化学习实验研究,目前还是一片空白(图1绿色区域)。这其中的主要难度在于航空流动速度高、湍流结构演化快,典型特征频率在kHz量级。为了能够实现实时在线控制,要求深度强化学习必须在μs量级实现流场感知、神经网络推理以及激励输出。基于CPU的DRL框架受数据通信、采集等环节的限制,控制频率通常在100Hz以下。

图2 基于DRL和RBF神经网络的高速实验DRL控制框架

本研究通过对硬件和算法的高度整合,提出了一种基于FPGA(现场可编程逻辑门阵列)的高速实验DRL控制框架(FeDRL)。数据采集模块直接挂载在FPGA上,能够在一个时钟周期内抓取和输出数据,同时神经网络的计算也能够利用FPGA进行加速,省去了传统框架中硬件间的通信时间。图2以经典的DQN算法为例进行了示意。该框架包含了两个并行执行的循环:在FPGA控制器中高速执行的实时控制循环(1-10kHz)和在CPU上的低速训练循环(10Hz)。神经网络控制律采用了结构简单、参数量少的径向基函数进行表达,典型控制频率可以达到1kHz量级以上。前期,该框架的有效性已在低速后台阶流动(POF, 2024, 36:105102)和翼型分离流动(POF, 2024, 36:091708)中得到了验证。本研究的重点旨在进一步将其拓展到超音速流动。

图3 (a)- (b)平板实验模型的示意图;(c)等离子体激励器结构

超音速后台阶流动控制实验在空军工程大学的超音速风洞中进行,马赫数为2。等离子体合成射流激励器作为主动控制装置对流场施加扰动,下游剪切层中的热线传感器提供流场的反馈信息,目标是最大化剪切层内的速度脉动。结果表明,仅需10秒的训练时间,FeDRL框架就能找到有效的闭环控制策略,使瞬时奖励rt从0上升至0.2左右,同时训练损失也在10秒内迅速收敛。对比基于策略的DRL算法(如PPO),FeDRL框架的优化效率高出一个数量级。从功率谱密度对比也可验证DRL控制的有效性,最佳案例下的的速度脉动增加量可达21.2%。通过控制律可视化可以发现,DRL控制策略可以进一步简化为二维的阈值触发控制策略:即当剪切层的瞬时位置高于基准平均位置时,应开启等离子体激励施加一次脉冲扰动。

图4 (a)瞬时奖励和损失的变化;(b)激励概率变化;(c)功率谱;(d)控制指令分布

将这种DRL控制策略与开环控制方法进行比较。结果表明,大部分放电频率下等离子体合成射流都能使功率谱峰值和低频波动幅度升高。随着放电频率的增加,热线速度脉动先增大后减小,最大值出现在放电频率为5 kHz时,与DRL中的动作更新频率一致。但定量来看,定频控制所获得的控制收益(10.5%)仅为最佳DRL控制(21.2%,案例2)的一半。

图 5 (a)功率谱密度和(b)电压脉动值的相对增加

公众号原文链接(文末附论文资源):

https://mp.weixin.qq.com/s/lGFg7WxLUo5q8RNsXnQZPA

相关论文推荐:

PRF|西北工业大学高传强,杨新宇等:复杂流动建模的新途径:基于闭环辨识的线性建模方法

AIAA J | 西北工业大学高传强,马榕池等:基于解析分析的跨声速激波抖振最优射流控制位置和角度设计

力学学报 | 西工大袁昊、寇家庆等:流体力学预解分析方法研究进展

博士学位答辩PPT分享 | 数据驱动的典型分离流及其流固耦合动力学控制研究

JFM|哈工大(深圳)胡钢团队:基于稀疏表面压力感知的动态特征驱动深度强化学习圆柱流动控制方法

POF | 哈尔滨工业大学(深圳)董欣辉等:基于代理模型和深度强化学习的圆柱主动流动控制实验研究

基于深度强化学习的方柱主动流动控制研究

梯度增强的机器学习控制方法用于稳定多频率开腔流动

注:本文由论文原作者整理并投稿分享,获作者授权发布。

Read more

Java 大视界 -- Java 大数据在智能家居设备联动与场景化节能中的应用拓展(413)

Java 大视界 -- Java 大数据在智能家居设备联动与场景化节能中的应用拓展(413)

Java 大视界 -- Java 大数据在智能家居设备联动与场景化节能中的应用拓展(413) * 引言: * 正文: * 一、技术基石:Java 大数据赋能智能家居的 “三位一体” 架构 * 1.1 架构全景图 * 1.2 核心技术栈选型与生产配置(附数据出处) * 1.3 核心数据模型(POJO 类,附表结构与业务含义) * 1.3.1 设备状态实体类(对应 ClickHouse 实时表) * 1.3.2 联动规则实体类(对应 MySQL 配置表) * 1.3.3 缺失工具类补充:SpringContextUtil(生产必用) * 二、核心场景 1:

论文阅读--Agent AI 探索多模态交互的前沿领域(一)

论文阅读--Agent AI 探索多模态交互的前沿领域(一)

这篇文章是近来介绍 Agent AI 非常全面的一篇综述,围绕多模态交互与通用人工智能(AGI)的发展需求展开,融合了学术研究积累、技术突破与行业应用诉求。整篇文章的结构如下: 摘要 多模态人工智能系统有望在我们的日常生活中普及。让这些系统具备更强交互性的一个有效途径,是将其作为智能体(Agent)嵌入物理与虚拟环境中。目前,现有系统以大型基础模型为核心构建模块来打造具象化智能体(embodied agents)。将智能体嵌入此类环境,能助力模型处理和解读视觉信息与上下文数据 —— 这对于开发更复杂、更具上下文感知能力的人工智能系统至关重要。例如,一个能够感知用户动作、人类行为、环境物体、音频表达及场景整体情绪的系统,可用于指导智能体在特定环境中做出合理响应。 为推动基于智能体的多模态智能研究,本文将 “智能体人工智能(Agent AI)” 定义为一类交互式系统:这类系统能够感知视觉刺激、语言输入及其他基于环境的数据,并能产生有意义的具象化动作。具体而言,我们探索的系统旨在通过整合外部知识、多感官输入和人类反馈,基于 “下一具象化动作预测” 来优化智能体性能。我们认为,通过在真实

FPGA验证利器:全方位解析AXI Verification IP (AXI VIP)

FPGA验证利器:全方位解析AXI Verification IP (AXI VIP)

【致读者】 您好!在深入本篇关于 AXI Verification IP (AXI VIP) 的技术细节之前,我们想与您分享一个更重要的信息。为方便同行交流,我创建了一个硬件技术交流群,群内聚焦: FPGA技术分享 实战问题讨论与答疑 行业动态与职业发展交流 若您对本专题感兴趣,欢迎私信我 “FPGA” 加入群聊 ———————————————— 一  引言 在复杂的FPGA系统中,AXI总线是连接各个IP核的“大动脉”。如何确保这片繁忙的交通网络高效、无误地运转?本文将带你深入探讨Xilinx官方出品的验证神器——AXI Verification IP (AXI VIP)。我们将通过实例解析其强大的协议检查与事务生成能力,为你构建一个清晰、系统的AXI VIP知识框架,为后续进行DDR3等高速接口的工程级验证打下坚实基础。 二 AXI VIP:为何是FPGA验证的“必需品”? 当我们对自定义的AXI主设备或从设备进行验证时,传统方法是手动编写测试平台(Testbench)。这种方式不仅效率低下,且极易因测试代码本身的错误而引入误导,更难以覆盖协议的所有边界情况

OpenClaw基础-3-telegram机器人配置与加入群聊

OpenClaw基础-3-telegram机器人配置与加入群聊 💡 大家好,我是可夫小子,《小白玩转ChatGPT》专栏作者,关注AI编程、AI自动化和自媒体。 Openclaw的优势是接入各种聊天工作,在前面的文章里,已经介绍了如何接入飞书。但之前我也提到了,飞书的最大的问题是请求多的限制,以及无法在非认证企业账号下面组建群聊。但这些限制另一个聊天工具可以打破,那就是Telegram,今天就跟大家分享一下,如果在OpenClaw里面接入Telegram。 第一步:Openclaw端配置 通过命令openclaw config,local→channels→telegrams 这里等待输入API Token,接下来我们去Telegram里面获取 第二步:Telegram端配置 1. 1. 在聊天窗口找到BotFather,打开对话与他私聊 2. 3. 然后再输入一个机器人,再输入一个账号名username,这里面要求以Bot或者Bot结尾,这个是全网的id,要 2. /newbot 来创建一个机器人,输入一个名字name