基于7系列FPGA实现万兆网通信

基于7系列FPGA实现万兆网通信

目录

一、FPGA实现万兆以太网

1.1 、10G PCS/PMA核

1.1.1、以太网XGMII接口

1.1.2 、MDIO接口(可选用)

1.1.3、10G PCS/PMA核

1.2、10G Ethernet Subsystem核实现万兆网

二、万兆网功能测试

2.1 、ARP及Ping功能

2.2 、巨型帧

2.3、测速

2.4、代码


        之前分享过u/u+系列FPGA的万兆网通信:UltraScale/+  FPGA实现万兆网的两种方式:GT核、10G Ethernet Subsystem核,在别的平台有些网友问是否支持巨型帧、7系列、速率等问题,这里就专门写篇7系列的万兆网,相关功能的测试。

        今年最后一篇了。明后年主要准备分享些:

  • 低速器件的开发使用、低速协议
  • RFSoC中的ADC、DAC开发使用
  • PCIe核的开发使用,上位机的驱动开发
  • TCP/IP协议、客户端及服务器的开发
  • GIGE千兆/万兆相机的使用开发
  • zynq的相关开发
  • 一些信号处理

一、FPGA实现万兆以太网

          本文只介绍使用10G以太网核和10G PCS PMA核两种方式实现的万兆网通信;基于SerDes实现10G以太网通信采用64B/66B编码方式,串行线速率为10.3125Gbps。

1.1 、10G PCS/PMA核

        关于该核的使用,参考PG068;此核的用户接口为XGMII。

        对于光纤或者RJ45水晶头的接口(10GBASE-R类型),内部功能结构如下:

        万兆网通信采用64B/66B编码。64B/66B编码在发送前需要对数据加扰,在接收数据时也要先对数据解扰。64B/66B编码:在加扰后的64bit数据前加入2bit的同步位(Sync)组成66bit数据,同步位表示该64bit数据是数据帧还是控制帧。

1.1.1、以太网XGMII接口

        这里只讨论64bit数据位宽的XGMII接口;xgmii_txd对应字节为控制字符时,xgmii_txc对应的控制位为高电平;在xgmii_txd对应字节为数据字符时,xgmii_txc对应的控制位为低电平。

        相关时序:

        XGMII接口中相关数据、控制的定义如下:空闲状态为0x07、起始状态为0xFB、终止状态为0xFD。

        关于以太网帧如何对接XGMII接口,可以通过以下过程理解:

        以太网帧结构如下:

图片

        XGMII接口中:一帧报文的封装发送:添加控制符,空闲IDLE(0x07)+ START(0xFB)+ 前导码+ SFD + MAC + ...... + FCS + TERMINATE(0xFD)。比如以下ILA截图:

图片

        控制对应的控制符为1,后续在64B/66B编码中转换为2bit同步位(Sync)。

图片

        在增加起始、结束、空闲控制符后,按下图的转换规则:比如起始S转换为64bit中MSB字节为0x78;空闲状态为64bit中MSB字节为0x1E。

图片

图片

        最后,将上述64bit的接口数据经加扰,送到10G PCS/PMA核的XGMII接口。

        用户接收到XGMII接口数据,按上述逆过程解析网络帧。

1.1.2 、MDIO接口(可选用)

        本部分只有一些场景会用到,不过多描述,具体寄存器描述见PG068的Configuration Vector描述。

          MDIO接口是该核的寄存器配置接口,类似于千兆网PHY的寄存器配置。其相关时序配置如下:

1.1.3、10G PCS/PMA核

        该核需要license,核页面如下:该核只适用于7系列FPGA。

        上述核配置页面不启用:MDIO接口。

        关于该核的时钟、复位部分的使用可参考其example。

1.1.4、万兆网开发

        借助例化上述GT核后,可按照图1开发编码实现PCS相关功能:对于发送帧功能,用户端的帧数据,封装起始、结束、空闲码后,经加扰后,结合同步字段,经变速箱Gearbox,并串转换等,最终经电路传送出去;对于接收,是上述过程的逆操作。

        开发过程主要涉及:帧数据按照上节内容封装与解封、同步字段的增添与解析、加解扰。其中帧数据的封装与解析按照以太网协议进行即可。

        具体网络协议,用户根据具体需要封装、解析即可,比如UDP、TCP、FTP等;这里只讨论万兆网通信方式,不介绍具体协议,协议内容可参考:FPGA实现千兆网UDP协议(含ARP、ICMP)

1.2、10G Ethernet Subsystem核实现万兆网

        该核的用户数据接口为AXIS,这里不再介绍。

        此方式是实现万兆网通信最快捷的方法,需要license。开发按照以太网协议对网络帧进行解析与封装即可,只需关心如下结构:

图片

        其核配置界面如下:

        根据开发板这里选择10GBASE-R类型,64bit的AXIS数据接口。

        AXI-Lite配置接口时钟范围选择,这里没有启用流控。

        这页主要是DRP及状态接口。

        这页没启用时间戳。

        这页选择时钟及复位是集成核内外。多通道的万兆网通信使用核方式与U/U+系列不同。

        关于时钟及复位的使用,可参考其example。

二、万兆网功能测试

        本文只针对UDP协议栈测试,UDP相关协议可参考:FPGA实现千兆网UDP协议(含ARP、ICMP)。千兆、万兆、40G/50G、100G以太网的UDP协议栈的实现原理相同,只是用户数据位宽、CRC检验的实现难易不同。

2.1 、工程实现

        上述两种方式使用相应的核都可以实现万兆网通信,本文采用UDP协议栈测试工程部分功能。这里不介绍UDP协议栈(ARP缓存、ping、UDP),比如向对端发包前,先查询ARP列表,查询无果则ARP寻址后再发包;对于一些明确的场景,也可以省略ARP寻址。

        比如10G万兆网核的工程:

        两端的信息配置:

2.1 、ARP及Ping功能

        通过ping下位机测试arp及ping应答功能:

2.2 、巨型帧

        不同的网卡、路由器等支持的最大MTU不同,但都支持46~1500字节。为了实现长数据包的传输,产生了巨型帧。

        对于多级路由的网络包传输,为了避免中间路由节点的设备丢弃,采用巨帧分片处理:巨帧拆分成多包,利用IP层的头部分片及偏移字段(第2个DW中)区分数据的完整性和顺序。分片的首包保持帧结构的完整字段,MTU最大1500字节;其他分片包在网络帧结构中去除了UDP的头部字段。

图片

        对于点到点直连的应用场景,或者中间路由节点都支持MTU大值(比如9000字节),则利用巨帧时可采用标准的巨帧分片策略,也可采用不分片的策略。

        FPGA向上位机发送长度为8500字节的UDP巨型帧的测试如下:分片为5包1480字节和最后一包1100字节。

        协议栈仿真:测试模块产生8500字节的测试数据,协议栈进行巨帧分片,环回后接收端能正确解析数据。

        10G以太网核上板测试:测试模块产生8500字节的测试数据

        上位机wireshark观测上发的矩阵数据,分片以及偏移量正常:

        从第2个分片开始,不再有UDP头部字段。

         10G PCS/PMA核的测试:

2.3、测速

        两个工程向上位机发包,当接口空闲时一直上发,测速结果近9.5 Gbps:

2.4、代码

        有相关需要的可私信联系。

往期回顾

UltraScale/+  FPGA实现万兆网的两种方式:GT核、10G Ethernet Subsystem核

FPGA 40G/50G Ethernet Subsystem核的使用

FPGA实现100G UDP通信

FPGA实现千兆网UDP协议(含ARP、ICMP)

FPGA光通信系列4 — 基于64b/66b编码的自定义协议

FPGA光通信系列3 — 基于8b/10b编码的自定义协议应用

FPGA光通信系列2——Aurora 64B/66B的使用

FPGA实现Aurora光通信应用(8B/10B)

JESD204B的使用系列——3、DAC的应用(AD9164  9.6GSPS)

JESD204B的使用系列——2、协议及ADC的应用(AD9689)

JESD 204B的使用系列—1、时钟芯片的应用

Read more

宇树科技机器人核心技术

宇树科技机器人核心技术

前言 宇树科技作为全球足式/人形机器人领域的标杆企业,其技术体系覆盖消费级(Go2)、工业级(B2)、人形(G1/H1)全产品线,以“硬件自研+软件全栈+AI赋能”构建核心壁垒。本文不仅拆解宇树机器人的关键技术(单硬件、单软件、软硬件协同、AI+),还配套就业技能图谱、学习路线与工具推荐,适合机械、电子、计算机、AI领域开发者/求职者参考。 一、宇树科技机器人核心技术全景(附插图建议) 宇树的技术体系可概括为“四层金字塔结构”,从下到上实现“能运动→会运动→智能运动”的进阶: 技术层级核心定位代表技术应用价值底层硬件机器人“躯体骨架”自研伺服电机、分层计算平台、4D激光雷达保障运动性能与环境适配性全栈软件机器人“智慧大脑”MPC/WBC控制算法、SLAM感知融合、ROS2中间件实现精准控制与灵活交互软硬件协同机器人“神经中枢”实时控制闭环、

DeOldify Flask集成教程:将上色能力嵌入自有Web系统完整示例

DeOldify Flask集成教程:将上色能力嵌入自有Web系统完整示例 1. 项目概述 你是不是遇到过这样的场景:手头有一堆黑白老照片,想要让它们重焕光彩,但又不想学习复杂的深度学习技术?或者你正在开发一个Web应用,想要集成图片上色功能,却被模型部署和API对接搞得头大? 现在有了DeOldify图像上色服务,这些问题都能轻松解决。基于U-Net深度学习模型,这个服务能够智能地将黑白图片转换为彩色图片,而且最重要的是——你不需要懂任何深度学习知识,就能快速集成到自己的系统中。 本文将手把手教你如何将DeOldify图像上色能力集成到Flask Web应用中,从环境准备到完整代码实现,让你快速拥有一个专业的图片上色工具。 2. 环境准备与快速部署 2.1 系统要求 在开始之前,确保你的系统满足以下要求: * Python 3.8或更高版本 * 至少4GB内存(处理大图片建议8GB以上) * 网络连接(用于下载模型和依赖包) 2.2 安装必要依赖 首先创建并激活虚拟环境: # 创建项目目录 mkdir deoldify-flask-app cd deo

MusePublic镜像免配置实战:无需conda环境,直接运行WebUI

MusePublic镜像免配置实战:无需conda环境,直接运行WebUI 1. 为什么艺术创作不该被环境配置绊住脚? 你有没有试过——明明想马上生成一张有电影感的时尚人像,却卡在conda环境创建、依赖包版本冲突、CUDA路径报错上?折腾两小时,连WebUI的界面都没见着。 MusePublic镜像就是为解决这个问题而生的。 它不依赖conda,不强制要求Python虚拟环境,不让你手动pip install一堆可能互相打架的包。你只需要一个装好NVIDIA驱动的Linux系统(Ubuntu 22.04或CentOS 7+),一行命令启动,30秒内就能打开浏览器,开始输入提示词、调整参数、点击生成——整个过程像打开一个本地网页一样自然。 这不是“简化版”或“阉割版”,而是真正把工程细节藏在背后:模型加载、显存管理、安全过滤、调度优化,全部预置完成。你面对的,只有干净的界面和确定的输出。 对设计师、摄影师、内容创作者来说,时间就是灵感。MusePublic做的,是把“技术门槛”从“需要懂AI部署”降维到“

浏览器远程桌面终极方案:Web RDP完整实现指南

浏览器远程桌面终极方案:Web RDP完整实现指南 【免费下载链接】mstsc.jsA pure Node.js Microsoft Remote Desktop Protocol (RDP) Client 项目地址: https://gitcode.com/gh_mirrors/ms/mstsc.js 在数字时代的技术探索中,远程控制早已不再是专业IT人员的专属领域。今天,我们将深入解析一款革命性的工具——mstsc.js,它通过纯JavaScript实现了完整的Microsoft远程桌面协议,让浏览器直接变身RDP客户端,开启Web端远程控制的全新篇章。 技术原理深度揭秘 mstsc.js的核心魅力在于其纯前端实现架构。该项目巧妙地运用了Canvas渲染技术和Socket.IO实时通信机制,在浏览器与远程服务器之间构建了一座高效的数据桥梁。 前端模块位于client/js/目录,包含多个关键组件: * mstsc.js:主控制模块,处理远程桌面会话管理 * canvas.js:负责远程桌面的图像渲染和显示