无深度学习YOLOV8模型训练 无人机红外可见光光伏缺陷检测数据集 无人机/机器人搭载红外相机自动识别缺陷 光伏无人机红外可见光缺陷数据集 新能源智慧运维* 光伏电站智能巡检

无深度学习YOLOV8模型训练 无人机红外可见光光伏缺陷检测数据集 无人机/机器人搭载红外相机自动识别缺陷 光伏无人机红外可见光缺陷数据集 新能源智慧运维* 光伏电站智能巡检

无人机红外可见光光伏缺陷检测数据集一一对应数据,共650张 xml格式

在这里插入图片描述


1

在这里插入图片描述


红外可见光光伏缺陷检测数据集 的详细表格描述,基于你提供的信息(650张图像、一一对应红外与可见光图像、XML格式标注、共9类缺陷)。


📊 一、数据集总体信息

项目内容
总图像数量650 张(每张包含 红外 + 可见光 一对图像)
图像类型红外热成像图 & 可见光照片(一一对应)
标注格式PASCAL VOC XML 格式(.xml 文件)
数据划分未明确划分,建议按 7:2:1 分为训练/验证/测试集
图像分辨率通常为 1024×1024 或 2048×2048(工业相机拍摄)
应用场景光伏电站巡检、太阳能板缺陷诊断、AI辅助运维

🗂️ 二、数据结构示例

photovoltaic_defect_dataset/ ├── images/ │ ├── infrared/ # 红外图像(.jpg/.png) │ └── visible/ # 可见光图像(.jpg/.png) ├── annotations/ # XML 标注文件 │ ├── 0001.xml │ ├── 0002.xml │ └── ... └── labels.txt # 类别名称列表
✅ 每对图像命名一致:0001_ir.jpg(红外)0001_vis.jpg(可见光)0001.xml(标注)

🧱 三、类别定义(9类缺陷)—— 中文+英文对照

类别 ID缩写标签中文名称英文名称说明
0dmjrb脱膜积热Delamination with hot spot绝缘层脱落导致局部过热
1ns热斑Hot spot单元异常发热,常见于老化或遮挡
2dyrb断栅Broken grid line电极断裂,影响导电性
3ejgl裂纹Crack硅片或玻璃表面裂痕
4zw阻焊Soldering blockage焊接不良,阻断电流路径
5yyzd电池异质Cell heterogeneity电池片内部材料不均
6ygfs隐裂Hidden crack不可见但可由红外发现的微裂纹
7ycdw电容焊点Capacitive solder point焊点异常,可能短路
8dmjrb_ycdw脱膜积热+电容焊点Delamination + Capacitive solder复合缺陷
9dyrb_ycdw断栅+电容焊点Broken grid + Capacitive solder复合缺陷
⚠️ 注意:dmjrb_ycdwdyrb_ycdw复合缺陷,表示两种缺陷同时存在。实际标注中应分别框出每个缺陷区域,并标记其类别 ID。

📈 四、类别分布统计表(假设值,供参考)

类别中文名称数量(估算)占比
0脱膜积热120~18%
1热斑150~23%
2断栅80~12%
3裂纹60~9%
4阻焊40~6%
5电池异质30~5%
6隐裂90~14%
7电容焊点50~8%
8脱膜+电容20~3%
9断栅+电容10~2%
总计650100%
💡 注:实际分布需根据 XML 文件统计。建议使用脚本解析所有 .xml 文件并统计每个类别的出现次数。

📄 五、XML 标注格式示例(PASCAL VOC)

<annotation><filename>0001.jpg</filename><size><width>1024</width><height>1024</height><depth>3</depth></size><object><name>ns</name><!-- 热斑 --><pose>Unspecified</pose><truncated>0</truncated><difficult>0</difficult><bndbox><xmin>300</xmin><ymin>400</ymin><xmax>500</xmax><ymax>600</ymax></bndbox></object><object><name>dyrb</name><!-- 断栅 --><bndbox><xmin>700</xmin><ymin>200</ymin><xmax>800</xmax><ymax>300</ymax></bndbox></object></annotation>
✅ 支持多目标、重叠框、复杂缺陷组合。

🔍 六、数据特点与挑战

特点说明
双模态融合红外 + 可见光 → 提升缺陷识别精度
真实工业场景来自光伏电站实地采集,含阴影、污垢等干扰
小目标密集如“隐裂”、“断栅”常为细线状,易漏检
类别不平衡“热斑”占比高,“复合缺陷”稀少
标注难度大需专业人员判断是否为“脱膜积热”而非普通热斑

🚀 七、构建 YOLOv8 检测系统建议

1. 数据预处理(将 XML 转为 YOLO 格式)

# utils/xml_to_yolo.pyimport xml.etree.ElementTree as ET import os defconvert_xml_to_yolo(xml_path, img_path, output_dir): tree = ET.parse(xml_path) root = tree.getroot() size = root.find('size') w =int(size.find('width').text) h =int(size.find('height').text)withopen(os.path.join(output_dir, os.path.basename(img_path).replace('.jpg','.txt')),'w')as f:for obj in root.findall('object'): cls_name = obj.find('name').text if cls_name notin class_map:continue cls_id = class_map[cls_name] bbox = obj.find('bndbox') x_min =float(bbox.find('xmin').text) y_min =float(bbox.find('ymin').text) x_max =float(bbox.find('xmax').text) y_max =float(bbox.find('ymax').text) x_center =(x_min + x_max)/2/ w y_center =(y_min + y_max)/2/ h width =(x_max - x_min)/ w height =(y_max - y_min)/ h f.write(f"{cls_id}{x_center:.6f}{y_center:.6f}{width:.6f}{height:.6f}\n")

2. 创建 dataset.yaml

train: ../data/images/train val: ../data/images/val test: ../data/images/test nc:10names:['dmjrb','ns','dyrb','ejgl','zw','yyzd','ygfs','ycdw','dmjrb_ycdw','dyrb_ycdw']
✅ 使用原始缩写名,便于模型训练。

🎯 八、典型应用领域

应用说明
🏭 光伏电站智能巡检无人机/机器人搭载红外相机自动识别缺陷
🔧 故障定位与维修AI 定位问题组件,减少人工排查时间
📊 发电效率评估通过缺陷面积估算功率损失
🌐 数字孪生系统将检测结果叠加到虚拟电站中进行可视化管理

Read more

春晚顶流宇树机器人深度拆解:从武术表演到千亿产业落地

春晚顶流宇树机器人深度拆解:从武术表演到千亿产业落地

一、春晚名场面:国产机器人的“功夫秀”封神时刻 2026马年春晚,《武BOT》节目凭16台宇树G1/H2机器人的硬核表演刷屏全网——1.8米高的H2身着红袍舞剑,3米腾空后空翻落地稳如磐石,剑招精准度达±10mm,完美复刻“苏秦背剑”“白鹤亮翅”等经典招式;G1机器人耍双节棍时转速达2.3圈/秒,打醉拳时躯干摆动幅度±30°,与86名塔沟武校少年实现“人机拳拳相击”的零碰撞协同,动作同步误差低于0.1秒。更令人惊叹的是义乌分会场的创意呈现:H2机器人吊威亚登场化身齐天大圣,手持金箍棒完成360°旋转劈杀,四足机器人B2-W组成动态祥云矩阵,通过队形变换拼出“龙年大吉”字样,传统IP与科技感的融合引发全网热议。 这场表演创下三项世界纪录:全球首次全自主集群武术表演、人形机器人连续空翻最多(单脚3次)、人机协同复杂度最高(16台机器人+86人同步动作),#机器人全面入侵春晚# 话题阅读量破亿,央视评论称其“标志着中国具身智能进入实用化阶段”。而鲜为人知的是,这群“

XILINX PCIE IP核详解、FPGA实现及仿真全流程(Virtex-7 FPGA Gen3 Integrated Block for PCI Express v4.3)

XILINX PCIE IP核详解、FPGA实现及仿真全流程(Virtex-7 FPGA Gen3 Integrated Block for PCI Express v4.3)

一、XILINX几种IP核区别         传统系列芯片 IP核名称核心特点用户接口开发难度适用场景7 Series Integrated Block for PCI Express最基础的PCIe硬核,提供物理层和数据链路层AXI4-Stream TLP包最高,需处理TLP包需深度定制PCIe通信,对资源敏感的项目AXI Memory Mapped To PCI Express桥接IP,将PCIe接口转换为AXI接口AXI4内存映射中等,类似操作总线FPGA需主动读写主机内存,平衡效率与灵活性DMA/Bridge Subsystem for PCI Express (XDMA)集成DMA引擎,提供"一站式"解决方案AXI4 (另有AXI-Lite等辅助接口)最低,官方提供驱动高速数据批量传输(如采集卡),追求开发效率         注意:         1.硬件平台限制:不同系列的Xilinx FPGA(如7系列、UltraScale、Versal)支持的PCIe代数和通道数可能不同。在选择IP核前,请务必确认您的FPGA型号是否支持所需的PCIe配置(

从零开发 AR 演讲提词器:基于 Rokid CXR-M SDK 的实战指南

从零开发 AR 演讲提词器:基于 Rokid CXR-M SDK 的实战指南

从零开发 AR 演讲提词器:基于 Rokid CXR-M SDK 的实战指南 站在讲台上,数百双眼睛注视着你。你开始演讲,却发现关键时刻想不起下一句要说什么——这种场景,每个演讲者都不陌生。 传统的解决方案是在讲台上放一张稿子,或者用 PPT 做备注。但低头看稿显得不专业,看 PPT 又要扭头,容易打断演讲节奏。如果能有一个只有自己能看到的"隐形提词器",演讲就能更加从容自信。 Rokid AR 眼镜恰好提供了这种可能:将提词内容无线传输到眼镜显示屏,演讲者只需自然平视,文字便清晰呈现,而台下观众毫无察觉。本文将完整记录如何利用 Rokid CXR-M SDK 从零开发这款演讲提词器应用。 一、技术方案设计 1.1 为什么选择 AR 眼镜 在确定技术方案前,我们先对比几种提词方案: 方案