【超音速专利 CN118134841A】一种光伏产品缺陷检测AI深度学习算法

优质文章学习记录

10 Apr 2026 — 7 min read


申请号	CN202410053849.9
公开号（公开）	CN118134841A
申请日	2024.01.12
申请人（公开）	超音速人工智能科技股份有限公司(833753)
发明人（公开）	张俊峰（总); 叶长春(总); 廖绍伟

原文摘要

本发明公开一种光伏产品缺陷检测AI深度学习算法，涉及AI算法领域。该光伏产品缺陷检测AI深度学习算法，采用深度卷积神经网络作为预训练模型，使用特征金字塔网络结构FPN对预训练模型得到的不同尺度的特征图进行融合，采用区域提议网络RPN在特征图上生成候选框，该光伏产品缺陷检测AI深度学习算法通过使用预训练模型提取图像特征，使用FPN融合多尺度特征，使用RPN提取候选框，使用ROIAlign抽取局部特征，使用分类、回归、FCN进行缺陷分类、位置回归以及掩膜信息提取，对缺陷的分类以及输出缺陷效果的准确性好，对缺陷的定位精度高，对缺陷的描述准确且全面，从而提高了在光伏产品加工中，对产品的缺陷检测效果。

术语

FCN指的是全卷积网络，是深度学习中用于图像处理任务的一种重要架构，相比于传统的卷积神经网络CNN，FCN不仅能够识别图像中的对象，还能在像素级别对图像进行预测，如图像分割、图像生成等。
全卷积网络是一种由卷积层组成的神经网络架构，没有全连接层。相比于传统的CNN，全卷积网络的主要特点在于它的输出层是一个像素级别的密集特征图，每个像素点都对应输入图像中的一个局部感受野，这使得FCN能够对输入图像进行像素级别的预测和分析，比如图像分割，将图像中的每个像素进行分类，标记其所属的语义类别。
全卷积网络的出现在计算机视觉领域不仅在图像分割任务上取得了显著的成果，而且为其他图像处理任务，如图像生成、图像修复等，提供了重要的基础。全卷积网络在计算机视觉领域具有广泛的适用性。

步骤

1.一种光伏产品缺陷检测AI深度学习算法：所述深度学习算法包括如下步骤：
第一步：采用深度卷积神经网络作为预训练模型，对输入的光伏产品图像进行特征提取，获取图像的高层语义信息，得到不同尺度的特征图；
第二步：使用特征金字塔网络结构FPN对预训练模型得到的不同尺度的特征图进行融合，增强模型对不同尺寸产品缺陷的检测能力；
第三步：采用区域提议网络RPN在特征图上生成候选框，这些候选框涵盖了存在缺陷的区域和信息，以实现后续产品的缺陷快速检测；
第四步：使用ROIAlign技术从候选框中抽取出局部特征，以供后续的分类和回归任务使用；
第五步：利用全卷积网络FCN对局部特征进行分类，并同时进行回归操作以精确定位缺陷的位置；
第六步：除了分类和位置回归外，还利用FCN从局部特征中提取掩膜信息，以得到缺陷的精确形状和大小。
2：在第一步中，首先选择适用于光伏产品缺陷检测任务的预训练模型，然后，将预训练模型导入到算法中，并将待检测的光伏产品缺陷图像输入到模型中。
3.在第二步中，利用特征金字塔网络融合来自不同尺度的特征图，同时利用低层特征图的空间信息和高层特征图的语义信息，将这些特征图进行融合。
4.在第三步中，使用区域生成网络来提取候选框，RPN网络得到所有anchors的分类、回归信息，RPN基于特征图。
5.在第四步中，使用ROIAlign操作来抽取候选框内的局部特征，根据RPN网络输出的分类、回归信息，经过NMS得到最终的ROIs。
6.第五步中，对筛选出来的ROIs进行分类、回归、mask分割操作，使用分类器对候选框进行缺陷分类。
7.第六步中：分类器是传统的机器学习方法。
8.第七步中：分类器是深度学习方法。
9.在第六步，通过位置回归，根据分类结果和候选框的位置信息，对缺陷的位置进行进一步的调整和修正，同时，根据FCN得到的掩膜信息，进一步提取缺陷信息。

总结

该光伏产品缺陷检测AI深度学习算法，通过使用预训练模型提取图像特征，使用FPN融合多尺度特征，使用RPN提取候选框，使用ROIAlign抽取局部特征，使用分类、回归、FCN进行缺陷分类、位置回归以及掩膜信息提取，对缺陷的分类以及输出缺陷效果的准确性好，对缺陷的定位精度高，对缺陷的描述准确且全面，从而提高了在光伏产品加工中，对产品的缺陷检测效果。

硬件需求

工控机+显卡

扩展阅读

我想对大家说的话
工作中遇到的问题，可以按类别查阅鄙人的算法文章，请点击《算法与数据汇总》。
学习算法：按章节学习《喜缺全书算法册》，大量的题目和测试用例，打包下载。重视操作
有效学习：明确的目标及时的反馈拉伸区（难度合适）专注
员工说：技术至上，老板不信；投资人的代表说：技术至上，老板会信。
闻缺陷则喜(喜缺)是一个美好的愿望，早发现问题，早修改问题，给老板节约钱。
子墨子言之：事无终始，无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙，那算法就是他的是睛
失败+反思=成功成功+反思=成功

视频课程

先学简单的课程，请移步ZEEKLOG学院，听白银讲师（也就是鄙人）的讲解。
https://edu.ZEEKLOG.net/course/detail/38771
如何你想快速形成战斗了，为老板分忧，请学习C#入职培训、C++入职培训等课程
https://edu.ZEEKLOG.net/lecturer/6176

测试环境

操作系统：win7 开发环境： VS2019 C++17
或者操作系统：win10 开发环境： VS2022 C++17
如无特殊说明，本算法用**C++**实现。

别瞎改了！直接抄DeepSeek这5大降AIGC指令，搭配3款超有效工具，亲测98%暴降至5%！

毕业季最让人崩溃的瞬间，莫过于信心满满地把DeepSeek辅助写的论文传上去，结果查重报告一片红，AIGC检测率飙到90%以上。别慌！作为过来人，学姐告诉大家：AI生成的痕迹其实是有解决办法的。只要你懂得如何指挥DeepSeek自己净化自己，或者用对专业的辅助工具，把AI率降到5%以下真的不是梦。今天这篇文章，直接上干货。前半部分是5条经过实测的DeepSeek专属降AI指令，后半部分推荐3款确实能把AI率降下来的工具。建议先收藏，改论文时直接复制使用。一、【硬核实操】DeepSeek五大深度降AI指令这部分是核心干货。为了让DeepSeek更好地执行，我将所有复杂的降AI技巧整合成了一段完整、连续的指令。你只需要把论文分段，然后配合下面的指令发送即可，记得要开深度思考和联网搜索哦~ 💡 指令1：针对假大空特征【原理解析】 AI生成内容最容易被判定为机器痕迹的原因，是大量使用高频、通俗的万能词。根据同义词替换策略，我们需要强制模型调用学术语料库。 📋 复制这段Prompt发送给DeepSeek：请针对这段文字进行深度学术化重写，重点在于提升词汇的

【模型手术室】第四篇：全流程实战 —— 使用 LLaMA-Factory 开启你的第一个微调任务

专栏进度：04 / 10 (微调实战专题) 很多初学者卡在环境配置和复杂的 torch.train 逻辑上。LLaMA-Factory 的核心优势在于它集成了几乎所有主流国产模型（DeepSeek, Qwen, Yi）和海外模型（Llama 3, Mistral），并且原生支持 Gradio 可视化面板，让你在网页上点点鼠标就能“炼丹”。一、环境搭建：打造你的“炼丹炉” 为了保证训练不因版本冲突而崩溃，建议使用 Conda 进行物理隔离。 Bash 1. 克隆项目 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory 2. 安装核心依赖 (针对 CUDA 12.

Python 实现 AI 图像生成：调用 Stable Diffusion API 完整教程

从零开始学习使用 Python 调用 Stable Diffusion API 生成图像，涵盖本地部署、API 调用、ControlNet、图生图等进阶技巧。 1. 技术架构 Python 客户端 Stable Diffusion API 本地部署 SD WebUI / ComfyUI 云端 API Replicate / Stability AI Stable Diffusion 模型文生图 txt2img 图生图 img2img 局部重绘 inpainting 超分辨率 upscale 输出图像后处理管道存储本地/OSS 2. 图像生成方式对比 50%25%15%10%

【事件相机之三深度估计文章研读】Active Event Alignment for Monocular Distance Estimation

系列文章目录事件相机之一空间目标检测事件相机之二去噪文章研读事件相机之三单目深度估计提出了一种 **行为驱动(behavior driven, BD)** 的方法，用于从事件相机数据中估计物体距离。这种BD的方法模仿了人眼等生物系统如何根据物距稳定其视野：远处的物体需要较小的 **补偿(compensatory)** 旋转来保持聚焦，而附近的物体需要更大的调整来保持对齐。这种自适应策略利用自然稳定行为有效地估计相对距离。我们的方法针对特定感兴趣区域内的局部深度估计。通过在小区域内对齐事件，我们估计了稳定图像运动所需的角速度。 !!!我将会尽量删除论文中价值不大的描述，尽量精简，并找到较为新颖且具有迁移价值的点（尽力而为）文章目录 * 系列文章目录 * 一、介绍 * 二、相关工作 * 三、基于区域级像素对齐的距离估计 * 3.1 事件对齐 * 3.1.1 逐目标的事件对齐 * 3.1.2 全局速度方向估计 * 3.1.3