YOLO+OpenClaw+SAM 微调：工业缺陷自动标注方案

YOLO+OpenClaw+SAM 微调：工业缺陷自动标注方案 | 极客日志

YOLO+OpenClaw+SAM 微调：工业缺陷自动标注方案

不能实时，不代表不能用。微调 SAM+ 云端部署，让工业标注从'人工描边'变'一键验收'。

工业缺陷检测常面临标注效率挑战。例如 PCB 质检中，标注员对电路板缺陷图进行边界勾勒，单张耗时较长。YOLO 能框选但精度不足，通用 SAM 模型在工业场景下适应性较差。本方案展示一套低代码落地路径：YOLO 粗定位 + 微调 SAM 精分割 + OpenClaw 自动调度，让标注工作自动化。

一、工业自动标注的三道坎

坎 1：推理延迟问题 部分自动化工具从接收指令到返回结果存在数秒延迟。产线实时质检可能受限，但批量标注任务可接受异步处理——将数千张图交由 AI 后台运行，员工次日验收结果。

坎 2：边缘端算力与安全风险 调用大模型通常需要较高显存（如 8GB），普通设备难以支撑。且自动化工具若具备文件读写权限，本地部署存在安全隐患。建议：采用云端隔离部署，利用云服务商的算力与安全机制。

坎 3：通用模型适配性 SAM 擅长自然图像分割，面对工业缺陷（划痕、凹坑）时边界易跑偏。实验表明，微调 SAM 可提升分割精度约 30%，且仅需调整少量参数。

二、微调 SAM：工业缺陷精分割的低代码方案

2.1 为什么用 LoRA 微调？

全量微调 SAM 需多卡集群长时间训练。LoRA 微调仅更新约 2% 的参数，训练速度提升显著，效果接近全量微调，适合资源有限的场景。

2.2 核心代码

from peft import LoraConfig, get_peft_model
from segment_anything import sam_model_registry
import torch

# 加载通用 SAM
sam = sam_model_registry["vit_h"](checkpoint="sam_vit_h.pth")

# 配置 LoRA（只调整注意力层）
lora_config = LoraConfig(
    r=16,              # 秩维度
    lora_alpha=32,
    target_modules=["qkv"],  # 只改查询/键/值层
    lora_dropout=0.1
)

# 应用 LoRA
model = get_peft_model(sam, lora_config)
# 可训练参数占比仅 2.5%，显存需求大幅降低

2.3 工业专用损失函数

针对样本少、边界重要的特点，设计混合损失函数：

def industrial_loss(pred, target):
    """Dice + Focal 组合
    Dice：让分割边界更贴合
    Focal：让模型更关注难分的缺陷区域
    """
    pred_sigmoid = torch.sigmoid(pred)
    
    # Dice Loss（边界贴合）
    intersection = (pred_sigmoid * target).sum()
    dice = 1 - (2 * intersection) / (pred_sigmoid.sum() + target.sum() + 1e-6)
    
    # Focal Loss（关注难例）
    ce = torch.nn.functional.binary_cross_entropy_with_logits(pred, target, reduction='none')
    pt = torch.exp(-ce)
    focal = 0.25 * (1-pt)**2 * ce
    
    return 0.6 * dice + 0.4 * focal.mean()

实际应用中，该方案可将微小划痕召回率显著提升，标注修正时间大幅缩短。

三、低代码落地：YOLO 检测 + SAM 微调 + OpenClaw 调度

3.1 自动标注器核心代码

import cv2, json, numpy as np
from pathlib import Path
from ultralytics import YOLO
from segment_anything import SamPredictor
from peft import PeftModel

class IndustrialAnnotator:
    def __init__(self, yolo_path, sam_path, lora_path):
        self.yolo = YOLO(yolo_path)
        sam = sam_model_registry["vit_h"](checkpoint=sam_path)
        peft_model = PeftModel.from_pretrained(sam, lora_path)
        self.predictor = SamPredictor(peft_model)

    def annotate(self, img_path, out_dir):
        img = cv2.imread(img_path)
        self.predictor.set_image(img)
        
        # 1. YOLO 粗定位
        results = self.yolo(img)[0]
        annotations = []
        for box in results.boxes:
            x1,y1,x2,y2 = map(int, box.xyxy[0])
            
            # 2. SAM 微调精分割
            masks,_,_ = self.predictor.predict(box=np.array([x1,y1,x2,y2]))
            mask = masks[0]
            
            annotations.append({
                "type": self.yolo.names[int(box.cls[0])],
                "bbox": [x1,y1,x2,y2],
                "mask": mask.tolist()
            })
        
        # 3. 输出 JSON 标注文件
        with open(f"/.json", )  f:
            json.dump(annotations, f)

3.2 OpenClaw 低代码配置

部署后，通过自然语言指令建立自动化流程：

用户：每天凌晨 2 点，用 industrial-annotator 技能处理 /data/defect_raw/ 目录下的图片，先用 YOLO 检测缺陷，再用微调后的 SAM 生成精细掩码，输出标注文件到 /data/defect_annotated/
系统：已创建定时任务，每天 2:00 执行批量标注

四、云服务器部署方案

鉴于本地算力限制与安全风险，推荐采用云端部署。

4.1 优势

模板一键部署：选择 AI 智能体模板快速创建环境
安全隔离：云端运行，避免误删本地文件
低代码配置：网页操作即可完成大部分设置

4.2 部署步骤

购买服务器：选择轻量应用服务器，配置 AI 相关模板。
配置模型：在管理页面选择大语言模型 API 并粘贴密钥。
上传权重：使用工具将训练好的 LoRA 权重上传至服务器。
安装技能：在控制台配置页输入技能名称并安装。
接入 IM：配置企业微信或钉钉通道凭证，发布后即可通过聊天软件下达指令。

五、落地成果展示

某制造企业案例显示，原有流程人工逐张标注耗时极长。采用本方案后：

AI 自动标注：批量处理完成，夜间运行
人工修正：单张时间大幅缩短
人力成本：显著降低

效果对比：

指标	微调前	微调后
缺陷召回率	68%	92%
分割边界 IoU	0.73	0.89
人工修正时间/张	5 分钟	40 秒

总结

当前的 YOLO+OpenClaw+SAM 方案虽难以满足实时质检，但在批量标注场景中表现优异。通过 LoRA 微调 SAM、混合损失优化边界、云端部署保障安全，可帮助团队提效降本。无需编写复杂代码，即可拥有在线的 AI 标注助手。

YOLO+OpenClaw+SAM 微调：工业缺陷自动标注方案