实时口罩检测-通用详细步骤：修改webui.py适配自定义输入尺寸

优质文章学习记录

10 Apr 2026 — 7 min read

实时口罩检测-通用详细步骤：修改webui.py适配自定义输入尺寸

1. 项目简介与背景

实时口罩检测是当前计算机视觉领域的一个重要应用场景，特别是在公共卫生安全方面发挥着关键作用。今天我们要介绍的是基于DAMO-YOLO框架的实时口罩检测模型，这个模型能够快速准确地识别图像中的人脸，并判断是否佩戴口罩。

DAMO-YOLO是一个专门为工业落地设计的目标检测框架，在速度和精度之间找到了很好的平衡。相比其他YOLO系列方法，它不仅检测效果更好，还保持了极高的推理速度，非常适合实时应用场景。

这个模型的核心价值在于：你只需要输入一张图片，它就能自动找出图中所有的人脸，并用矩形框标出来，同时告诉你每个人是否戴了口罩。无论是单人还是多人场景，都能很好地处理。

2. 模型技术架构

2.1 DAMO-YOLO框架特点

DAMO-YOLO的整体网络结构由三个主要部分组成：backbone（MAE-NAS）、neck（GFPN）和head（ZeroHead）。这种设计采用了"大脖子小头"的思路，能够更好地融合低层的空间信息和高层的语义信息，从而提升最终的检测效果。

简单来说，backbone负责提取图像特征，neck负责融合不同层次的特征信息，head则负责最终的检测输出。这种分工明确的设计让模型既快速又准确。

2.2 检测类别说明

模型能够识别两种状态：

facemask（类别ID：1）：表示检测到佩戴口罩的人脸
no facemask（类别ID：2）：表示检测到未佩戴口罩的人脸

这种简单的二分类设计让模型非常专注于口罩检测这个特定任务，避免了不必要的复杂度。

3. 基础使用教程

3.1 环境准备与启动

首先确保你已经部署好了模型服务。模型的前端界面代码位于：

/usr/local/bin/webui.py

启动服务后，你会看到一个web界面。第一次加载时可能需要一些时间，因为模型需要初始化。

3.2 基本检测操作

使用过程非常简单：

打开web界面
上传包含人脸的图片
点击"开始检测"按钮
查看检测结果

系统会自动用矩形框标出检测到的人脸，并在旁边标注是否佩戴口罩。你可以尝试上传不同的图片来测试模型的效果。

4. 修改webui.py适配自定义尺寸

4.1 理解输入尺寸的重要性

在实际应用中，我们经常需要处理不同尺寸的输入图像。原始模型可能对输入尺寸有特定要求，但通过修改webui.py，我们可以让模型适配各种自定义尺寸。

输入尺寸的适配主要涉及两个方面：前端的图像预处理和后端的模型输入调整。我们需要确保无论输入什么尺寸的图像，都能被正确处理并给出准确的检测结果。

4.2 关键代码修改步骤

找到webui.py中处理图像输入的部分，通常包括以下步骤：

def preprocess_image(image, target_size=(640, 640)): """ 预处理输入图像，调整到目标尺寸 target_size: 期望的输入尺寸，默认为(640, 640) """ # 获取原始图像尺寸 original_size = image.shape[:2] # 调整图像尺寸 resized_image = cv2.resize(image, target_size) # 进行必要的归一化处理 normalized_image = resized_image / 255.0 return normalized_image, original_size

4.3 尺寸适配逻辑实现

在修改时需要注意几个关键点：

保持宽高比：为了避免图像变形，最好在调整尺寸时保持原始宽高比。可以通过添加padding的方式来实现：

def resize_with_padding(image, target_size): """ 保持宽高比调整尺寸，不足部分用灰色填充 """ h, w = image.shape[:2] target_h, target_w = target_size # 计算缩放比例 scale = min(target_h / h, target_w / w) new_h, new_w = int(h * scale), int(w * scale) # 调整图像尺寸 resized = cv2.resize(image, (new_w, new_h)) # 创建目标图像并填充 padded = np.full((target_h, target_w, 3), 128, dtype=np.uint8) pad_top = (target_h - new_h) // 2 pad_left = (target_w - new_w) // 2 padded[pad_top:pad_top+new_h, pad_left:pad_left+new_w] = resized return padded, (scale, pad_top, pad_left)

4.4 后处理调整

调整输入尺寸后，还需要相应地调整检测结果的坐标转换：

def adjust_detection_results(boxes, original_size, preprocess_info): """ 调整检测框坐标到原始图像尺寸 boxes: 模型输出的检测框 original_size: 原始图像尺寸 preprocess_info: 预处理时记录的信息（缩放比例、padding等） """ scale, pad_top, pad_left = preprocess_info orig_h, orig_w = original_size adjusted_boxes = [] for box in boxes: x1, y1, x2, y2 = box # 去除padding影响 x1 = (x1 - pad_left) / scale y1 = (y1 - pad_top) / scale x2 = (x2 - pad_left) / scale y2 = (y2 - pad_top) / scale # 确保坐标在图像范围内 x1 = max(0, min(x1, orig_w)) y1 = max(0, min(y1, orig_h)) x2 = max(0, min(x2, orig_w)) y2 = max(0, min(y2, orig_h)) adjusted_boxes.append([x1, y1, x2, y2]) return adjusted_boxes

5. 实际应用测试

5.1 测试不同尺寸图像

修改完成后，建议使用不同尺寸的图像进行测试，确保各种情况都能正常工作：

正方形图像：测试基本功能
横版图像：测试宽度大于高度的情况
竖版图像：测试高度大于宽度的情况
极端比例：测试非常宽或非常高的图像

5.2 性能考虑

在处理大尺寸图像时，需要注意性能问题。如果图像太大，可以考虑以下优化策略：

def smart_resize(image, max_size=1024): """ 智能调整图像尺寸，避免过大影响性能 """ h, w = image.shape[:2] if max(h, w) > max_size: scale = max_size / max(h, w) new_h, new_w = int(h * scale), int(w * scale) image = cv2.resize(image, (new_w, new_h)) return image

6. 常见问题解决

6.1 检测框位置不准

如果发现调整尺寸后检测框位置不准确，检查坐标转换逻辑是否正确。特别是padding的处理和缩放比例的计算。

6.2 性能下降

处理大尺寸图像时如果感觉速度变慢，可以考虑添加尺寸限制，或者使用更高效的图像处理库。

6.3 内存不足

对于特别大的图像，可能会出现内存不足的问题。这时候需要添加适当的内存管理机制，比如分块处理或者使用生成器。

7. 总结与建议

通过修改webui.py来适配自定义输入尺寸，我们大大增强了实时口罩检测模型的实用性。现在它可以处理各种尺寸的输入图像，而不再受限于固定的输入要求。

关键修改要点总结：

保持图像宽高比，避免变形
正确处理padding和坐标转换
考虑性能优化，特别是对大尺寸图像
充分测试各种尺寸和比例的图像

实用建议：

在实际部署前，用各种测试图像充分验证修改效果
考虑添加图像尺寸的自动优化功能
记录处理日志，便于调试和优化

这些修改让我们的口罩检测系统更加灵活和实用，能够适应更多的实际应用场景。无论是监控视频流还是处理用户上传的图片，都能提供准确的口罩检测服务。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 ZEEKLOG星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

OpenClaw+优云智算Coding Plan：从灵感到成文，再到公众号发布的全流程AI自动化

1. 背景在自媒体运营、技术分享和日常内容创作中，许多从业者面临碎片化、低效率和重复劳动的问题。从灵感闪现到文章发布，整个过程涉及多个步骤如构思、撰写、排版及上传等，需要频繁切换工具与手动调整格式，耗时费力且容易出错。目前市面上的AI工具大多只能解决特定环节的问题，无法覆盖整个创作流程；而专业自动化平台要么操作复杂，要么成本高昂，难以普及使用。为此，我使用OpenClaw开源AI智能体（龙虾）和优云智算Coding Plan大模型服务搭建了一个流水线。通过OpenClaw的任务管理和工具调用能力，加上优云智算提供的稳定低价算力支持，实现了“灵感输入→文案生成→内容优化→公众号发布”的端到端全流程自动化，极大提高了效率，让创作者能够更加专注于创意本身。 2. AI大模型配置优云智算Coding Plan是聚合了OpenAI、Claude、DeepSeek、智谱GLM、MiniMax等全球主流大模型的订阅式算力服务，兼容OpenAI API协议，支持Claude Code/Codex/OpenClaw等AI工具，能完美对接OpenClaw，为内容创作提供稳定的AI生成能力，本

AI课堂生成网站丨OPENMAIC丨清华团队开源项目

OpenMAIC（谐音“My课”）是一个AI教学平台，它能为你生成一个专属的7x24小时AI教室。在这个教室里，你是唯一的真人学生，而老师、助教和同学都由AI智能体扮演。 * AI老师：负责主讲课程，可以在虚拟白板上实时书写、画图，并进行语音讲解。 * AI助教与同学：会与你实时互动，他们可以提问、发起讨论，模拟真实课堂的临场感。你只需要输入一个课程主题（如“什么是摩擦力”）或上传一份文档，系统就能自动生成包含幻灯片、随堂测验、互动模拟和项目式学习活动的完整课程。 🎓 主要特点 * 极速课程构建：只需输入关键词或上传文档，AI即可在约30分钟内自动生成一套结构完整的教学包，成本极低。 * 拟真多角色课堂：通过多智能体协同，模拟出教师、助教和不同性格的同学，他们可以说话、在白板上绘画，并与你进行实时讨论，显著增强学习的参与感。 * 跨应用轻量调用：通过内置的OpenClaw集成，用户可以直接在飞书、Slack等主流协作工具中，通过简单的指令触发课程生成。 * 全格式灵活交付：生成的课件支持导出为可编辑的PPT文件或打包为独立的HTML文件，方便二次编辑和使用。

【Coze-AI智能体平台】低门槛玩转Coze工作流！基础创建+五大核心节点+新闻扩展实战，新手直接抄作业

🔥小龙报：个人主页 🎬作者简介：C++研发，嵌入式，机器人方向学习者 ❄️个人专栏：《coze智能体开发平台》 ✨ 永远相信美好的事情即将发生文章目录 * 前言 * 一、创建工作流 * 1.1 操作路径：从登录到进入创建界面 * 1.2 配置规范：名称与描述的设置规则 * 1.2.1 工作流名称要求： * 1.2.2 工作流描述 * 1.3 初始界面：默认节点与编辑区域 * 1.3.1 默认节点 * 1.3.2 编辑区域 * 二、节点系统详解 * 2.1 基础节点 * 2.1.1

2026 Python+AI入门｜0基础速通，吃透热门轻量化玩法

🎁个人主页：User_芊芊君子 🎉欢迎大家点赞👍评论📝收藏⭐文章 🔍系列专栏：AI 文章目录： * 一、2026 Python+AI入门，必抓3个热门新趋势 * 二、入门前提：不用啃硬骨头，掌握这2点就够了 * 环境搭建（10分钟搞定，Windows/Mac通用） * 三、3个实战案例 * 案例1：30行代码开发AI文本总结工具（轻量化工具，最易上手） * 案例2：大模型微调入门（Llama 3微调，2026热门） * 案例3：AI自动数据标注（图像标注，企业刚需） * 四、Python+AI入门学习流程图（2026最新，不绕路） * 五、2026新手避坑指南 * 六、总结【前言】大家好，我是一名深耕AI入门教学的开发者，