本算法采用多阶段级联架构,将缺陷检测任务分解为方向校正、模板对齐、差异构造与实例分割四个核心模块。算法输入为单张待检测标签图像,输出为缺陷的旋转矩形框坐标及缺陷总数,同时支持输出合并的缺陷Mask。
(1)方向校正
印刷标签在采集过程中可能出现任意方向放置,方向不一致会导致模板对齐失败。本模块采用YOLO26n分类模型对输入图像进行4分类(0°/90°/180°/270°)分类结果用于自动旋转图像至统一方向,为后续模板对齐提供一致的输入。
(2)模板对齐
模板对齐是本算法的核心模块之一,其目的是将待测图像与正常样本模板进行像素级对齐,为后续的缺陷检测提供参考基准。同时针对全局对齐效果差问题,我们使用XFeat进行对齐。
XFeat是一种轻量级局部特征提取与匹配算法,相比传统SIFT/ORB具有更高的匹配精度与速度。使用它能够有效应对拍摄角度偏差、位置偏移以及轻微的非刚性形变,为后续差异计算提供可靠的像素对应关系。
针对小样本场景下训练数据不足的问题,本算法根据印刷缺陷的视觉特性与形成机理设计了四类定制化数据增强策略。
(1)模型结构与训练
本模块采用YOLO11M实例分割模型作为缺陷检测的核心网络。YOLO11M在保持实时性的同时具备较强的特征提取能力,适合处理多尺度、多形态的缺陷目标。模型输入尺寸为640×640。
(2)后处理流程
模型输出每个缺陷实例的分割掩膜后,后处理模块对每个掩膜进行最小外接旋转矩形拟合,输出格式为(cx, cy, w, h, angle),其中(cx, cy)为中心坐标,(w, h)为宽高,angle为旋转角度;最后统计最终输出的旋转框数量作为缺陷总数。算法支持同时输出合并后的二值掩膜图(用于可视化)与旋转框坐标(用于评估与部署)。
本算法在NVIDIA RTX 2060 Laptop上单张图像完整处理时间约156.1ms,其中方向校正55ms、模板对齐60.6ms、实例分割40.5ms,满足比赛要求的1秒约束。
典型案例效果
