【第四届启智杯大赛决赛】+视觉算法创新赛道赛道+FewInspect+参赛作品分享
本文介绍了我们团队在视觉算法创新赛道的参赛作品:基于XFeat模板对齐与YOLO11M实例分割的小样本标签缺陷检测

算法整体流程:

本算法采用多阶段级联架构,将缺陷检测任务分解为方向校正、模板对齐、差异构造与实例分割四个核心模块。算法输入为单张待检测标签图像,输出为缺陷的旋转矩形框坐标及缺陷总数,同时支持输出合并的缺陷Mask。

主要亮点:

1. 方向校正与模板对齐:

(1)方向校正
印刷标签在采集过程中可能出现任意方向放置,方向不一致会导致模板对齐失败。本模块采用YOLO26n分类模型对输入图像进行4分类(0°/90°/180°/270°)分类结果用于自动旋转图像至统一方向,为后续模板对齐提供一致的输入。
(2)模板对齐
模板对齐是本算法的核心模块之一,其目的是将待测图像与正常样本模板进行像素级对齐,为后续的缺陷检测提供参考基准。同时针对全局对齐效果差问题,我们使用XFeat进行对齐。
XFeat是一种轻量级局部特征提取与匹配算法,相比传统SIFT/ORB具有更高的匹配精度与速度。使用它能够有效应对拍摄角度偏差、位置偏移以及轻微的非刚性形变,为后续差异计算提供可靠的像素对应关系。

2. 数据增强策略设计

针对小样本场景下训练数据不足的问题,本算法根据印刷缺陷的视觉特性与形成机理设计了四类定制化数据增强策略。

3. 缺陷分割

(1)模型结构与训练
本模块采用YOLO11M实例分割模型作为缺陷检测的核心网络。YOLO11M在保持实时性的同时具备较强的特征提取能力,适合处理多尺度、多形态的缺陷目标。模型输入尺寸为640×640。
(2)后处理流程
模型输出每个缺陷实例的分割掩膜后,后处理模块对每个掩膜进行最小外接旋转矩形拟合,输出格式为(cx, cy, w, h, angle),其中(cx, cy)为中心坐标,(w, h)为宽高,angle为旋转角度;最后统计最终输出的旋转框数量作为缺陷总数。算法支持同时输出合并后的二值掩膜图(用于可视化)与旋转框坐标(用于评估与部署)。

测试结果与性能分析

本算法在NVIDIA RTX 2060 Laptop上单张图像完整处理时间约156.1ms,其中方向校正55ms、模板对齐60.6ms、实例分割40.5ms,满足比赛要求的1秒约束。

典型案例效果
QQ20260604155637.png

版权声明:本文为V社区用户原创内容,转载时必须标注文章的来源(V社区),文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:v-club@hikrobotics.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
上一篇

【第四届启智杯大赛决赛】+算法赛道+你说的对不+参赛作品分享

下一篇

博图机器视觉计数机,告别人工计数内耗!

评论请先登录 登录
全部评论 0
Lv.0
0
关注
0
粉丝
0
创作
0
获赞
相关阅读
  • 【形状匹配算法系列】从NCC到轮廓匹配:工业视觉的"定位之争",到底争的是什么?
    2026-05-19 浏览 0
  • 通过socket将图片传输到vm外部
    2026-05-09 浏览 0
  • 项目实施过程中关于对标的思路及经验分享
    2026-05-09 浏览 0
  • 移动机器人常识
    2026-05-15 浏览 0
  • 移动机器人技术分享-26年5月
    2026-05-15 浏览 0

请升级浏览器版本

您正在使用的浏览器版本过低,请升级最新版本以获得更好的体验。

推荐使用以下浏览器