V社区-机器智能技术交流-【第四届启智杯大赛决赛】+视觉算法创新赛道赛道+FewInspect+参赛作品分享

【第四届启智杯大赛决赛】+视觉算法创新赛道赛道+FewInspect+参赛作品分享

0
0
分享

二维码

分享链接
2026-06-05 09:45

方案选型

本文介绍了我们团队在视觉算法创新赛道的参赛作品：基于XFeat模板对齐与YOLO11M实例分割的小样本标签缺陷检测

算法整体流程：

本算法采用多阶段级联架构，将缺陷检测任务分解为方向校正、模板对齐、差异构造与实例分割四个核心模块。算法输入为单张待检测标签图像，输出为缺陷的旋转矩形框坐标及缺陷总数，同时支持输出合并的缺陷Mask。

主要亮点：

1. 方向校正与模板对齐：

（1）方向校正
印刷标签在采集过程中可能出现任意方向放置，方向不一致会导致模板对齐失败。本模块采用YOLO26n分类模型对输入图像进行4分类（0°/90°/180°/270°）分类结果用于自动旋转图像至统一方向，为后续模板对齐提供一致的输入。
（2）模板对齐
模板对齐是本算法的核心模块之一，其目的是将待测图像与正常样本模板进行像素级对齐，为后续的缺陷检测提供参考基准。同时针对全局对齐效果差问题，我们使用XFeat进行对齐。
XFeat是一种轻量级局部特征提取与匹配算法，相比传统SIFT/ORB具有更高的匹配精度与速度。使用它能够有效应对拍摄角度偏差、位置偏移以及轻微的非刚性形变，为后续差异计算提供可靠的像素对应关系。

2. 数据增强策略设计

针对小样本场景下训练数据不足的问题，本算法根据印刷缺陷的视觉特性与形成机理设计了四类定制化数据增强策略。

3. 缺陷分割

（1）模型结构与训练
本模块采用YOLO11M实例分割模型作为缺陷检测的核心网络。YOLO11M在保持实时性的同时具备较强的特征提取能力，适合处理多尺度、多形态的缺陷目标。模型输入尺寸为640×640。
（2）后处理流程
模型输出每个缺陷实例的分割掩膜后，后处理模块对每个掩膜进行最小外接旋转矩形拟合，输出格式为(cx, cy, w, h, angle)，其中(cx, cy)为中心坐标，(w, h)为宽高，angle为旋转角度；最后统计最终输出的旋转框数量作为缺陷总数。算法支持同时输出合并后的二值掩膜图（用于可视化）与旋转框坐标（用于评估与部署）。

测试结果与性能分析

本算法在NVIDIA RTX 2060 Laptop上单张图像完整处理时间约156.1ms，其中方向校正55ms、模板对齐60.6ms、实例分割40.5ms，满足比赛要求的1秒约束。

典型案例效果

【第四届启智杯大赛决赛】+算法赛道+你说的对不+参赛作品分享

博图机器视觉计数机，告别人工计数内耗！

评论请先登录登录

全部评论 0

Lv.0

关注

粉丝

创作

获赞

所属专题

第四届启智杯算法赛道

10篇

【第四届启智杯大赛决赛】算法赛道海底小分队参赛作品分享

【第四届启智杯大赛决赛】+算法赛道+HUSTEEE+参赛作品分享

【第四届启智杯大赛决赛】-算法赛道-圣傻萌队作品分享

【第四届启智杯大赛决赛】+算法赛道+DL_cyh+参赛作品分享

「第四节启智杯大赛决赛」-算法赛道-鸡蛋蛋蛋糕-参赛作品分享

【第四届启智杯大赛决赛】+视觉算法创新赛道赛道+FewInspect+参赛作品分享

【第四届启智杯大赛决赛】+算法赛道+你说的对不+参赛作品分享

【第四届启智杯大赛决赛】+算法赛道+try+参赛作品

【第四届启智杯大赛决赛】+算法赛道+摸鱼小分队+参赛作品分享

【第四届启智杯大赛决赛】+视觉算法创新赛道+EVA+参赛作品分享

算法整体流程：

主要亮点：

1. 方向校正与模板对齐：

2. 数据增强策略设计

3. 缺陷分割

测试结果与性能分析

请升级浏览器版本

Chrome

Edge

Firefox