V社区-机器智能技术交流-【第四届启智杯大赛决赛】--应用2D赛道--aGoodVersion队参赛作品分享

【第四届启智杯大赛决赛】--应用2D赛道--aGoodVersion队参赛作品分享

0
0
分享

二维码

分享链接
2026-06-08 18:48

功能使用

我们针对矿泉水瓶的包装缺陷做了一套视觉检测方案。包括瓶身高度和瓶盖宽度的测量，以及对标签上褶皱、脏污、破损、笔画缺失、图画缺失等缺陷的定位与识别。方案结合了传统VM算法和深度学习图像分割，同时设计了一个信息比较完整的交互界面。

数据上的困难

比赛给的数据只有十几张，既不够训练深度学习模型，也不够调试测量流程。我们决定自己扩展数据集。按照真实缺陷的类型，人工制作了多种缺陷样本，同时控制了光照、瓶子在画面中的位置、瓶内水位这几个变量。最终形成了几千张可用于训练和测试的图像。

方案的整体结构

我们把流程分成两路并行。一路做尺寸测量，通过快速匹配定位瓶子，再经过位置修正使瓶子居中，然后用直线查找和线线测量得到瓶盖宽度和瓶身高度。另一路做标签缺陷检测，先匹配标签区域，修正位置后裁剪出标签，再用深度学习图像分割模型做像素级识别，最后通过Blob分析输出缺陷位置和类别。两路互不干扰，可以独立调整。

模型的选择

对比过无监督分割、分类和图像分割。矿泉水瓶上的划痕、缺笔画这类缺陷比较细小，分类模型只能告诉有无问题，无法定位。无监督分割在某些简单场景可用，但我们的缺陷类型多且组合复杂，不够稳定。最后选择有监督的图像分割，虽然训练成本更高，但检出效果最符合需求。

界面和人机交互

界面用VM自带的运行界面模块搭建。主要包含三部分：渲染图展示区（用Tab页分别显示瓶身高度、瓶盖宽度和标签缺陷）、检测结果统计（当前图像信息、缺陷列表、已检测数量）、历史数据和饼图（OK/NG占比、缺陷类型占比）。另外加了清空统计、历史最长最短耗时这些功能，调试时比较有用。

一点体会

这个题目看起来是做一个检测方案，但实际做下来发现，数据、流程设计、模型选择、界面落地的每一块都要花不少精力。双路并行的结构让我们后期调整比较方便。深度分割模型对微小缺陷的效果明显好于分类。界面方面，功能不是越多越好，但常用的统计和记录确实提升了方案的可演示性。

比赛结束后回头看，这次项目让我们完整走了一遍从数据构造到系统集成的过程。也验证了传统视觉算子和深度学习可以在一个方案里配合使用。如果有机会在真实产线上继续测试，应该能发现更多可以优化的细节。

【第四届启智杯大赛决赛】2D应用赛道CIMS参赛作品分享

已经是最后一篇啦～

评论请先登录登录

全部评论 0

Lv.0

关注

粉丝

创作

获赞

请升级浏览器版本

Chrome

Edge

Firefox